Gespeichert in:
| Hauptverfasser: | Gonzalez-Jimenez, Alvaro, Gröger, Fabian, Wermelinger, Linda, Bürli, Andrin, Kastanis, Iason, Lionetti, Simone, Pouly, Marc |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2025
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2509.26291 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
Evaluation of Deep Audio Representations for Hearables
von: Gröger, Fabian, et al.
Veröffentlicht: (2025)
von: Gröger, Fabian, et al.
Veröffentlicht: (2025)
Clinical Uncertainty Impacts Machine Learning Evaluations
von: Lionetti, Simone, et al.
Veröffentlicht: (2025)
von: Lionetti, Simone, et al.
Veröffentlicht: (2025)
Is Hyperbolic Space All You Need for Medical Anomaly Detection?
von: Gonzalez-Jimenez, Alvaro, et al.
Veröffentlicht: (2025)
von: Gonzalez-Jimenez, Alvaro, et al.
Veröffentlicht: (2025)
Intrinsic Self-Supervision for Data Quality Audits
von: Gröger, Fabian, et al.
Veröffentlicht: (2023)
von: Gröger, Fabian, et al.
Veröffentlicht: (2023)
AudioMosaic: Contrastive Masked Audio Representation Learning
von: Huang, Hanxun, et al.
Veröffentlicht: (2026)
von: Huang, Hanxun, et al.
Veröffentlicht: (2026)
Towards Scalable Foundation Models for Digital Dermatology
von: Gröger, Fabian, et al.
Veröffentlicht: (2024)
von: Gröger, Fabian, et al.
Veröffentlicht: (2024)
A Human-Inspired Decoupled Architecture for Efficient Audio Representation Learning
von: Kawano, Harunori, et al.
Veröffentlicht: (2026)
von: Kawano, Harunori, et al.
Veröffentlicht: (2026)
Towards Transparent and Accurate Plasma State Monitoring at JET
von: Bürli, Andrin, et al.
Veröffentlicht: (2025)
von: Bürli, Andrin, et al.
Veröffentlicht: (2025)
CleanPatrick: A Benchmark for Image Data Cleaning
von: Gröger, Fabian, et al.
Veröffentlicht: (2025)
von: Gröger, Fabian, et al.
Veröffentlicht: (2025)
QAMRO: Quality-aware Adaptive Margin Ranking Optimization for Human-aligned Assessment of Audio Generation Systems
von: Wang, Chien-Chun, et al.
Veröffentlicht: (2025)
von: Wang, Chien-Chun, et al.
Veröffentlicht: (2025)
A Global Atlas of Digital Dermatology to Map Innovation and Disparities
von: Gröger, Fabian, et al.
Veröffentlicht: (2025)
von: Gröger, Fabian, et al.
Veröffentlicht: (2025)
HEAR: Holistic Evaluation of Audio Representations
von: Turian, Joseph, et al.
Veröffentlicht: (2022)
von: Turian, Joseph, et al.
Veröffentlicht: (2022)
Preference-Based Learning in Audio Applications: A Systematic Analysis
von: Broukhim, Aaron, et al.
Veröffentlicht: (2025)
von: Broukhim, Aaron, et al.
Veröffentlicht: (2025)
AudioCodecBench: A Comprehensive Benchmark for Audio Codec Evaluation
von: Wang, Lu, et al.
Veröffentlicht: (2025)
von: Wang, Lu, et al.
Veröffentlicht: (2025)
Audit After Segmentation: Reference-Free Mask Quality Assessment for Language-Referred Audio-Visual Segmentation
von: Zhou, Jinxing, et al.
Veröffentlicht: (2026)
von: Zhou, Jinxing, et al.
Veröffentlicht: (2026)
PoDAR: Power-Disentangled Audio Representation for Generative Modeling
von: Luebs, Alejandro, et al.
Veröffentlicht: (2026)
von: Luebs, Alejandro, et al.
Veröffentlicht: (2026)
Myna: Masking-Based Contrastive Learning of Musical Representations
von: Yonay, Ori, et al.
Veröffentlicht: (2025)
von: Yonay, Ori, et al.
Veröffentlicht: (2025)
CoDiCodec: Unifying Continuous and Discrete Compressed Representations of Audio
von: Pasini, Marco, et al.
Veröffentlicht: (2025)
von: Pasini, Marco, et al.
Veröffentlicht: (2025)
Audio-JEPA: Joint-Embedding Predictive Architecture for Audio Representation Learning
von: Tuncay, Ludovic, et al.
Veröffentlicht: (2025)
von: Tuncay, Ludovic, et al.
Veröffentlicht: (2025)
Competitive Audio-Language Models with Data-Efficient Single-Stage Training on Public Data
von: Kumar, Gokul Karthik, et al.
Veröffentlicht: (2025)
von: Kumar, Gokul Karthik, et al.
Veröffentlicht: (2025)
Low-Resource Guidance for Controllable Latent Audio Diffusion
von: Novack, Zachary, et al.
Veröffentlicht: (2026)
von: Novack, Zachary, et al.
Veröffentlicht: (2026)
Exploring Token-Space Manipulation in Latent Audio Tokenizers
von: Paissan, Francesco, et al.
Veröffentlicht: (2026)
von: Paissan, Francesco, et al.
Veröffentlicht: (2026)
Structured-Noise Masked Modeling for Video, Audio and Beyond
von: Bhowmik, Aritra, et al.
Veröffentlicht: (2025)
von: Bhowmik, Aritra, et al.
Veröffentlicht: (2025)
Linguistic and Audio Embedding-Based Machine Learning for Alzheimer's Dementia and Mild Cognitive Impairment Detection: Insights from the PROCESS Challenge
von: Devahi, Adharsha Sam Edwin Sam, et al.
Veröffentlicht: (2025)
von: Devahi, Adharsha Sam Edwin Sam, et al.
Veröffentlicht: (2025)
MAEB: Massive Audio Embedding Benchmark
von: Assadi, Adnan El, et al.
Veröffentlicht: (2026)
von: Assadi, Adnan El, et al.
Veröffentlicht: (2026)
Investigating Design Choices in Joint-Embedding Predictive Architectures for General Audio Representation Learning
von: Riou, Alain, et al.
Veröffentlicht: (2024)
von: Riou, Alain, et al.
Veröffentlicht: (2024)
AUDETER: A Large-scale Dataset for Deepfake Audio Detection in Open Worlds
von: Wang, Qizhou, et al.
Veröffentlicht: (2025)
von: Wang, Qizhou, et al.
Veröffentlicht: (2025)
Phase-Aware Deep Learning with Complex-Valued CNNs for Audio Signal Applications
von: Agrawal, Naman
Veröffentlicht: (2025)
von: Agrawal, Naman
Veröffentlicht: (2025)
When Denoising Hinders: Revisiting Zero-Shot ASR with SAM-Audio and Whisper
von: Islam, Akif, et al.
Veröffentlicht: (2026)
von: Islam, Akif, et al.
Veröffentlicht: (2026)
Sound Check: Auditing Audio Datasets
von: Agnew, William, et al.
Veröffentlicht: (2024)
von: Agnew, William, et al.
Veröffentlicht: (2024)
Real-Time Voicemail Detection in Telephony Audio Using Temporal Speech Activity Features
von: Saurav, Kumar
Veröffentlicht: (2026)
von: Saurav, Kumar
Veröffentlicht: (2026)
A$^2$-LLM: An End-to-end Conversational Audio Avatar Large Language Model
von: Hu, Xiaolin, et al.
Veröffentlicht: (2026)
von: Hu, Xiaolin, et al.
Veröffentlicht: (2026)
Exploring and Applying Audio-Based Sentiment Analysis in Music
von: Jhanji, Etash
Veröffentlicht: (2024)
von: Jhanji, Etash
Veröffentlicht: (2024)
Audio-Based Pedestrian Detection in the Presence of Vehicular Noise
von: Kim, Yonghyun, et al.
Veröffentlicht: (2025)
von: Kim, Yonghyun, et al.
Veröffentlicht: (2025)
Boosting ASR Robustness via Test-Time Reinforcement Learning with Audio-Text Semantic Rewards
von: Fang, Linghan, et al.
Veröffentlicht: (2026)
von: Fang, Linghan, et al.
Veröffentlicht: (2026)
Deepfake Audio Detection Using Self-supervised Fusion Representations
von: Zaman, Khalid, et al.
Veröffentlicht: (2026)
von: Zaman, Khalid, et al.
Veröffentlicht: (2026)
Guiding Audio Editing with Audio Language Model
von: Lan, Zitong, et al.
Veröffentlicht: (2025)
von: Lan, Zitong, et al.
Veröffentlicht: (2025)
Synthetic Data Augmentation for Medical Audio Classification: A Preliminary Evaluation
von: McShannon, David, et al.
Veröffentlicht: (2026)
von: McShannon, David, et al.
Veröffentlicht: (2026)
Open-Amp: Synthetic Data Framework for Audio Effect Foundation Models
von: Wright, Alec, et al.
Veröffentlicht: (2024)
von: Wright, Alec, et al.
Veröffentlicht: (2024)
Tuning In: Analysis of Audio Classifier Performance in Clinical Settings with Limited Data
von: Mahdi, Hamza, et al.
Veröffentlicht: (2024)
von: Mahdi, Hamza, et al.
Veröffentlicht: (2024)
Ähnliche Einträge
-
Evaluation of Deep Audio Representations for Hearables
von: Gröger, Fabian, et al.
Veröffentlicht: (2025) -
Clinical Uncertainty Impacts Machine Learning Evaluations
von: Lionetti, Simone, et al.
Veröffentlicht: (2025) -
Is Hyperbolic Space All You Need for Medical Anomaly Detection?
von: Gonzalez-Jimenez, Alvaro, et al.
Veröffentlicht: (2025) -
Intrinsic Self-Supervision for Data Quality Audits
von: Gröger, Fabian, et al.
Veröffentlicht: (2023) -
AudioMosaic: Contrastive Masked Audio Representation Learning
von: Huang, Hanxun, et al.
Veröffentlicht: (2026)