:: Library Catalog

Buchumschlag

Gespeichert in:

Bibliographische Detailangaben
Hauptverfasser:	Gonzalez-Jimenez, Alvaro, Gröger, Fabian, Wermelinger, Linda, Bürli, Andrin, Kastanis, Iason, Lionetti, Simone, Pouly, Marc
Format:	Preprint
Veröffentlicht:	2025
Schlagworte:	Sound Artificial Intelligence Machine Learning
Online-Zugang:	https://arxiv.org/abs/2509.26291
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Ähnliche Einträge

Evaluation of Deep Audio Representations for Hearables
von: Gröger, Fabian, et al.
Veröffentlicht: (2025)

Clinical Uncertainty Impacts Machine Learning Evaluations
von: Lionetti, Simone, et al.
Veröffentlicht: (2025)

Is Hyperbolic Space All You Need for Medical Anomaly Detection?
von: Gonzalez-Jimenez, Alvaro, et al.
Veröffentlicht: (2025)

Intrinsic Self-Supervision for Data Quality Audits
von: Gröger, Fabian, et al.
Veröffentlicht: (2023)

AudioMosaic: Contrastive Masked Audio Representation Learning
von: Huang, Hanxun, et al.
Veröffentlicht: (2026)

Towards Scalable Foundation Models for Digital Dermatology
von: Gröger, Fabian, et al.
Veröffentlicht: (2024)

A Human-Inspired Decoupled Architecture for Efficient Audio Representation Learning
von: Kawano, Harunori, et al.
Veröffentlicht: (2026)

Towards Transparent and Accurate Plasma State Monitoring at JET
von: Bürli, Andrin, et al.
Veröffentlicht: (2025)

CleanPatrick: A Benchmark for Image Data Cleaning
von: Gröger, Fabian, et al.
Veröffentlicht: (2025)

QAMRO: Quality-aware Adaptive Margin Ranking Optimization for Human-aligned Assessment of Audio Generation Systems
von: Wang, Chien-Chun, et al.
Veröffentlicht: (2025)

A Global Atlas of Digital Dermatology to Map Innovation and Disparities
von: Gröger, Fabian, et al.
Veröffentlicht: (2025)

HEAR: Holistic Evaluation of Audio Representations
von: Turian, Joseph, et al.
Veröffentlicht: (2022)

Preference-Based Learning in Audio Applications: A Systematic Analysis
von: Broukhim, Aaron, et al.
Veröffentlicht: (2025)

AudioCodecBench: A Comprehensive Benchmark for Audio Codec Evaluation
von: Wang, Lu, et al.
Veröffentlicht: (2025)

Audit After Segmentation: Reference-Free Mask Quality Assessment for Language-Referred Audio-Visual Segmentation
von: Zhou, Jinxing, et al.
Veröffentlicht: (2026)

PoDAR: Power-Disentangled Audio Representation for Generative Modeling
von: Luebs, Alejandro, et al.
Veröffentlicht: (2026)

Myna: Masking-Based Contrastive Learning of Musical Representations
von: Yonay, Ori, et al.
Veröffentlicht: (2025)

CoDiCodec: Unifying Continuous and Discrete Compressed Representations of Audio
von: Pasini, Marco, et al.
Veröffentlicht: (2025)

Audio-JEPA: Joint-Embedding Predictive Architecture for Audio Representation Learning
von: Tuncay, Ludovic, et al.
Veröffentlicht: (2025)

Competitive Audio-Language Models with Data-Efficient Single-Stage Training on Public Data
von: Kumar, Gokul Karthik, et al.
Veröffentlicht: (2025)

Low-Resource Guidance for Controllable Latent Audio Diffusion
von: Novack, Zachary, et al.
Veröffentlicht: (2026)

Exploring Token-Space Manipulation in Latent Audio Tokenizers
von: Paissan, Francesco, et al.
Veröffentlicht: (2026)

Structured-Noise Masked Modeling for Video, Audio and Beyond
von: Bhowmik, Aritra, et al.
Veröffentlicht: (2025)

Linguistic and Audio Embedding-Based Machine Learning for Alzheimer's Dementia and Mild Cognitive Impairment Detection: Insights from the PROCESS Challenge
von: Devahi, Adharsha Sam Edwin Sam, et al.
Veröffentlicht: (2025)

MAEB: Massive Audio Embedding Benchmark
von: Assadi, Adnan El, et al.
Veröffentlicht: (2026)

Investigating Design Choices in Joint-Embedding Predictive Architectures for General Audio Representation Learning
von: Riou, Alain, et al.
Veröffentlicht: (2024)

AUDETER: A Large-scale Dataset for Deepfake Audio Detection in Open Worlds
von: Wang, Qizhou, et al.
Veröffentlicht: (2025)

Phase-Aware Deep Learning with Complex-Valued CNNs for Audio Signal Applications
von: Agrawal, Naman
Veröffentlicht: (2025)

When Denoising Hinders: Revisiting Zero-Shot ASR with SAM-Audio and Whisper
von: Islam, Akif, et al.
Veröffentlicht: (2026)

Sound Check: Auditing Audio Datasets
von: Agnew, William, et al.
Veröffentlicht: (2024)

Real-Time Voicemail Detection in Telephony Audio Using Temporal Speech Activity Features
von: Saurav, Kumar
Veröffentlicht: (2026)

A$^2$-LLM: An End-to-end Conversational Audio Avatar Large Language Model
von: Hu, Xiaolin, et al.
Veröffentlicht: (2026)

Exploring and Applying Audio-Based Sentiment Analysis in Music
von: Jhanji, Etash
Veröffentlicht: (2024)

Audio-Based Pedestrian Detection in the Presence of Vehicular Noise
von: Kim, Yonghyun, et al.
Veröffentlicht: (2025)

Boosting ASR Robustness via Test-Time Reinforcement Learning with Audio-Text Semantic Rewards
von: Fang, Linghan, et al.
Veröffentlicht: (2026)

Deepfake Audio Detection Using Self-supervised Fusion Representations
von: Zaman, Khalid, et al.
Veröffentlicht: (2026)

Guiding Audio Editing with Audio Language Model
von: Lan, Zitong, et al.
Veröffentlicht: (2025)

Synthetic Data Augmentation for Medical Audio Classification: A Preliminary Evaluation
von: McShannon, David, et al.
Veröffentlicht: (2026)

Open-Amp: Synthetic Data Framework for Audio Effect Foundation Models
von: Wright, Alec, et al.
Veröffentlicht: (2024)

Tuning In: Analysis of Audio Classifier Performance in Clinical Settings with Limited Data
von: Mahdi, Hamza, et al.
Veröffentlicht: (2024)