:: Library Catalog

Image de couverture de livre

Enregistré dans:

Détails bibliographiques
Auteurs principaux:	Chen, Tuochao, Shin, D, Erdogan, Hakan, Hersek, Sinan
Format:	Preprint
Publié:	2025
Sujets:	Audio and Speech Processing Machine Learning Sound
Accès en ligne:	https://arxiv.org/abs/2506.00273
Tags:	Ajouter un tag Pas de tags, Soyez le premier à ajouter un tag!

Documents similaires

TF-MLPNet: Tiny Real-Time Neural Speech Separation
par: Itani, Malek, et autres
Publié: (2025)

Maximum Likelihood Estimation of the Direction of Sound In A Reverberant Noisy Environment
par: Mansour, Mohamed F.
Publié: (2024)

SoundMorpher: Perceptually-Uniform Sound Morphing with Diffusion Model
par: Niu, Xinlei, et autres
Publié: (2024)

Gen-A: Generalizing Ambisonics Neural Encoding to Unseen Microphone Arrays
par: Heikkinen, Mikko, et autres
Publié: (2025)

Analysis-Driven Procedural Generation of an Engine Sound Dataset with Embedded Control Annotations
par: Doerfler, Robin, et autres
Publié: (2026)

Compression of Higher Order Ambisonics with Multichannel RVQGAN
par: Hirvonen, Toni, et autres
Publié: (2024)

Knowledge boosting during low-latency inference
par: Srinivas, Vidya, et autres
Publié: (2024)

Binaural Angular Separation Network
par: Yang, Yang, et autres
Publié: (2024)

The iNaturalist Sounds Dataset
par: Chasmai, Mustafa, et autres
Publié: (2025)

SoundCTM: Unifying Score-based and Consistency Models for Full-band Text-to-Sound Generation
par: Saito, Koichi, et autres
Publié: (2024)

TAU: A Benchmark for Cultural Sound Understanding Beyond Semantics
par: Lin, Yi-Cheng, et autres
Publié: (2025)

Advanced Framework for Animal Sound Classification With Features Optimization
par: Yang, Qiang, et autres
Publié: (2024)

XAI-Driven Spectral Analysis of Cough Sounds for Respiratory Disease Characterization
par: Amado-Caballero, Patricia, et autres
Publié: (2025)

SoundBeam meets M2D: Target Sound Extraction with Audio Foundation Model
par: Hernandez-Olivan, Carlos, et autres
Publié: (2024)

Sound event localization and classification using WASN in Outdoor Environment
par: Zhang, Dongzhe, et autres
Publié: (2024)

Audio Geolocation: A Natural Sounds Benchmark
par: Chasmai, Mustafa, et autres
Publié: (2025)

Sound Event Detection and Localization with Distance Estimation
par: Krause, Daniel Aleksander, et autres
Publié: (2024)

Sound Tagging in Infant-centric Home Soundscapes
par: Khan, Mohammad Nur Hossain, et autres
Publié: (2024)

Focal Modulation Networks for Interpretable Sound Classification
par: Della Libera, Luca, et autres
Publié: (2024)

Abnormal Respiratory Sound Identification Using Audio-Spectrogram Vision Transformer
par: Ariyanti, Whenty, et autres
Publié: (2024)

Contextual Speech Extraction: Leveraging Textual History as an Implicit Cue for Target Speech Extraction
par: Kim, Minsu, et autres
Publié: (2025)

Audio Simulation for Sound Source Localization in Virtual Evironment
par: Di Yuan, Yi, et autres
Publié: (2024)

Synthesizer Sound Matching Using Audio Spectrogram Transformers
par: Bruford, Fred, et autres
Publié: (2024)

Energy Consumption Trends in Sound Event Detection Systems
par: Douwes, Constance, et autres
Publié: (2024)

SoundCompass: Navigating Target Sound Extraction With Effective Directional Clue Integration In Complex Acoustic Scenes
par: Choi, Dayun, et autres
Publié: (2025)

Automatic Inspection Based on Switch Sounds of Electric Point Machines
par: Shibata, Ayano, et autres
Publié: (2025)

SoundReactor: Frame-level Online Video-to-Audio Generation
par: Saito, Koichi, et autres
Publié: (2025)

Mixture of Mixups for Multi-label Classification of Rare Anuran Sounds
par: Moummad, Ilyass, et autres
Publié: (2024)

Embedding-Space Diffusion for Zero-Shot Environmental Sound Classification
par: Sims, Ysobel, et autres
Publié: (2024)

Activity-Guided Industrial Anomalous Sound Detection against Interferences
par: Lee, Yunjoo, et autres
Publié: (2024)

Self-Supervised Learning for Few-Shot Bird Sound Classification
par: Moummad, Ilyass, et autres
Publié: (2023)

Cross-domain Sound Recognition for Efficient Underwater Data Analysis
par: Park, Jeongsoo, et autres
Publié: (2023)

Feature Aggregation in Joint Sound Classification and Localization Neural Networks
par: Healy, Brendan, et autres
Publié: (2023)

Meta Audiobox Aesthetics: Unified Automatic Quality Assessment for Speech, Music, and Sound
par: Tjandra, Andros, et autres
Publié: (2025)

Multichannel-to-Multichannel Target Sound Extraction Using Direction and Timestamp Clues
par: Choi, Dayun, et autres
Publié: (2024)

Leveraging Audio-Only Data for Text-Queried Target Sound Extraction
par: Saijo, Kohei, et autres
Publié: (2024)

Language-Queried Target Sound Extraction Without Parallel Training Data
par: Ma, Hao, et autres
Publié: (2024)

Exploring Performance-Complexity Trade-Offs in Sound Event Detection Models
par: Morocutti, Tobias, et autres
Publié: (2025)

HyperGANStrument: Instrument Sound Synthesis and Editing with Pitch-Invariant Hypernetworks
par: Zhang, Zhe, et autres
Publié: (2024)

Lungmix: A Mixup-Based Strategy for Generalization in Respiratory Sound Classification
par: Ge, Shijia, et autres
Publié: (2024)