:: Library Catalog

Image de couverture de livre

Enregistré dans:

Détails bibliographiques
Auteurs principaux:	Liu, Shuyang, Jin, Yuan, Lin, Rui, Chen, Shizhe, Dai, Junyu, Jiang, Tao
Format:	Preprint
Publié:	2025
Sujets:	Sound Artificial Intelligence Audio and Speech Processing
Accès en ligne:	https://arxiv.org/abs/2511.18869
Tags:	Ajouter un tag Pas de tags, Soyez le premier à ajouter un tag!

Documents similaires

MAJL: A Model-Agnostic Joint Learning Framework for Music Source Separation and Pitch Estimation
par: Wei, Haojie, et autres
Publié: (2025)

Learning Multidimensional Disentangled Representations of Instrumental Sounds for Musical Similarity Assessment
par: Hashizume, Yuka, et autres
Publié: (2024)

Quality-aware Masked Diffusion Transformer for Enhanced Music Generation
par: Li, Chang, et autres
Publié: (2024)

NarraScore: Bridging Visual Narrative and Musical Dynamics via Hierarchical Affective Control
par: Wen, Yufan, et autres
Publié: (2026)

Song Aesthetics Evaluation with Multi-Stem Attention and Hierarchical Uncertainty Modeling
par: Lv, Yishan, et autres
Publié: (2026)

The Music Maestro or The Musically Challenged, A Massive Music Evaluation Benchmark for Large Language Models
par: Li, Jiajia, et autres
Publié: (2024)

Do Models Hear Like Us? Probing the Representational Alignment of Audio LLMs and Naturalistic EEG
par: Yang, Haoyun, et autres
Publié: (2026)

Look Once to Hear: Target Speech Hearing with Noisy Examples
par: Veluri, Bandhav, et autres
Publié: (2024)

MusicAOG: an Energy-Based Model for Learning and Sampling a Hierarchical Representation of Symbolic Music
par: Qian, Yikai, et autres
Publié: (2024)

Content-based Controls For Music Large Language Modeling
par: Lin, Liwei, et autres
Publié: (2023)

Layer-wise Investigation of Large-Scale Self-Supervised Music Representation Models
par: Zhou, Yizhi, et autres
Publié: (2025)

YNote: A Novel Music Notation for Fine-Tuning LLMs in Music Generation
par: Lu, Shao-Chien, et autres
Publié: (2025)

MART: Learning Hierarchical Music Audio Representations with Part-Whole Transformer
par: Yao, Dong, et autres
Publié: (2023)

Music Source Separation Based on a Lightweight Deep Learning Framework (DTTNET: DUAL-PATH TFC-TDF UNET)
par: Chen, Junyu, et autres
Publié: (2023)

Emotion-driven Piano Music Generation via Two-stage Disentanglement and Functional Representation
par: Huang, Jingyue, et autres
Publié: (2024)

The ICASSP 2026 Automatic Song Aesthetics Evaluation Challenge
par: Ma, Guobin, et autres
Publié: (2026)

DAIRHuM: A Platform for Directly Aligning AI Representations with Human Musical Judgments applied to Carnatic Music
par: Ravikumar, Prashanth Thattai
Publié: (2024)

Multi-view MidiVAE: Fusing Track- and Bar-view Representations for Long Multi-track Symbolic Music Generation
par: Lin, Zhiwei, et autres
Publié: (2024)

Aligning Text-to-Music Evaluation with Human Preferences
par: Huang, Yichen, et autres
Publié: (2025)

Contrastive Augmentation: An Unsupervised Learning Approach for Keyword Spotting in Speech Technology
par: Dai, Weinan, et autres
Publié: (2024)

GVMGen: A General Video-to-Music Generation Model with Hierarchical Attentions
par: Zuo, Heda, et autres
Publié: (2025)

Arrange, Inpaint, and Refine: Steerable Long-term Music Audio Generation and Editing via Content-based Controls
par: Lin, Liwei, et autres
Publié: (2024)

MOSA: Music Motion with Semantic Annotation Dataset for Cross-Modal Music Processing
par: Huang, Yu-Fen, et autres
Publié: (2024)

WhisQ: Cross-Modal Representation Learning for Text-to-Music MOS Prediction
par: Emon, Jakaria Islam, et autres
Publié: (2025)

Neuro-MSBG: An End-to-End Neural Model for Hearing Loss Simulation
par: Yuan, Hui-Guan, et autres
Publié: (2025)

Summary of The Inaugural Music Source Restoration Challenge
par: Zang, Yongyi, et autres
Publié: (2026)

Training a Perceptual Model for Evaluating Auditory Similarity in Music Adversarial Attack
par: Liu, Yuxuan, et autres
Publié: (2025)

Music Source Restoration with Ensemble Separation and Targeted Reconstruction
par: Deng, Xinlong, et autres
Publié: (2026)

Semi-Supervised Self-Learning Enhanced Music Emotion Recognition
par: Sun, Yifu, et autres
Publié: (2024)

MuseControlLite: Multifunctional Music Generation with Lightweight Conditioners
par: Tsai, Fang-Duo, et autres
Publié: (2025)

Expressive Music Data Processing and Generation
par: Liu, Jingwei
Publié: (2025)

I Can Hear You: Selective Robust Training for Deepfake Audio Detection
par: Zhang, Zirui, et autres
Publié: (2024)

Frechet Music Distance: A Metric For Generative Symbolic Music Evaluation
par: Retkowski, Jan, et autres
Publié: (2024)

AImoclips: A Benchmark for Evaluating Emotion Conveyance in Text-to-Music Generation
par: Go, Gyehun, et autres
Publié: (2025)

Evaluating Multimodal Large Language Models on Core Music Perception Tasks
par: Carone, Brandon James, et autres
Publié: (2025)

MusicEval: A Generative Music Dataset with Expert Ratings for Automatic Text-to-Music Evaluation
par: Liu, Cheng, et autres
Publié: (2025)

Universal Speech Token Learning via Low-Bitrate Neural Codec and Pretrained Representations
par: Jiang, Xue, et autres
Publié: (2025)

Diff-V2M: A Hierarchical Conditional Diffusion Model with Explicit Rhythmic Modeling for Video-to-Music Generation
par: Ji, Shulei, et autres
Publié: (2025)

Audio Prompt Adapter: Unleashing Music Editing Abilities for Text-to-Music with Lightweight Finetuning
par: Tsai, Fang-Duo, et autres
Publié: (2024)

Embedding-Based Intrusive Evaluation Metrics for Musical Source Separation Using MERT Representations
par: Bereuter, Paul A., et autres
Publié: (2026)