Enregistré dans:
| Auteurs principaux: | Liu, Shuyang, Jin, Yuan, Lin, Rui, Chen, Shizhe, Dai, Junyu, Jiang, Tao |
|---|---|
| Format: | Preprint |
| Publié: |
2025
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2511.18869 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
MAJL: A Model-Agnostic Joint Learning Framework for Music Source Separation and Pitch Estimation
par: Wei, Haojie, et autres
Publié: (2025)
par: Wei, Haojie, et autres
Publié: (2025)
Learning Multidimensional Disentangled Representations of Instrumental Sounds for Musical Similarity Assessment
par: Hashizume, Yuka, et autres
Publié: (2024)
par: Hashizume, Yuka, et autres
Publié: (2024)
Quality-aware Masked Diffusion Transformer for Enhanced Music Generation
par: Li, Chang, et autres
Publié: (2024)
par: Li, Chang, et autres
Publié: (2024)
NarraScore: Bridging Visual Narrative and Musical Dynamics via Hierarchical Affective Control
par: Wen, Yufan, et autres
Publié: (2026)
par: Wen, Yufan, et autres
Publié: (2026)
Song Aesthetics Evaluation with Multi-Stem Attention and Hierarchical Uncertainty Modeling
par: Lv, Yishan, et autres
Publié: (2026)
par: Lv, Yishan, et autres
Publié: (2026)
The Music Maestro or The Musically Challenged, A Massive Music Evaluation Benchmark for Large Language Models
par: Li, Jiajia, et autres
Publié: (2024)
par: Li, Jiajia, et autres
Publié: (2024)
Do Models Hear Like Us? Probing the Representational Alignment of Audio LLMs and Naturalistic EEG
par: Yang, Haoyun, et autres
Publié: (2026)
par: Yang, Haoyun, et autres
Publié: (2026)
Look Once to Hear: Target Speech Hearing with Noisy Examples
par: Veluri, Bandhav, et autres
Publié: (2024)
par: Veluri, Bandhav, et autres
Publié: (2024)
MusicAOG: an Energy-Based Model for Learning and Sampling a Hierarchical Representation of Symbolic Music
par: Qian, Yikai, et autres
Publié: (2024)
par: Qian, Yikai, et autres
Publié: (2024)
Content-based Controls For Music Large Language Modeling
par: Lin, Liwei, et autres
Publié: (2023)
par: Lin, Liwei, et autres
Publié: (2023)
Layer-wise Investigation of Large-Scale Self-Supervised Music Representation Models
par: Zhou, Yizhi, et autres
Publié: (2025)
par: Zhou, Yizhi, et autres
Publié: (2025)
YNote: A Novel Music Notation for Fine-Tuning LLMs in Music Generation
par: Lu, Shao-Chien, et autres
Publié: (2025)
par: Lu, Shao-Chien, et autres
Publié: (2025)
MART: Learning Hierarchical Music Audio Representations with Part-Whole Transformer
par: Yao, Dong, et autres
Publié: (2023)
par: Yao, Dong, et autres
Publié: (2023)
Music Source Separation Based on a Lightweight Deep Learning Framework (DTTNET: DUAL-PATH TFC-TDF UNET)
par: Chen, Junyu, et autres
Publié: (2023)
par: Chen, Junyu, et autres
Publié: (2023)
Emotion-driven Piano Music Generation via Two-stage Disentanglement and Functional Representation
par: Huang, Jingyue, et autres
Publié: (2024)
par: Huang, Jingyue, et autres
Publié: (2024)
The ICASSP 2026 Automatic Song Aesthetics Evaluation Challenge
par: Ma, Guobin, et autres
Publié: (2026)
par: Ma, Guobin, et autres
Publié: (2026)
DAIRHuM: A Platform for Directly Aligning AI Representations with Human Musical Judgments applied to Carnatic Music
par: Ravikumar, Prashanth Thattai
Publié: (2024)
par: Ravikumar, Prashanth Thattai
Publié: (2024)
Multi-view MidiVAE: Fusing Track- and Bar-view Representations for Long Multi-track Symbolic Music Generation
par: Lin, Zhiwei, et autres
Publié: (2024)
par: Lin, Zhiwei, et autres
Publié: (2024)
Aligning Text-to-Music Evaluation with Human Preferences
par: Huang, Yichen, et autres
Publié: (2025)
par: Huang, Yichen, et autres
Publié: (2025)
Contrastive Augmentation: An Unsupervised Learning Approach for Keyword Spotting in Speech Technology
par: Dai, Weinan, et autres
Publié: (2024)
par: Dai, Weinan, et autres
Publié: (2024)
GVMGen: A General Video-to-Music Generation Model with Hierarchical Attentions
par: Zuo, Heda, et autres
Publié: (2025)
par: Zuo, Heda, et autres
Publié: (2025)
Arrange, Inpaint, and Refine: Steerable Long-term Music Audio Generation and Editing via Content-based Controls
par: Lin, Liwei, et autres
Publié: (2024)
par: Lin, Liwei, et autres
Publié: (2024)
MOSA: Music Motion with Semantic Annotation Dataset for Cross-Modal Music Processing
par: Huang, Yu-Fen, et autres
Publié: (2024)
par: Huang, Yu-Fen, et autres
Publié: (2024)
WhisQ: Cross-Modal Representation Learning for Text-to-Music MOS Prediction
par: Emon, Jakaria Islam, et autres
Publié: (2025)
par: Emon, Jakaria Islam, et autres
Publié: (2025)
Neuro-MSBG: An End-to-End Neural Model for Hearing Loss Simulation
par: Yuan, Hui-Guan, et autres
Publié: (2025)
par: Yuan, Hui-Guan, et autres
Publié: (2025)
Summary of The Inaugural Music Source Restoration Challenge
par: Zang, Yongyi, et autres
Publié: (2026)
par: Zang, Yongyi, et autres
Publié: (2026)
Training a Perceptual Model for Evaluating Auditory Similarity in Music Adversarial Attack
par: Liu, Yuxuan, et autres
Publié: (2025)
par: Liu, Yuxuan, et autres
Publié: (2025)
Music Source Restoration with Ensemble Separation and Targeted Reconstruction
par: Deng, Xinlong, et autres
Publié: (2026)
par: Deng, Xinlong, et autres
Publié: (2026)
Semi-Supervised Self-Learning Enhanced Music Emotion Recognition
par: Sun, Yifu, et autres
Publié: (2024)
par: Sun, Yifu, et autres
Publié: (2024)
MuseControlLite: Multifunctional Music Generation with Lightweight Conditioners
par: Tsai, Fang-Duo, et autres
Publié: (2025)
par: Tsai, Fang-Duo, et autres
Publié: (2025)
Expressive Music Data Processing and Generation
par: Liu, Jingwei
Publié: (2025)
par: Liu, Jingwei
Publié: (2025)
I Can Hear You: Selective Robust Training for Deepfake Audio Detection
par: Zhang, Zirui, et autres
Publié: (2024)
par: Zhang, Zirui, et autres
Publié: (2024)
Frechet Music Distance: A Metric For Generative Symbolic Music Evaluation
par: Retkowski, Jan, et autres
Publié: (2024)
par: Retkowski, Jan, et autres
Publié: (2024)
AImoclips: A Benchmark for Evaluating Emotion Conveyance in Text-to-Music Generation
par: Go, Gyehun, et autres
Publié: (2025)
par: Go, Gyehun, et autres
Publié: (2025)
Evaluating Multimodal Large Language Models on Core Music Perception Tasks
par: Carone, Brandon James, et autres
Publié: (2025)
par: Carone, Brandon James, et autres
Publié: (2025)
MusicEval: A Generative Music Dataset with Expert Ratings for Automatic Text-to-Music Evaluation
par: Liu, Cheng, et autres
Publié: (2025)
par: Liu, Cheng, et autres
Publié: (2025)
Universal Speech Token Learning via Low-Bitrate Neural Codec and Pretrained Representations
par: Jiang, Xue, et autres
Publié: (2025)
par: Jiang, Xue, et autres
Publié: (2025)
Diff-V2M: A Hierarchical Conditional Diffusion Model with Explicit Rhythmic Modeling for Video-to-Music Generation
par: Ji, Shulei, et autres
Publié: (2025)
par: Ji, Shulei, et autres
Publié: (2025)
Audio Prompt Adapter: Unleashing Music Editing Abilities for Text-to-Music with Lightweight Finetuning
par: Tsai, Fang-Duo, et autres
Publié: (2024)
par: Tsai, Fang-Duo, et autres
Publié: (2024)
Embedding-Based Intrusive Evaluation Metrics for Musical Source Separation Using MERT Representations
par: Bereuter, Paul A., et autres
Publié: (2026)
par: Bereuter, Paul A., et autres
Publié: (2026)
Documents similaires
-
MAJL: A Model-Agnostic Joint Learning Framework for Music Source Separation and Pitch Estimation
par: Wei, Haojie, et autres
Publié: (2025) -
Learning Multidimensional Disentangled Representations of Instrumental Sounds for Musical Similarity Assessment
par: Hashizume, Yuka, et autres
Publié: (2024) -
Quality-aware Masked Diffusion Transformer for Enhanced Music Generation
par: Li, Chang, et autres
Publié: (2024) -
NarraScore: Bridging Visual Narrative and Musical Dynamics via Hierarchical Affective Control
par: Wen, Yufan, et autres
Publié: (2026) -
Song Aesthetics Evaluation with Multi-Stem Attention and Hierarchical Uncertainty Modeling
par: Lv, Yishan, et autres
Publié: (2026)