:: Library Catalog

Cover Image

Saved in:

Bibliographic Details
Main Author:	Koh, Junyoung
Format:	Preprint
Published:	2026
Subjects:	Sound
Online Access:	https://arxiv.org/abs/2605.21433
Tags:	Add Tag No Tags, Be the first to tag this record!

Similar Items

AIBA: Attention-based Instrument Band Alignment for Text-to-Audio Diffusion
by: Koh, Junyoung, et al.
Published: (2025)

Jamendo-QA: A Large-Scale Music Question Answering Dataset
by: Koh, Junyoung, et al.
Published: (2025)

Jamendo-MT-QA: A Benchmark for Multi-Track Comparative Music Question Answering
by: Koh, Junyoung, et al.
Published: (2026)

Intelligent Text-Conditioned Music Generation
by: Xie, Zhouyao, et al.
Published: (2024)

Diffusion based Text-to-Music Generation with Global and Local Text based Conditioning
by: Zhang, Jisi, et al.
Published: (2025)

Joint Audio and Symbolic Conditioning for Temporally Controlled Text-to-Music Generation
by: Tal, Or, et al.
Published: (2024)

Generalized Multi-Source Inference for Text Conditioned Music Diffusion Models
by: Postolache, Emilian, et al.
Published: (2024)

MDD: A Dataset for Text-and-Music Conditioned Duet Dance Generation
by: Gupta, Prerit, et al.
Published: (2025)

Lead Instrument Detection from Multitrack Music
by: Ou, Longshen, et al.
Published: (2025)

MusicEval: A Generative Music Dataset with Expert Ratings for Automatic Text-to-Music Evaluation
by: Liu, Cheng, et al.
Published: (2025)

Text2Score: Generating Sheet Music From Textual Prompts
by: Bhandari, Keshav, et al.
Published: (2026)

ACMID: Automatic Curation of Musical Instrument Dataset for 7-Stem Music Source Separation
by: Yu, Ji, et al.
Published: (2025)

Persian Musical Instruments Classification Using Polyphonic Data Augmentation
by: Esfangereh, Diba Hadi, et al.
Published: (2025)

Learning Separated Representations for Instrument-based Music Similarity
by: Hashizume, Yuka, et al.
Published: (2025)

FakeMusicCaps: a Dataset for Detection and Attribution of Synthetic Music Generated via Text-to-Music Models
by: Comanducci, Luca, et al.
Published: (2024)

Music Arena: Live Evaluation for Text-to-Music
by: Kim, Yonghyun, et al.
Published: (2025)

Training-Efficient Text-to-Music Generation with State-Space Modeling
by: Lee, Wei-Jaw, et al.
Published: (2026)

MusicFlow: Cascaded Flow Matching for Text Guided Music Generation
by: Prajwal, K R, et al.
Published: (2024)

Advancing Multi-Instrument Music Transcription: Results from the 2025 AMT Challenge
by: Chaturvedi, Ojas, et al.
Published: (2026)

Audio Conditioning for Music Generation via Discrete Bottleneck Features
by: Rouard, Simon, et al.
Published: (2024)

TokenSynth: A Token-based Neural Synthesizer for Instrument Cloning and Text-to-Instrument
by: Kim, Kyungsu, et al.
Published: (2025)

Opening the Design Space: Two Years of Performance with Intelligent Musical Instruments
by: Martin, Charles Patrick
Published: (2026)

Learning Multidimensional Disentangled Representations of Instrumental Sounds for Musical Similarity Assessment
by: Hashizume, Yuka, et al.
Published: (2024)

A Neural Score Follower for Computer Accompaniment of Polyphonic Musical Instruments
by: Pillay, Ashwin
Published: (2025)

Generating Sample-Based Musical Instruments Using Neural Audio Codec Language Models
by: Nercessian, Shahan, et al.
Published: (2024)

The Interpretation Gap in Text-to-Music Generation Models
by: Zang, Yongyi, et al.
Published: (2024)

Improving Controllability and Editability for Pretrained Text-to-Music Generation Models
by: Zhang, Yixiao
Published: (2024)

MusicDET: Zero-Shot AI-Generated Music Detection
by: Han, Chaolei, et al.
Published: (2026)

Data-Driven Analysis of Text-Conditioned AI-Generated Music: A Case Study with Suno and Udio
by: Casini, Luca, et al.
Published: (2025)

MR-FlowDPO: Multi-Reward Direct Preference Optimization for Flow-Matching Text-to-Music Generation
by: Ziv, Alon, et al.
Published: (2025)

ScripTONES: Sentiment-Conditioned Music Generation for Movie Scripts
by: Veerendranath, Vishruth, et al.
Published: (2024)

How Does Instrumental Music Help SingFake Detection?
by: Chen, Xuanjun, et al.
Published: (2025)

GD-Retriever: Controllable Generative Text-Music Retrieval with Diffusion Models
by: Guinot, Julien, et al.
Published: (2025)

Streaming Generation for Music Accompaniment
by: Wu, Yusong, et al.
Published: (2025)

Generating Separated Singing Vocals Using a Diffusion Model Conditioned on Music Mixtures
by: Plaja-Roglans, Genís, et al.
Published: (2025)

A Lightweight Two-Branch Architecture for Multi-Instrument Transcription via Note-Level Contrastive Clustering
by: Li, Ruigang, et al.
Published: (2025)

Academic Text-to-Music Grand Challenge: Datasets, Baselines, and Evaluation Methods
by: Hsieh, Fang-Chih, et al.
Published: (2026)

Music Similarity Representation Learning Focusing on Individual Instruments with Source Separation and Human Preference
by: Imamura, Takehiro, et al.
Published: (2025)

Fast Text-to-Audio Generation with One-Step Sampling via Energy-Scoring and Auxiliary Contextual Representation Distillation
by: Huang, Kuan-Po, et al.
Published: (2026)

MusFlow: Multimodal Music Generation via Conditional Flow Matching
by: Song, Jiahao, et al.
Published: (2025)