:: Library Catalog

Cover Image

Saved in:

Bibliographic Details
Main Authors:	Kong, Yuexuan, Tran, Viet-Anh, Hennequin, Romain
Format:	Preprint
Published:	2025
Subjects:	Sound
Online Access:	https://arxiv.org/abs/2511.02726
Tags:	Add Tag No Tags, Be the first to tag this record!

Similar Items

STraDa: A Singer Traits Dataset
by: Kong, Yuexuan, et al.
Published: (2024)

Multi-Class-Token Transformer for Multitask Self-supervised Music Information Retrieval
by: Kong, Yuexuan, et al.
Published: (2025)

S-KEY: Self-supervised Learning of Major and Minor Keys from Audio
by: Kong, Yuexuan, et al.
Published: (2025)

Emergent musical properties of a transformer under contrastive self-supervised learning
by: Kong, Yuexuan, et al.
Published: (2025)

STONE: Self-supervised Tonality Estimator
by: Kong, Yuexuan, et al.
Published: (2024)

SingMOS: An extensive Open-Source Singing Voice Dataset for MOS Prediction
by: Tang, Yuxun, et al.
Published: (2024)

SingFake: Singing Voice Deepfake Detection
by: Zang, Yongyi, et al.
Published: (2023)

SingIt! Singer Voice Transformation
by: Eliav, Amit, et al.
Published: (2024)

TokSing: Singing Voice Synthesis based on Discrete Tokens
by: Wu, Yuning, et al.
Published: (2024)

Singing Voice Graph Modeling for SingFake Detection
by: Chen, Xuanjun, et al.
Published: (2024)

Adapting Speech Language Model to Singing Voice Synthesis
by: Zhao, Yiwen, et al.
Published: (2025)

Neural Concatenative Singing Voice Conversion: Rethinking Concatenation-Based Approach for One-Shot Singing Voice Conversion
by: Sha, Binzhu, et al.
Published: (2023)

SingVERSE: A Diverse, Real-World Benchmark for Singing Voice Enhancement
by: Jiang, Shaohan, et al.
Published: (2025)

Self-Supervised Singing Voice Pre-Training towards Speech-to-Singing Conversion
by: Li, Ruiqi, et al.
Published: (2024)

InstructSing: High-Fidelity Singing Voice Generation via Instructing Yourself
by: Zeng, Chang, et al.
Published: (2024)

Continual Learning for Singing Voice Separation with Human in the Loop Adaptation
by: Gupta, Ankur, et al.
Published: (2025)

An Extensive Analysis of the Singing Voice Conversion Challenge 2025 Evaluation Results
by: Violeta, Lester Phillip, et al.
Published: (2025)

Robust Singing Voice Transcription Serves Synthesis
by: Li, Ruiqi, et al.
Published: (2024)

SingNet: Towards a Large-Scale, Diverse, and In-the-Wild Singing Voice Dataset
by: Gu, Yicheng, et al.
Published: (2025)

Everyone-Can-Sing: Zero-Shot Singing Voice Synthesis and Conversion with Speech Reference
by: Dai, Shuqi, et al.
Published: (2025)

Singing Voice Data Scaling-up: An Introduction to ACE-Opencpop and ACE-KiSing
by: Shi, Jiatong, et al.
Published: (2024)

Robust Training of Singing Voice Synthesis Using Prior and Posterior Uncertainty
by: Zhao, Yiwen, et al.
Published: (2025)

Poly-SVC: Polyphony-Aware Singing Voice Conversion with Harmonic Modeling
by: Geng, Chen, et al.
Published: (2026)

SingVisio: Visual Analytics of Diffusion Model for Singing Voice Conversion
by: Xue, Liumeng, et al.
Published: (2024)

CONTUNER: Singing Voice Beautifying with Pitch and Expressiveness Condition
by: Wang, Jianzong, et al.
Published: (2024)

UNMIXX: Untangling Highly Correlated Singing Voices Mixtures
by: Jung, Jihoo, et al.
Published: (2026)

Generative Multi-modal Feedback for Singing Voice Synthesis Evaluation
by: Li, Xueyan, et al.
Published: (2025)

Deepfake Detection of Singing Voices With Whisper Encodings
by: Sharma, Falguni, et al.
Published: (2025)

BiSinger: Bilingual Singing Voice Synthesis
by: Zhou, Huali, et al.
Published: (2023)

Automatic Estimation of Singing Voice Musical Dynamics
by: Narang, Jyoti, et al.
Published: (2024)

TechSinger: Technique Controllable Multilingual Singing Voice Synthesis via Flow Matching
by: Guo, Wenxiang, et al.
Published: (2025)

Zero-Shot Duet Singing Voices Separation with Diffusion Models
by: Yu, Chin-Yun, et al.
Published: (2023)

A Fourier Explanation of AI-music Artifacts
by: Afchar, Darius, et al.
Published: (2025)

PerformSinger: Multimodal Singing Voice Synthesis Leveraging Synchronized Lip Cues from Singing Performance Videos
by: Gu, Ke, et al.
Published: (2025)

SVDD 2024: The Inaugural Singing Voice Deepfake Detection Challenge
by: Zhang, You, et al.
Published: (2024)

YingMusic-SVC: Real-World Robust Zero-Shot Singing Voice Conversion with Flow-GRPO and Singing-Specific Inductive Biases
by: Chen, Gongyu, et al.
Published: (2025)

FreeSVC: Towards Zero-shot Multilingual Singing Voice Conversion
by: Ferreira, Alef Iury Siqueira, et al.
Published: (2025)

AI-Generated Music Detection and its Challenges
by: Afchar, Darius, et al.
Published: (2025)

CtrSVDD: A Benchmark Dataset and Baseline Analysis for Controlled Singing Voice Deepfake Detection
by: Zang, Yongyi, et al.
Published: (2024)

Accompanied Singing Voice Synthesis with Fully Text-controlled Melody
by: Li, Ruiqi, et al.
Published: (2024)