Sommario: :: Library Catalog

Salvato in:

Dettagli Bibliografici
Autori principali:	Cervera, Matthieu, Paissan, Francesco, Ravanelli, Mirco, Subakan, Cem
Natura:	Preprint
Pubblicazione:	2025
Soggetti:	Sound Machine Learning
Accesso online:	https://arxiv.org/abs/2509.17219
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Sommario:

Free-form, text-based audio editing remains a persistent challenge, despite progress in inversion-based neural methods. Current approaches rely on slow inversion procedures, limiting their practicality. We present a virtual-consistency based audio editing system that bypasses inversion by adapting the sampling process of diffusion models. Our pipeline is model-agnostic, requiring no fine-tuning or architectural changes, and achieves substantial speed-ups over recent neural editing baselines. Crucially, it achieves this efficiency without compromising quality, as demonstrated by quantitative benchmarks and a user study involving 16 participants.

Documenti analoghi