Anar al contingut
VuFind
  • Iniciar sessió
    • English
    • Deutsch
    • Español
    • Français
    • Italiano
    • 日本語
    • Nederlands
    • Português
    • Português (Brasil)
    • 中文(简体)
    • 中文(繁體)
    • Türkçe
    • עברית
    • Gaeilge
    • Cymraeg
    • Ελληνικά
    • Català
    • Euskara
    • Русский
    • Čeština
    • Suomi
    • Svenska
    • polski
    • Dansk
    • slovenščina
    • اللغة العربية
    • বাংলা
    • Galego
    • Tiếng Việt
    • Hrvatski
    • हिंदी
    • Հայերէն
    • Українська
    • Sámegiella
    • Монгол
    • Māori
Avançada
  • Citar
  • Enviar aquest missatge de text
  • Enviar per correu electrònic aquest
  • Imprimir
  • Exportar registre
    • Exportar a RefWorks
    • Exportar a EndNoteWeb
    • Exportar a EndNote
  • Afegir a favorits
  • Enllaç permanent
Imatge de la portada

Guardat en:
Dades bibliogràfiques
Autors principals: Kim, Nam-Gyu, Cho, Deok-Hyeon, Kim, Seung-Bin, Lee, Seong-Whan
Format: Preprint
Publicat: 2025
Matèries:
Sound
Artificial Intelligence
Audio and Speech Processing
Accés en línia:https://arxiv.org/abs/2505.20868
Etiquetes: Afegir etiqueta
Sense etiquetes, Sigues el primer a etiquetar aquest registre!
  • Fons
  • Descripció
  • Taula de continguts
  • Comentaris
  • Ítems similars
  • Visualització del personal

Internet

https://arxiv.org/abs/2505.20868

Ítems similars

  • EmoSphere-TTS: Emotional Style and Intensity Modeling via Spherical Emotion Vector for Controllable Emotional Text-to-Speech
    per: Cho, Deok-Hyeon, et al.
    Publicat: (2024)
  • DiEmo-TTS: Disentangled Emotion Representations via Self-Supervised Distillation for Cross-Speaker Emotion Transfer in Text-to-Speech
    per: Cho, Deok-Hyeon, et al.
    Publicat: (2025)
  • Voiced-Aware Style Extraction and Style Direction Adjustment for Expressive Text-to-Speech
    per: Kim, Nam-Gyu
    Publicat: (2025)
  • EmoSphere++: Emotion-Controllable Zero-Shot Text-to-Speech via Emotion-Adaptive Spherical Vector
    per: Cho, Deok-Hyeon, et al.
    Publicat: (2024)
  • ParaStyleTTS: Toward Efficient and Robust Paralinguistic Style Control for Expressive Text-to-Speech Generation
    per: Lou, Haowei, et al.
    Publicat: (2025)

Opcions de cerca

  • Historial de cerca
  • Cerca avançada

Trobar-ne més

  • Explorar el catàleg
  • Explorar alfabèticament
  • Explora canals
  • Bibliografia recomanada
  • Nous ítems

Necessites ajuda?

  • Consells de cerca
  • Pregunteu al bibliotecari
  • FAQs