Skip to content
VuFind
  • כניסה לחשבון
    • English
    • Deutsch
    • Español
    • Français
    • Italiano
    • 日本語
    • Nederlands
    • Português
    • Português (Brasil)
    • 中文(简体)
    • 中文(繁體)
    • Türkçe
    • עברית
    • Gaeilge
    • Cymraeg
    • Ελληνικά
    • Català
    • Euskara
    • Русский
    • Čeština
    • Suomi
    • Svenska
    • polski
    • Dansk
    • slovenščina
    • اللغة العربية
    • বাংলা
    • Galego
    • Tiếng Việt
    • Hrvatski
    • हिंदी
    • Հայերէն
    • Українська
    • Sámegiella
    • Монгол
    • Māori
מתקדם
  • יצירת מראה מקום
  • שליחה במסרון
  • שלח את זה
  • הדפסה
  • יצוא רשומה
    • יצוא אל RefWorks
    • יצוא אל EndNoteWeb
    • יצוא אל EndNote
  • הוספה למועדפים
  • Permanent link
תמונות העטיפה

שמור ב:
מידע ביבליוגרפי
Main Authors: Kumar, Sonal, Sedláček, Šimon, Lokegaonkar, Vaibhavi, López, Fernando, Yu, Wenyi, Anand, Nishit, Ryu, Hyeonggon, Chen, Lichang, Plička, Maxim, Hlaváček, Miroslav, Ellingwood, William Fineas, Udupa, Sathvik, Hou, Siyuan, Ferner, Allison, Barahona, Sara, Bolaños, Cecilia, Rahi, Satish, Herrera-Alarcón, Laura, Dixit, Satvik, Patil, Siddhi, Deshmukh, Soham, Koroshinadze, Lasha, Liu, Yao, Perera, Leibny Paola Garcia, Zanou, Eleni, Stafylakis, Themos, Chung, Joon Son, Harwath, David, Zhang, Chao, Manocha, Dinesh, Lozano-Diez, Alicia, Kesiraju, Santosh, Ghosh, Sreyan, Duraiswami, Ramani
פורמט: Preprint
יצא לאור: 2025
נושאים:
Audio and Speech Processing
Sound
גישה מקוונת:https://arxiv.org/abs/2508.13992
תגים: הוספת תג
אין תגיות, היה/י הראשונ/ה לתייג את הרשומה!
  • מלאי ספרים
  • תיאור
  • תוכן הענינים
  • הערות
  • פריטים דומים
  • תצוגת צוות

אינטרנט

https://arxiv.org/abs/2508.13992

פריטים דומים

  • SPUR: A Plug-and-Play Framework for Integrating Spatial Audio Understanding and Reasoning into Large Audio-Language Models
    מאת: Sakshi, S, et al.
    יצא לאור: (2025)
  • ORCA: Open-ended Response Correctness Assessment for Audio Question Answering
    מאת: Sedláček, Šimon, et al.
    יצא לאור: (2025)
  • Video-Robin: Autoregressive Diffusion Planning for Intent-Grounded Video-to-Music Generation
    מאת: Lokegaonkar, Vaibhavi, et al.
    יצא לאור: (2026)
  • MMAU: A Massive Multi-Task Audio Understanding and Reasoning Benchmark
    מאת: Sakshi, S, et al.
    יצא לאור: (2024)
  • Automatic Speech Recognition for Greek Medical Dictation
    מאת: Georgilas, Vardis, et al.
    יצא לאור: (2025)

אפשרויות חיפוש

  • חיפושים קודמים
  • חיפוש מתקדם

מצא עוד

  • דפדוף בקטלוג
  • דפדוף בסדר אלפבתי
  • Explore Channels
  • שמורות לקורס
  • פריטים חדשים

צריכים עזרה?

  • טיפים לחיפוש
  • לשאול ספרן/ית
  • שאלות נפוצות