Przejdź do treści
VuFind
  • Login
    • English
    • Deutsch
    • Español
    • Français
    • Italiano
    • 日本語
    • Nederlands
    • Português
    • Português (Brasil)
    • 中文(简体)
    • 中文(繁體)
    • Türkçe
    • עברית
    • Gaeilge
    • Cymraeg
    • Ελληνικά
    • Català
    • Euskara
    • Русский
    • Čeština
    • Suomi
    • Svenska
    • polski
    • Dansk
    • slovenščina
    • اللغة العربية
    • বাংলা
    • Galego
    • Tiếng Việt
    • Hrvatski
    • हिंदी
    • Հայերէն
    • Українська
    • Sámegiella
    • Монгол
    • Māori
Wyszukiwanie zaawansowane
  • Cytować
  • Wyślij wiadomość
  • Wyślij emailem
  • Drukuj
  • Eksportuj rekord
    • Eksportuj do RefWorks
    • Eksportuj do EndNoteWeb
    • Eksportuj do EndNote
  • Dodaj do listy ulubionych książek
  • Odnośnik bezpośredni
Okładka

Zapisane w:
Opis bibliograficzny
Główni autorzy: Surikuchi, Aditya K, Fernández, Raquel, Pezzelle, Sandro
Format: Preprint
Wydane: 2025
Hasła przedmiotowe:
Computation and Language
Artificial Intelligence
Computer Vision and Pattern Recognition
Machine Learning
Dostęp online:https://arxiv.org/abs/2502.13034
Etykiety: Dodaj etykietę
Nie ma etykietki, Dołącz pierwszą etykiete!
  • Egzemplarz
  • Opis
  • Spis treści
  • Komentarze
  • Podobne zapisy
  • Wersja MARC

Internet

https://arxiv.org/abs/2502.13034

Podobne zapisy

  • Not (yet) the whole story: Evaluating Visual Storytelling Requires More than Measuring Coherence, Grounding, and Repetition
    od: Surikuchi, Aditya K, i wsp.
    Wydane: (2024)
  • Where is the multimodal goal post? On the Ability of Foundation Models to Recognize Contextually Important Moments
    od: Surikuchi, Aditya K, i wsp.
    Wydane: (2026)
  • The BLA Benchmark: Investigating Basic Language Abilities of Pre-Trained Multimodal Models
    od: Chen, Xinyi, i wsp.
    Wydane: (2023)
  • Describing Images $\textit{Fast and Slow}$: Quantifying and Predicting the Variation in Human Signals during Visuo-Linguistic Processes
    od: Takmaz, Ece, i wsp.
    Wydane: (2024)
  • Visual Question Decomposition on Multimodal Large Language Models
    od: Zhang, Haowei, i wsp.
    Wydane: (2024)

Opcje wyszukiwania

  • Historia wyszukiwania
  • Wyszukiwanie zaawansowane

Dalsze opcje

  • Przeglądaj katalog
  • Przeglądaj alfabetycznie
  • Przeglądaj kanały
  • Aparaty semestralne
  • Nowe nabytki

Pomoc

  • Wskazówka do wyszukiwania
  • Zapytaj bibliotekarza
  • Często zadawane pytania