Salta al contenuto
VuFind
  • Entra
    • English
    • Deutsch
    • Español
    • Français
    • Italiano
    • 日本語
    • Nederlands
    • Português
    • Português (Brasil)
    • 中文(简体)
    • 中文(繁體)
    • Türkçe
    • עברית
    • Gaeilge
    • Cymraeg
    • Ελληνικά
    • Català
    • Euskara
    • Русский
    • Čeština
    • Suomi
    • Svenska
    • polski
    • Dansk
    • slovenščina
    • اللغة العربية
    • বাংলা
    • Galego
    • Tiếng Việt
    • Hrvatski
    • हिंदी
    • Հայերէն
    • Українська
    • Sámegiella
    • Монгол
    • Māori
Avanzata
  • Citazione
  • Invia SMS
  • Invia email
  • Stampa
  • Esporta il record
    • Esporta a RefWorks
    • Esporta a EndNoteWeb
    • Esporta a EndNote
  • Aggiungi alla lista
  • PLink permanente
Copertina

Salvato in:
Dettagli Bibliografici
Autori principali: Zeng, Bohan, Zhu, Kaixin, Hua, Daili, Li, Bozhou, Tong, Chengzhuo, Wang, Yuran, Huang, Xinyi, Dai, Yifan, Zhang, Zixiang, Yang, Yifan, Liu, Zhou, Liang, Hao, Ma, Xiaochen, An, Ruichuan, Bai, Tianyi, Gao, Hongcheng, Niu, Junbo, Shi, Yang, Chen, Xinlong, Ding, Yue, Shi, Minglei, Zeng, Kai, Tang, Yiwen, Zhang, Yuanxing, Wan, Pengfei, Wang, Xintao, Zhang, Wentao
Natura: Preprint
Pubblicazione: 2026
Soggetti:
Computer Vision and Pattern Recognition
Accesso online:https://arxiv.org/abs/2602.01630
Tags: Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
  • Posseduto
  • Descrizione
  • Sommario
  • Commenti
  • Documenti analoghi
  • MARC21

Accesso online

https://arxiv.org/abs/2602.01630

Documenti analoghi

  • OpenWorldLib: A Unified Codebase and Definition of Advanced World Models
    di: DataFlow Team, et al.
    Pubblicazione: (2026)
  • Scone: Bridging Composition and Distinction in Subject-Driven Image Generation via Unified Understanding-Generation Modeling
    di: Wang, Yuran, et al.
    Pubblicazione: (2025)
  • CoF-T2I: Video Models as Pure Visual Reasoners for Text-to-Image Generation
    di: Tong, Chengzhuo, et al.
    Pubblicazione: (2026)
  • LatentOmni: Rethinking Omni-Modal Understanding via Unified Audio-Visual Latent Reasoning
    di: Dai, Yifan, et al.
    Pubblicazione: (2026)
  • GRAN-TED: Generating Robust, Aligned, and Nuanced Text Embedding for Diffusion Models
    di: Li, Bozhou, et al.
    Pubblicazione: (2025)

Opzioni di ricerca

  • Ultime ricerche
  • Ricerca avanzata

Cerca

  • Scorri il catalogo
  • Scorri in ordine alfabetico
  • Esplora selezioni
  • Materiali riservati (per i corsi)
  • Nuovi documenti

Serve aiuto?

  • Suggerimenti per la ricerca
  • Chiedi al bibliotecario
  • FAQ