Anar al contingut
VuFind
  • Iniciar sessió
    • English
    • Deutsch
    • Español
    • Français
    • Italiano
    • 日本語
    • Nederlands
    • Português
    • Português (Brasil)
    • 中文(简体)
    • 中文(繁體)
    • Türkçe
    • עברית
    • Gaeilge
    • Cymraeg
    • Ελληνικά
    • Català
    • Euskara
    • Русский
    • Čeština
    • Suomi
    • Svenska
    • polski
    • Dansk
    • slovenščina
    • اللغة العربية
    • বাংলা
    • Galego
    • Tiếng Việt
    • Hrvatski
    • हिंदी
    • Հայերէն
    • Українська
    • Sámegiella
    • Монгол
    • Māori
Avançada
  • Citar
  • Enviar aquest missatge de text
  • Enviar per correu electrònic aquest
  • Imprimir
  • Exportar registre
    • Exportar a RefWorks
    • Exportar a EndNoteWeb
    • Exportar a EndNote
  • Afegir a favorits
  • Enllaç permanent
Imatge de la portada

Guardat en:
Dades bibliogràfiques
Autors principals: DataFlow Team, Zeng, Bohan, Hua, Daili, Zhu, Kaixin, Dai, Yifan, Li, Bozhou, Wang, Yuran, Tong, Chengzhuo, Yang, Yifan, Chang, Mingkun, Zhao, Jianbin, Liu, Zhou, Liang, Hao, Ma, Xiaochen, An, Ruichuan, Niu, Junbo, Meng, Zimo, Bai, Tianyi, Qiang, Meiyi, Zhang, Huanyao, Xiao, Zhiyou, Guo, Tianyu, Yu, Qinhan, Zhao, Runhao, Li, Zhengpin, Huang, Xinyi, Pan, Yisheng, Tang, Yiwen, Tian, Juanxi, Shi, Yang, Ding, Yue, Chen, Xinlong, Gao, Hongcheng, Shi, Minglei, Wu, Jialong, Wang, Zekun, Zhang, Yuanxing, Wang, Xintao, Wan, Pengfei, Song, Yiren, Shou, Mike Zheng, Zhang, Wentao
Format: Preprint
Publicat: 2026
Matèries:
Computer Vision and Pattern Recognition
Accés en línia:https://arxiv.org/abs/2604.04707
Etiquetes: Afegir etiqueta
Sense etiquetes, Sigues el primer a etiquetar aquest registre!
  • Fons
  • Descripció
  • Taula de continguts
  • Comentaris
  • Ítems similars
  • Visualització del personal

Internet

https://arxiv.org/abs/2604.04707

Ítems similars

  • Research on World Models Is Not Merely Injecting World Knowledge into Specific Tasks
    per: Zeng, Bohan, et al.
    Publicat: (2026)
  • CoF-T2I: Video Models as Pure Visual Reasoners for Text-to-Image Generation
    per: Tong, Chengzhuo, et al.
    Publicat: (2026)
  • Scone: Bridging Composition and Distinction in Subject-Driven Image Generation via Unified Understanding-Generation Modeling
    per: Wang, Yuran, et al.
    Publicat: (2025)
  • LatentOmni: Rethinking Omni-Modal Understanding via Unified Audio-Visual Latent Reasoning
    per: Dai, Yifan, et al.
    Publicat: (2026)
  • GRAN-TED: Generating Robust, Aligned, and Nuanced Text Embedding for Diffusion Models
    per: Li, Bozhou, et al.
    Publicat: (2025)

Opcions de cerca

  • Historial de cerca
  • Cerca avançada

Trobar-ne més

  • Explorar el catàleg
  • Explorar alfabèticament
  • Explora canals
  • Bibliografia recomanada
  • Nous ítems

Necessites ajuda?

  • Consells de cerca
  • Pregunteu al bibliotecari
  • FAQs