Enregistré dans:
| Auteurs principaux: | Wu, Weijia, Liu, Mingyu, Zhu, Zeyu, Xia, Xi, Feng, Haoen, Wang, Wen, Lin, Kevin Qinghong, Shen, Chunhua, Shou, Mike Zheng |
|---|---|
| Format: | Preprint |
| Publié: |
2024
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2411.15262 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
Automated Movie Generation via Multi-Agent CoT Planning
par: Wu, Weijia, et autres
Publié: (2025)
par: Wu, Weijia, et autres
Publié: (2025)
MovieDreamer: Hierarchical Generation for Coherent Long Visual Sequence
par: Zhao, Canyu, et autres
Publié: (2024)
par: Zhao, Canyu, et autres
Publié: (2024)
Paper2Video: Automatic Video Generation from Scientific Papers
par: Zhu, Zeyu, et autres
Publié: (2025)
par: Zhu, Zeyu, et autres
Publié: (2025)
VLog: Video-Language Models by Generative Retrieval of Narration Vocabulary
par: Lin, Kevin Qinghong, et autres
Publié: (2025)
par: Lin, Kevin Qinghong, et autres
Publié: (2025)
Multi-human Interactive Talking Dataset
par: Zhu, Zeyu, et autres
Publié: (2025)
par: Zhu, Zeyu, et autres
Publié: (2025)
Code2Video: A Code-centric Paradigm for Educational Video Generation
par: Chen, Yanzhe, et autres
Publié: (2025)
par: Chen, Yanzhe, et autres
Publié: (2025)
VideoMind: A Chain-of-LoRA Agent for Temporal-Grounded Video Reasoning
par: Liu, Ye, et autres
Publié: (2025)
par: Liu, Ye, et autres
Publié: (2025)
MovieSum: An Abstractive Summarization Dataset for Movie Screenplays
par: Saxena, Rohit, et autres
Publié: (2024)
par: Saxena, Rohit, et autres
Publié: (2024)
FocusUI: Efficient UI Grounding via Position-Preserving Visual Token Selection
par: Ouyang, Mingyu, et autres
Publié: (2026)
par: Ouyang, Mingyu, et autres
Publié: (2026)
Soap2Soap: Long Cinematic Video Remaking via Multi-Agent Collaboration
par: Song, Yiren, et autres
Publié: (2026)
par: Song, Yiren, et autres
Publié: (2026)
Long-Context Autoregressive Video Modeling with Next-Frame Prediction
par: Gu, Yuchao, et autres
Publié: (2025)
par: Gu, Yuchao, et autres
Publié: (2025)
ShowUI-$π$: Flow-based Generative Models as GUI Dexterous Hands
par: Hu, Siyuan, et autres
Publié: (2025)
par: Hu, Siyuan, et autres
Publié: (2025)
Learning Long-form Video Prior via Generative Pre-Training
par: Xie, Jinheng, et autres
Publié: (2024)
par: Xie, Jinheng, et autres
Publié: (2024)
Emotional Movie Clip Dataset
par: Vijaykrishnan, Anirudhan
Publié: (2026)
par: Vijaykrishnan, Anirudhan
Publié: (2026)
MovieCORE: COgnitive REasoning in Movies
par: Faure, Gueter Josmy, et autres
Publié: (2025)
par: Faure, Gueter Josmy, et autres
Publié: (2025)
GameWorld: Towards Standardized and Verifiable Evaluation of Multimodal Game Agents
par: Ouyang, Mingyu, et autres
Publié: (2026)
par: Ouyang, Mingyu, et autres
Publié: (2026)
Movie Facts and Fibs (MF$^2$): A Benchmark for Long Movie Understanding
par: Zaranis, Emmanouil, et autres
Publié: (2025)
par: Zaranis, Emmanouil, et autres
Publié: (2025)
DiffuMask: Synthesizing Images with Pixel-level Annotations for Semantic Segmentation Using Diffusion Models
par: Wu, Weijia, et autres
Publié: (2023)
par: Wu, Weijia, et autres
Publié: (2023)
MovieChat+: Question-aware Sparse Memory for Long Video Question Answering
par: Song, Enxin, et autres
Publié: (2024)
par: Song, Enxin, et autres
Publié: (2024)
StoryMovie: A Dataset for Semantic Alignment of Visual Stories with Movie Scripts and Subtitles
par: Oliveira, Daniel, et autres
Publié: (2026)
par: Oliveira, Daniel, et autres
Publié: (2026)
Think or Not? Selective Reasoning via Reinforcement Learning for Vision-Language Models
par: Wang, Jiaqi, et autres
Publié: (2025)
par: Wang, Jiaqi, et autres
Publié: (2025)
Maverick Movies
par: Herbert, Daniel
Publié: (2023)
par: Herbert, Daniel
Publié: (2023)
Librarians in the Movies.
par: Raish, Martin
Publié: (1998)
par: Raish, Martin
Publié: (1998)
Monster Movies?
par: Vaughn, Susan
Publié: (1971)
par: Vaughn, Susan
Publié: (1971)
The Phonograph Movies
par: Parker, David L., et autres
Publié: (1975)
par: Parker, David L., et autres
Publié: (1975)
Movie Bubble: A Group-Centric Movie Recommendation System
par: Sk. Mujafar Ahmed, et autres
Publié: (2026)
par: Sk. Mujafar Ahmed, et autres
Publié: (2026)
Movie101v2: Improved Movie Narration Benchmark
par: Yue, Zihao, et autres
Publié: (2024)
par: Yue, Zihao, et autres
Publié: (2024)
MM-MovieDubber: Towards Multi-Modal Learning for Multi-Modal Movie Dubbing
par: Zheng, Junjie, et autres
Publié: (2025)
par: Zheng, Junjie, et autres
Publié: (2025)
V2U4Real: A Real-world Large-scale Dataset for Vehicle-to-UAV Cooperative Perception
par: Li, Weijia, et autres
Publié: (2026)
par: Li, Weijia, et autres
Publié: (2026)
MovieCharacter: A Tuning-Free Framework for Controllable Character Video Synthesis
par: Qiu, Di, et autres
Publié: (2024)
par: Qiu, Di, et autres
Publié: (2024)
Movie Recommendation with Poster Attention via Multi-modal Transformer Feature Fusion
par: Xia, Linhan, et autres
Publié: (2024)
par: Xia, Linhan, et autres
Publié: (2024)
Chapter 3: Movies
par: Alshahrani, Faraj
Publié: (2026)
par: Alshahrani, Faraj
Publié: (2026)
Which Movie To Watch!
par: Rajan, Kohulan
Publié: (2026)
par: Rajan, Kohulan
Publié: (2026)
Which Movie To Watch!
par: Rajan, Kohulan
Publié: (2025)
par: Rajan, Kohulan
Publié: (2025)
Beyond the Movie Theater
par: Waller, Gregory A.
Publié: (2023)
par: Waller, Gregory A.
Publié: (2023)
Positive Microbiology in the Movies
par: Manuel Sánchez‐Angulo
Publié: (2025)
par: Manuel Sánchez‐Angulo
Publié: (2025)
MovieChat: From Dense Token to Sparse Memory for Long Video Understanding
par: Song, Enxin, et autres
Publié: (2023)
par: Song, Enxin, et autres
Publié: (2023)
MovieTeller: Tool-augmented Movie Synopsis with ID Consistent Progressive Abstraction
par: Li, Yizhi, et autres
Publié: (2026)
par: Li, Yizhi, et autres
Publié: (2026)
Sharp Focus on Film; A Brief Guide to Research on Movies and Movie People.
par: Smith, Phil, et autres
Publié: (1973)
par: Smith, Phil, et autres
Publié: (1973)
Binge Watch: Reproducible Multimodal Benchmarks Datasets for Large-Scale Movie Recommendation on MovieLens-10M and 20M
par: Spillo, Giuseppe, et autres
Publié: (2026)
par: Spillo, Giuseppe, et autres
Publié: (2026)
Documents similaires
-
Automated Movie Generation via Multi-Agent CoT Planning
par: Wu, Weijia, et autres
Publié: (2025) -
MovieDreamer: Hierarchical Generation for Coherent Long Visual Sequence
par: Zhao, Canyu, et autres
Publié: (2024) -
Paper2Video: Automatic Video Generation from Scientific Papers
par: Zhu, Zeyu, et autres
Publié: (2025) -
VLog: Video-Language Models by Generative Retrieval of Narration Vocabulary
par: Lin, Kevin Qinghong, et autres
Publié: (2025) -
Multi-human Interactive Talking Dataset
par: Zhu, Zeyu, et autres
Publié: (2025)