:: Library Catalog

Image de couverture de livre

Enregistré dans:

Détails bibliographiques
Auteurs principaux:	Wu, Weijia, Liu, Mingyu, Zhu, Zeyu, Xia, Xi, Feng, Haoen, Wang, Wen, Lin, Kevin Qinghong, Shen, Chunhua, Shou, Mike Zheng
Format:	Preprint
Publié:	2024
Sujets:	Computer Vision and Pattern Recognition
Accès en ligne:	https://arxiv.org/abs/2411.15262
Tags:	Ajouter un tag Pas de tags, Soyez le premier à ajouter un tag!

Documents similaires

Automated Movie Generation via Multi-Agent CoT Planning
par: Wu, Weijia, et autres
Publié: (2025)

MovieDreamer: Hierarchical Generation for Coherent Long Visual Sequence
par: Zhao, Canyu, et autres
Publié: (2024)

Paper2Video: Automatic Video Generation from Scientific Papers
par: Zhu, Zeyu, et autres
Publié: (2025)

VLog: Video-Language Models by Generative Retrieval of Narration Vocabulary
par: Lin, Kevin Qinghong, et autres
Publié: (2025)

Multi-human Interactive Talking Dataset
par: Zhu, Zeyu, et autres
Publié: (2025)

Code2Video: A Code-centric Paradigm for Educational Video Generation
par: Chen, Yanzhe, et autres
Publié: (2025)

VideoMind: A Chain-of-LoRA Agent for Temporal-Grounded Video Reasoning
par: Liu, Ye, et autres
Publié: (2025)

MovieSum: An Abstractive Summarization Dataset for Movie Screenplays
par: Saxena, Rohit, et autres
Publié: (2024)

FocusUI: Efficient UI Grounding via Position-Preserving Visual Token Selection
par: Ouyang, Mingyu, et autres
Publié: (2026)

Soap2Soap: Long Cinematic Video Remaking via Multi-Agent Collaboration
par: Song, Yiren, et autres
Publié: (2026)

Long-Context Autoregressive Video Modeling with Next-Frame Prediction
par: Gu, Yuchao, et autres
Publié: (2025)

ShowUI-$π$: Flow-based Generative Models as GUI Dexterous Hands
par: Hu, Siyuan, et autres
Publié: (2025)

Learning Long-form Video Prior via Generative Pre-Training
par: Xie, Jinheng, et autres
Publié: (2024)

Emotional Movie Clip Dataset
par: Vijaykrishnan, Anirudhan
Publié: (2026)

MovieCORE: COgnitive REasoning in Movies
par: Faure, Gueter Josmy, et autres
Publié: (2025)

GameWorld: Towards Standardized and Verifiable Evaluation of Multimodal Game Agents
par: Ouyang, Mingyu, et autres
Publié: (2026)

Movie Facts and Fibs (MF$^2$): A Benchmark for Long Movie Understanding
par: Zaranis, Emmanouil, et autres
Publié: (2025)

DiffuMask: Synthesizing Images with Pixel-level Annotations for Semantic Segmentation Using Diffusion Models
par: Wu, Weijia, et autres
Publié: (2023)

MovieChat+: Question-aware Sparse Memory for Long Video Question Answering
par: Song, Enxin, et autres
Publié: (2024)

StoryMovie: A Dataset for Semantic Alignment of Visual Stories with Movie Scripts and Subtitles
par: Oliveira, Daniel, et autres
Publié: (2026)

Think or Not? Selective Reasoning via Reinforcement Learning for Vision-Language Models
par: Wang, Jiaqi, et autres
Publié: (2025)

Maverick Movies
par: Herbert, Daniel
Publié: (2023)

Librarians in the Movies.
par: Raish, Martin
Publié: (1998)

Monster Movies?
par: Vaughn, Susan
Publié: (1971)

The Phonograph Movies
par: Parker, David L., et autres
Publié: (1975)

Movie Bubble: A Group-Centric Movie Recommendation System
par: Sk. Mujafar Ahmed, et autres
Publié: (2026)

Movie101v2: Improved Movie Narration Benchmark
par: Yue, Zihao, et autres
Publié: (2024)

MM-MovieDubber: Towards Multi-Modal Learning for Multi-Modal Movie Dubbing
par: Zheng, Junjie, et autres
Publié: (2025)

V2U4Real: A Real-world Large-scale Dataset for Vehicle-to-UAV Cooperative Perception
par: Li, Weijia, et autres
Publié: (2026)

MovieCharacter: A Tuning-Free Framework for Controllable Character Video Synthesis
par: Qiu, Di, et autres
Publié: (2024)

Movie Recommendation with Poster Attention via Multi-modal Transformer Feature Fusion
par: Xia, Linhan, et autres
Publié: (2024)

Chapter 3: Movies
par: Alshahrani, Faraj
Publié: (2026)

Which Movie To Watch!
par: Rajan, Kohulan
Publié: (2026)

Which Movie To Watch!
par: Rajan, Kohulan
Publié: (2025)

Beyond the Movie Theater
par: Waller, Gregory A.
Publié: (2023)

Positive Microbiology in the Movies
par: Manuel Sánchez‐Angulo
Publié: (2025)

MovieChat: From Dense Token to Sparse Memory for Long Video Understanding
par: Song, Enxin, et autres
Publié: (2023)

MovieTeller: Tool-augmented Movie Synopsis with ID Consistent Progressive Abstraction
par: Li, Yizhi, et autres
Publié: (2026)

Sharp Focus on Film; A Brief Guide to Research on Movies and Movie People.
par: Smith, Phil, et autres
Publié: (1973)

Binge Watch: Reproducible Multimodal Benchmarks Datasets for Large-Scale Movie Recommendation on MovieLens-10M and 20M
par: Spillo, Giuseppe, et autres
Publié: (2026)