:: Library Catalog

Copertina

Salvato in:

Dettagli Bibliografici
Autori principali:	Bendel, Matthew, Bailey, Stephen W., Vaidya, Mithilesh, Badam, Sumukh, He, Xingzhe
Natura:	Preprint
Pubblicazione:	2026
Soggetti:	Computer Vision and Pattern Recognition
Accesso online:	https://arxiv.org/abs/2605.20476
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Documenti analoghi

PoDAR: Power-Disentangled Audio Representation for Generative Modeling
di: Luebs, Alejandro, et al.
Pubblicazione: (2026)

Entropy-Guided k-Guard Sampling for Long-Horizon Autoregressive Video Generation
di: Han, Yizhao, et al.
Pubblicazione: (2026)

Learning a Particle Dynamics Model with Real-world Videos
di: Kim, Chanho, et al.
Pubblicazione: (2026)

RELIC: Interactive Video World Model with Long-Horizon Memory
di: Hong, Yicong, et al.
Pubblicazione: (2025)

Event-Anchored Frame Selection for Effective Long-Video Understanding
di: Chen, Wang, et al.
Pubblicazione: (2026)

OmniRoam: World Wandering via Long-Horizon Panoramic Video Generation
di: Liu, Yuheng, et al.
Pubblicazione: (2026)

Long-Horizon Streaming Video Generation via Hybrid Attention with Decoupled Distillation
di: Li, Ruibin, et al.
Pubblicazione: (2026)

WorldWeaver: Generating Long-Horizon Video Worlds via Rich Perception
di: Liu, Zhiheng, et al.
Pubblicazione: (2025)

Train Short, Inference Long: Training-free Horizon Extension for Autoregressive Video Generation
di: Li, Jia, et al.
Pubblicazione: (2026)

pcaGAN: Improving Posterior-Sampling cGANs via Principal Component Regularization
di: Bendel, Matthew C., et al.
Pubblicazione: (2024)

LongVPO: From Anchored Cues to Self-Reasoning for Long-Form Video Preference Optimization
di: Huang, Zhenpeng, et al.
Pubblicazione: (2026)

LatentKeypointGAN: Controlling Images via Latent Keypoints
di: He, Xingzhe, et al.
Pubblicazione: (2021)

VideoSeek: Long-Horizon Video Agent with Tool-Guided Seeking
di: Lin, Jingyang, et al.
Pubblicazione: (2026)

Anchored Video Generation: Decoupling Scene Construction and Temporal Synthesis in Text-to-Video Diffusion Models
di: Hassan, Mariam, et al.
Pubblicazione: (2025)

Anchored Diffusion for Video Face Reenactment
di: Kligvasser, Idan, et al.
Pubblicazione: (2024)

Memorize When Needed: Decoupled Memory Control for Spatially Consistent Long-Horizon Video Generation
di: Guo, Yanjun, et al.
Pubblicazione: (2026)

RoboEnvision: A Long-Horizon Video Generation Model for Multi-Task Robot Manipulation
di: Yang, Liudi, et al.
Pubblicazione: (2025)

SurgLQA: Scalable Long-Horizon Surgical Video Question Answering
di: Guo, Diandian, et al.
Pubblicazione: (2026)

MedHorizon: Towards Long-context Medical Video Understanding in the Wild
di: Du, Bodong, et al.
Pubblicazione: (2026)

VTAgent: Agentic Keyframe Anchoring for Evidence-Aware Video TextVQA
di: He, Haibin, et al.
Pubblicazione: (2026)

MagicWorld: Towards Long-Horizon Stability for Interactive Video World Exploration
di: Li, Guangyuan, et al.
Pubblicazione: (2025)

AndroTMem: From Interaction Trajectories to Anchored Memory in Long-Horizon GUI Agents
di: Shi, Yibo, et al.
Pubblicazione: (2026)

Multi-sentence Video Grounding for Long Video Generation
di: Feng, Wei, et al.
Pubblicazione: (2024)

VideoAuteur: Towards Long Narrative Video Generation
di: Xiao, Junfei, et al.
Pubblicazione: (2025)

SAGE: Training Smart Any-Horizon Agents for Long Video Reasoning with Reinforcement Learning
di: Jain, Jitesh, et al.
Pubblicazione: (2025)

VideoMerge: Towards Training-free Long Video Generation
di: Zhang, Siyang, et al.
Pubblicazione: (2025)

VideoForest: Person-Anchored Hierarchical Reasoning for Cross-Video Question Answering
di: Meng, Yiran, et al.
Pubblicazione: (2025)

Moment Sampling in Video LLMs for Long-Form Video QA
di: Chasmai, Mustafa, et al.
Pubblicazione: (2025)

SpatialMem: Metric-Aligned Long-Horizon Video Memory for Language Grounding and QA
di: Zheng, Xinyi, et al.
Pubblicazione: (2026)

Long Context Tuning for Video Generation
di: Guo, Yuwei, et al.
Pubblicazione: (2025)

AR2-4FV: Anchored Referring and Re-identification for Long-Term Grounding in Fixed-View Videos
di: Yan, Teng, et al.
Pubblicazione: (2026)

Video-Infinity: Distributed Long Video Generation
di: Tan, Zhenxiong, et al.
Pubblicazione: (2024)

Dual-Anchoring: Addressing State Drift in Vision-Language Navigation
di: Wu, Kangyi, et al.
Pubblicazione: (2026)

PackForcing: Short Video Training Suffices for Long Video Sampling and Long Context Inference
di: Mao, Xiaofeng, et al.
Pubblicazione: (2026)

QueST: Persistent Queries as Semantic Monitors for Drift Suppression in Long-Horizon Tracking
di: Anand, Mayank, et al.
Pubblicazione: (2026)

Towards Long Video Understanding via Fine-detailed Video Story Generation
di: You, Zeng, et al.
Pubblicazione: (2024)

VideoSSM: Autoregressive Long Video Generation with Hybrid State-Space Memory
di: Yu, Yifei, et al.
Pubblicazione: (2025)

LongLive: Real-time Interactive Long Video Generation
di: Yang, Shuai, et al.
Pubblicazione: (2025)

Towards Chunk-Wise Generation for Long Videos
di: Zhang, Siyang, et al.
Pubblicazione: (2024)

VideoCAD: A Dataset and Model for Learning Long-Horizon 3D CAD UI Interactions from Video
di: Man, Brandon, et al.
Pubblicazione: (2025)