Salvato in:
| Autori principali: | Bendel, Matthew, Bailey, Stephen W., Vaidya, Mithilesh, Badam, Sumukh, He, Xingzhe |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2026
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2605.20476 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
PoDAR: Power-Disentangled Audio Representation for Generative Modeling
di: Luebs, Alejandro, et al.
Pubblicazione: (2026)
di: Luebs, Alejandro, et al.
Pubblicazione: (2026)
Entropy-Guided k-Guard Sampling for Long-Horizon Autoregressive Video Generation
di: Han, Yizhao, et al.
Pubblicazione: (2026)
di: Han, Yizhao, et al.
Pubblicazione: (2026)
Learning a Particle Dynamics Model with Real-world Videos
di: Kim, Chanho, et al.
Pubblicazione: (2026)
di: Kim, Chanho, et al.
Pubblicazione: (2026)
RELIC: Interactive Video World Model with Long-Horizon Memory
di: Hong, Yicong, et al.
Pubblicazione: (2025)
di: Hong, Yicong, et al.
Pubblicazione: (2025)
Event-Anchored Frame Selection for Effective Long-Video Understanding
di: Chen, Wang, et al.
Pubblicazione: (2026)
di: Chen, Wang, et al.
Pubblicazione: (2026)
OmniRoam: World Wandering via Long-Horizon Panoramic Video Generation
di: Liu, Yuheng, et al.
Pubblicazione: (2026)
di: Liu, Yuheng, et al.
Pubblicazione: (2026)
Long-Horizon Streaming Video Generation via Hybrid Attention with Decoupled Distillation
di: Li, Ruibin, et al.
Pubblicazione: (2026)
di: Li, Ruibin, et al.
Pubblicazione: (2026)
WorldWeaver: Generating Long-Horizon Video Worlds via Rich Perception
di: Liu, Zhiheng, et al.
Pubblicazione: (2025)
di: Liu, Zhiheng, et al.
Pubblicazione: (2025)
Train Short, Inference Long: Training-free Horizon Extension for Autoregressive Video Generation
di: Li, Jia, et al.
Pubblicazione: (2026)
di: Li, Jia, et al.
Pubblicazione: (2026)
pcaGAN: Improving Posterior-Sampling cGANs via Principal Component Regularization
di: Bendel, Matthew C., et al.
Pubblicazione: (2024)
di: Bendel, Matthew C., et al.
Pubblicazione: (2024)
LongVPO: From Anchored Cues to Self-Reasoning for Long-Form Video Preference Optimization
di: Huang, Zhenpeng, et al.
Pubblicazione: (2026)
di: Huang, Zhenpeng, et al.
Pubblicazione: (2026)
LatentKeypointGAN: Controlling Images via Latent Keypoints
di: He, Xingzhe, et al.
Pubblicazione: (2021)
di: He, Xingzhe, et al.
Pubblicazione: (2021)
VideoSeek: Long-Horizon Video Agent with Tool-Guided Seeking
di: Lin, Jingyang, et al.
Pubblicazione: (2026)
di: Lin, Jingyang, et al.
Pubblicazione: (2026)
Anchored Video Generation: Decoupling Scene Construction and Temporal Synthesis in Text-to-Video Diffusion Models
di: Hassan, Mariam, et al.
Pubblicazione: (2025)
di: Hassan, Mariam, et al.
Pubblicazione: (2025)
Anchored Diffusion for Video Face Reenactment
di: Kligvasser, Idan, et al.
Pubblicazione: (2024)
di: Kligvasser, Idan, et al.
Pubblicazione: (2024)
Memorize When Needed: Decoupled Memory Control for Spatially Consistent Long-Horizon Video Generation
di: Guo, Yanjun, et al.
Pubblicazione: (2026)
di: Guo, Yanjun, et al.
Pubblicazione: (2026)
RoboEnvision: A Long-Horizon Video Generation Model for Multi-Task Robot Manipulation
di: Yang, Liudi, et al.
Pubblicazione: (2025)
di: Yang, Liudi, et al.
Pubblicazione: (2025)
SurgLQA: Scalable Long-Horizon Surgical Video Question Answering
di: Guo, Diandian, et al.
Pubblicazione: (2026)
di: Guo, Diandian, et al.
Pubblicazione: (2026)
MedHorizon: Towards Long-context Medical Video Understanding in the Wild
di: Du, Bodong, et al.
Pubblicazione: (2026)
di: Du, Bodong, et al.
Pubblicazione: (2026)
VTAgent: Agentic Keyframe Anchoring for Evidence-Aware Video TextVQA
di: He, Haibin, et al.
Pubblicazione: (2026)
di: He, Haibin, et al.
Pubblicazione: (2026)
MagicWorld: Towards Long-Horizon Stability for Interactive Video World Exploration
di: Li, Guangyuan, et al.
Pubblicazione: (2025)
di: Li, Guangyuan, et al.
Pubblicazione: (2025)
AndroTMem: From Interaction Trajectories to Anchored Memory in Long-Horizon GUI Agents
di: Shi, Yibo, et al.
Pubblicazione: (2026)
di: Shi, Yibo, et al.
Pubblicazione: (2026)
Multi-sentence Video Grounding for Long Video Generation
di: Feng, Wei, et al.
Pubblicazione: (2024)
di: Feng, Wei, et al.
Pubblicazione: (2024)
VideoAuteur: Towards Long Narrative Video Generation
di: Xiao, Junfei, et al.
Pubblicazione: (2025)
di: Xiao, Junfei, et al.
Pubblicazione: (2025)
SAGE: Training Smart Any-Horizon Agents for Long Video Reasoning with Reinforcement Learning
di: Jain, Jitesh, et al.
Pubblicazione: (2025)
di: Jain, Jitesh, et al.
Pubblicazione: (2025)
VideoMerge: Towards Training-free Long Video Generation
di: Zhang, Siyang, et al.
Pubblicazione: (2025)
di: Zhang, Siyang, et al.
Pubblicazione: (2025)
VideoForest: Person-Anchored Hierarchical Reasoning for Cross-Video Question Answering
di: Meng, Yiran, et al.
Pubblicazione: (2025)
di: Meng, Yiran, et al.
Pubblicazione: (2025)
Moment Sampling in Video LLMs for Long-Form Video QA
di: Chasmai, Mustafa, et al.
Pubblicazione: (2025)
di: Chasmai, Mustafa, et al.
Pubblicazione: (2025)
SpatialMem: Metric-Aligned Long-Horizon Video Memory for Language Grounding and QA
di: Zheng, Xinyi, et al.
Pubblicazione: (2026)
di: Zheng, Xinyi, et al.
Pubblicazione: (2026)
Long Context Tuning for Video Generation
di: Guo, Yuwei, et al.
Pubblicazione: (2025)
di: Guo, Yuwei, et al.
Pubblicazione: (2025)
AR2-4FV: Anchored Referring and Re-identification for Long-Term Grounding in Fixed-View Videos
di: Yan, Teng, et al.
Pubblicazione: (2026)
di: Yan, Teng, et al.
Pubblicazione: (2026)
Video-Infinity: Distributed Long Video Generation
di: Tan, Zhenxiong, et al.
Pubblicazione: (2024)
di: Tan, Zhenxiong, et al.
Pubblicazione: (2024)
Dual-Anchoring: Addressing State Drift in Vision-Language Navigation
di: Wu, Kangyi, et al.
Pubblicazione: (2026)
di: Wu, Kangyi, et al.
Pubblicazione: (2026)
PackForcing: Short Video Training Suffices for Long Video Sampling and Long Context Inference
di: Mao, Xiaofeng, et al.
Pubblicazione: (2026)
di: Mao, Xiaofeng, et al.
Pubblicazione: (2026)
QueST: Persistent Queries as Semantic Monitors for Drift Suppression in Long-Horizon Tracking
di: Anand, Mayank, et al.
Pubblicazione: (2026)
di: Anand, Mayank, et al.
Pubblicazione: (2026)
Towards Long Video Understanding via Fine-detailed Video Story Generation
di: You, Zeng, et al.
Pubblicazione: (2024)
di: You, Zeng, et al.
Pubblicazione: (2024)
VideoSSM: Autoregressive Long Video Generation with Hybrid State-Space Memory
di: Yu, Yifei, et al.
Pubblicazione: (2025)
di: Yu, Yifei, et al.
Pubblicazione: (2025)
LongLive: Real-time Interactive Long Video Generation
di: Yang, Shuai, et al.
Pubblicazione: (2025)
di: Yang, Shuai, et al.
Pubblicazione: (2025)
Towards Chunk-Wise Generation for Long Videos
di: Zhang, Siyang, et al.
Pubblicazione: (2024)
di: Zhang, Siyang, et al.
Pubblicazione: (2024)
VideoCAD: A Dataset and Model for Learning Long-Horizon 3D CAD UI Interactions from Video
di: Man, Brandon, et al.
Pubblicazione: (2025)
di: Man, Brandon, et al.
Pubblicazione: (2025)
Documenti analoghi
-
PoDAR: Power-Disentangled Audio Representation for Generative Modeling
di: Luebs, Alejandro, et al.
Pubblicazione: (2026) -
Entropy-Guided k-Guard Sampling for Long-Horizon Autoregressive Video Generation
di: Han, Yizhao, et al.
Pubblicazione: (2026) -
Learning a Particle Dynamics Model with Real-world Videos
di: Kim, Chanho, et al.
Pubblicazione: (2026) -
RELIC: Interactive Video World Model with Long-Horizon Memory
di: Hong, Yicong, et al.
Pubblicazione: (2025) -
Event-Anchored Frame Selection for Effective Long-Video Understanding
di: Chen, Wang, et al.
Pubblicazione: (2026)