Enregistré dans:
| Auteurs principaux: | Henriques, Joao F., Campbell, Dylan, Han, Tengda |
|---|---|
| Format: | Preprint |
| Publié: |
2024
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2404.01079 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
Character-Centric Understanding of Animated Movies
par: Gui, Zhongrui, et autres
Publié: (2025)
par: Gui, Zhongrui, et autres
Publié: (2025)
Flash3D: Feed-Forward Generalisable 3D Scene Reconstruction from a Single Image
par: Szymanowicz, Stanislaw, et autres
Publié: (2024)
par: Szymanowicz, Stanislaw, et autres
Publié: (2024)
SCENES: Subpixel Correspondence Estimation With Epipolar Supervision
par: Kloepfer, Dominik A., et autres
Publié: (2024)
par: Kloepfer, Dominik A., et autres
Publié: (2024)
PoseDreamer: Scalable and Photorealistic Human Data Generation Pipeline with Diffusion Models
par: Prospero, Lorenza, et autres
Publié: (2026)
par: Prospero, Lorenza, et autres
Publié: (2026)
GMOS: Grounding Moving Object Segmentation in 3D Space and Time
par: Xie, Junyu, et autres
Publié: (2026)
par: Xie, Junyu, et autres
Publié: (2026)
HandCraft: Anatomically Correct Restoration of Malformed Hands in Diffusion Generated Images
par: Qin, Zhenyue, et autres
Publié: (2024)
par: Qin, Zhenyue, et autres
Publié: (2024)
PlückeRF: A Line-based 3D Representation for Few-view Reconstruction
par: Bahrami, Sam, et autres
Publié: (2025)
par: Bahrami, Sam, et autres
Publié: (2025)
Text2Loc++: Generalizing 3D Point Cloud Localization from Natural Language
par: Xia, Yan, et autres
Publié: (2025)
par: Xia, Yan, et autres
Publié: (2025)
HyperHuman: Hyper-Realistic Human Generation with Latent Structural Diffusion
par: Liu, Xian, et autres
Publié: (2023)
par: Liu, Xian, et autres
Publié: (2023)
MPDS: A Movie Posters Dataset for Image Generation with Diffusion Model
par: Xu, Meng, et autres
Publié: (2024)
par: Xu, Meng, et autres
Publié: (2024)
Prompt Generation Networks for Input-Space Adaptation of Frozen Vision Transformers
par: Loedeman, Jochem, et autres
Publié: (2022)
par: Loedeman, Jochem, et autres
Publié: (2022)
CountGD: Multi-Modal Open-World Counting
par: Amini-Naieni, Niki, et autres
Publié: (2024)
par: Amini-Naieni, Niki, et autres
Publié: (2024)
Learning to Count without Annotations
par: Knobel, Lukas, et autres
Publié: (2023)
par: Knobel, Lukas, et autres
Publié: (2023)
HyperDiff: Hypergraph Guided Diffusion Model for 3D Human Pose Estimation
par: Han, Bing, et autres
Publié: (2025)
par: Han, Bing, et autres
Publié: (2025)
MovieBench: A Hierarchical Movie Level Dataset for Long Video Generation
par: Wu, Weijia, et autres
Publié: (2024)
par: Wu, Weijia, et autres
Publié: (2024)
Refracting Reality: Generating Images with Realistic Transparent Objects
par: Yin, Yue, et autres
Publié: (2025)
par: Yin, Yue, et autres
Publié: (2025)
Unsupervised Object Detection with Theoretical Guarantees
par: Longa, Marian, et autres
Publié: (2024)
par: Longa, Marian, et autres
Publié: (2024)
Interpretable Representation Learning from Videos using Nonlinear Priors
par: Longa, Marian, et autres
Publié: (2024)
par: Longa, Marian, et autres
Publié: (2024)
It's Just Another Day: Unique Video Captioning by Discriminative Prompting
par: Perrett, Toby, et autres
Publié: (2024)
par: Perrett, Toby, et autres
Publié: (2024)
Towards Automated Movie Trailer Generation
par: Argaw, Dawit Mureja, et autres
Publié: (2024)
par: Argaw, Dawit Mureja, et autres
Publié: (2024)
Room Envelopes: A Synthetic Dataset for Indoor Layout Reconstruction from Images
par: Bahrami, Sam, et autres
Publié: (2025)
par: Bahrami, Sam, et autres
Publié: (2025)
Text2Loc: 3D Point Cloud Localization from Natural Language
par: Xia, Yan, et autres
Publié: (2023)
par: Xia, Yan, et autres
Publié: (2023)
IMPUS: Image Morphing with Perceptually-Uniform Sampling Using Diffusion Models
par: Yang, Zhaoyuan, et autres
Publié: (2023)
par: Yang, Zhaoyuan, et autres
Publié: (2023)
3D Arena: An Open Platform for Generative 3D Evaluation
par: Ebert, Dylan
Publié: (2025)
par: Ebert, Dylan
Publié: (2025)
CRAM: Large-scale Video Continual Learning with Bootstrapped Compression
par: Mall, Shivani, et autres
Publié: (2025)
par: Mall, Shivani, et autres
Publié: (2025)
Captain Cinema: Towards Short Movie Generation
par: Xiao, Junfei, et autres
Publié: (2025)
par: Xiao, Junfei, et autres
Publié: (2025)
GST: Precise 3D Human Body from a Single Image with Gaussian Splatting Transformers
par: Prospero, Lorenza, et autres
Publié: (2024)
par: Prospero, Lorenza, et autres
Publié: (2024)
TrafficLoc: Localizing Traffic Surveillance Cameras in 3D Scenes
par: Xia, Yan, et autres
Publié: (2024)
par: Xia, Yan, et autres
Publié: (2024)
HyperDiT: Hyper-Connected Transformers for High-Fidelity Pixel-Space Diffusion
par: He, Yu, et autres
Publié: (2026)
par: He, Yu, et autres
Publié: (2026)
Dynamic Reflections: Probing Video Representations with Text Alignment
par: Zhu, Tyler, et autres
Publié: (2025)
par: Zhu, Tyler, et autres
Publié: (2025)
Seeing without Pixels: Perception from Camera Trajectories
par: Xue, Zihui, et autres
Publié: (2025)
par: Xue, Zihui, et autres
Publié: (2025)
SEED4D: A Synthetic Ego--Exo Dynamic 4D Data Generator, Driving Dataset and Benchmark
par: Kästingschäfer, Marius, et autres
Publié: (2024)
par: Kästingschäfer, Marius, et autres
Publié: (2024)
MovieCORE: COgnitive REasoning in Movies
par: Faure, Gueter Josmy, et autres
Publié: (2025)
par: Faure, Gueter Josmy, et autres
Publié: (2025)
D-Cube: Exploiting Hyper-Features of Diffusion Model for Robust Medical Classification
par: Jang, Minhee, et autres
Publié: (2024)
par: Jang, Minhee, et autres
Publié: (2024)
MovieDreamer: Hierarchical Generation for Coherent Long Visual Sequence
par: Zhao, Canyu, et autres
Publié: (2024)
par: Zhao, Canyu, et autres
Publié: (2024)
Automated Movie Generation via Multi-Agent CoT Planning
par: Wu, Weijia, et autres
Publié: (2025)
par: Wu, Weijia, et autres
Publié: (2025)
Unpaired Photo-realistic Image Deraining with Energy-informed Diffusion Model
par: Wen, Yuanbo, et autres
Publié: (2024)
par: Wen, Yuanbo, et autres
Publié: (2024)
Shot-by-Shot: Film-Grammar-Aware Training-Free Audio Description Generation
par: Xie, Junyu, et autres
Publié: (2025)
par: Xie, Junyu, et autres
Publié: (2025)
Believing is Seeing: Unobserved Object Detection using Generative Models
par: Bhattacharjee, Subhransu S., et autres
Publié: (2024)
par: Bhattacharjee, Subhransu S., et autres
Publié: (2024)
Learning from Streaming Video with Orthogonal Gradients
par: Han, Tengda, et autres
Publié: (2025)
par: Han, Tengda, et autres
Publié: (2025)
Documents similaires
-
Character-Centric Understanding of Animated Movies
par: Gui, Zhongrui, et autres
Publié: (2025) -
Flash3D: Feed-Forward Generalisable 3D Scene Reconstruction from a Single Image
par: Szymanowicz, Stanislaw, et autres
Publié: (2024) -
SCENES: Subpixel Correspondence Estimation With Epipolar Supervision
par: Kloepfer, Dominik A., et autres
Publié: (2024) -
PoseDreamer: Scalable and Photorealistic Human Data Generation Pipeline with Diffusion Models
par: Prospero, Lorenza, et autres
Publié: (2026) -
GMOS: Grounding Moving Object Segmentation in 3D Space and Time
par: Xie, Junyu, et autres
Publié: (2026)