:: Library Catalog

Image de couverture de livre

Enregistré dans:

Détails bibliographiques
Auteurs principaux:	Henriques, Joao F., Campbell, Dylan, Han, Tengda
Format:	Preprint
Publié:	2024
Sujets:	Computer Vision and Pattern Recognition
Accès en ligne:	https://arxiv.org/abs/2404.01079
Tags:	Ajouter un tag Pas de tags, Soyez le premier à ajouter un tag!

Documents similaires

Character-Centric Understanding of Animated Movies
par: Gui, Zhongrui, et autres
Publié: (2025)

Flash3D: Feed-Forward Generalisable 3D Scene Reconstruction from a Single Image
par: Szymanowicz, Stanislaw, et autres
Publié: (2024)

SCENES: Subpixel Correspondence Estimation With Epipolar Supervision
par: Kloepfer, Dominik A., et autres
Publié: (2024)

PoseDreamer: Scalable and Photorealistic Human Data Generation Pipeline with Diffusion Models
par: Prospero, Lorenza, et autres
Publié: (2026)

GMOS: Grounding Moving Object Segmentation in 3D Space and Time
par: Xie, Junyu, et autres
Publié: (2026)

HandCraft: Anatomically Correct Restoration of Malformed Hands in Diffusion Generated Images
par: Qin, Zhenyue, et autres
Publié: (2024)

PlückeRF: A Line-based 3D Representation for Few-view Reconstruction
par: Bahrami, Sam, et autres
Publié: (2025)

Text2Loc++: Generalizing 3D Point Cloud Localization from Natural Language
par: Xia, Yan, et autres
Publié: (2025)

HyperHuman: Hyper-Realistic Human Generation with Latent Structural Diffusion
par: Liu, Xian, et autres
Publié: (2023)

MPDS: A Movie Posters Dataset for Image Generation with Diffusion Model
par: Xu, Meng, et autres
Publié: (2024)

Prompt Generation Networks for Input-Space Adaptation of Frozen Vision Transformers
par: Loedeman, Jochem, et autres
Publié: (2022)

CountGD: Multi-Modal Open-World Counting
par: Amini-Naieni, Niki, et autres
Publié: (2024)

Learning to Count without Annotations
par: Knobel, Lukas, et autres
Publié: (2023)

HyperDiff: Hypergraph Guided Diffusion Model for 3D Human Pose Estimation
par: Han, Bing, et autres
Publié: (2025)

MovieBench: A Hierarchical Movie Level Dataset for Long Video Generation
par: Wu, Weijia, et autres
Publié: (2024)

Refracting Reality: Generating Images with Realistic Transparent Objects
par: Yin, Yue, et autres
Publié: (2025)

Unsupervised Object Detection with Theoretical Guarantees
par: Longa, Marian, et autres
Publié: (2024)

Interpretable Representation Learning from Videos using Nonlinear Priors
par: Longa, Marian, et autres
Publié: (2024)

It's Just Another Day: Unique Video Captioning by Discriminative Prompting
par: Perrett, Toby, et autres
Publié: (2024)

Towards Automated Movie Trailer Generation
par: Argaw, Dawit Mureja, et autres
Publié: (2024)

Room Envelopes: A Synthetic Dataset for Indoor Layout Reconstruction from Images
par: Bahrami, Sam, et autres
Publié: (2025)

Text2Loc: 3D Point Cloud Localization from Natural Language
par: Xia, Yan, et autres
Publié: (2023)

IMPUS: Image Morphing with Perceptually-Uniform Sampling Using Diffusion Models
par: Yang, Zhaoyuan, et autres
Publié: (2023)

3D Arena: An Open Platform for Generative 3D Evaluation
par: Ebert, Dylan
Publié: (2025)

CRAM: Large-scale Video Continual Learning with Bootstrapped Compression
par: Mall, Shivani, et autres
Publié: (2025)

Captain Cinema: Towards Short Movie Generation
par: Xiao, Junfei, et autres
Publié: (2025)

GST: Precise 3D Human Body from a Single Image with Gaussian Splatting Transformers
par: Prospero, Lorenza, et autres
Publié: (2024)

TrafficLoc: Localizing Traffic Surveillance Cameras in 3D Scenes
par: Xia, Yan, et autres
Publié: (2024)

HyperDiT: Hyper-Connected Transformers for High-Fidelity Pixel-Space Diffusion
par: He, Yu, et autres
Publié: (2026)

Dynamic Reflections: Probing Video Representations with Text Alignment
par: Zhu, Tyler, et autres
Publié: (2025)

Seeing without Pixels: Perception from Camera Trajectories
par: Xue, Zihui, et autres
Publié: (2025)

SEED4D: A Synthetic Ego--Exo Dynamic 4D Data Generator, Driving Dataset and Benchmark
par: Kästingschäfer, Marius, et autres
Publié: (2024)

MovieCORE: COgnitive REasoning in Movies
par: Faure, Gueter Josmy, et autres
Publié: (2025)

D-Cube: Exploiting Hyper-Features of Diffusion Model for Robust Medical Classification
par: Jang, Minhee, et autres
Publié: (2024)

MovieDreamer: Hierarchical Generation for Coherent Long Visual Sequence
par: Zhao, Canyu, et autres
Publié: (2024)

Automated Movie Generation via Multi-Agent CoT Planning
par: Wu, Weijia, et autres
Publié: (2025)

Unpaired Photo-realistic Image Deraining with Energy-informed Diffusion Model
par: Wen, Yuanbo, et autres
Publié: (2024)

Shot-by-Shot: Film-Grammar-Aware Training-Free Audio Description Generation
par: Xie, Junyu, et autres
Publié: (2025)

Believing is Seeing: Unobserved Object Detection using Generative Models
par: Bhattacharjee, Subhransu S., et autres
Publié: (2024)

Learning from Streaming Video with Orthogonal Gradients
par: Han, Tengda, et autres
Publié: (2025)