:: Library Catalog

Copertina

Salvato in:

Dettagli Bibliografici
Autori principali:	Kim, Jinrae, Jung, Sunggoo, Kim, Sung-Kyun, Kim, Youdan, Agha-mohammadi, Ali-akbar
Natura:	Preprint
Pubblicazione:	2024
Soggetti:	Computer Vision and Pattern Recognition
Accesso online:	https://arxiv.org/abs/2403.17330
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Documenti analoghi

FRAME: A Modular Framework for Autonomous Map Merging: Advancements in the Field
di: Stathoulopoulos, Nikolaos, et al.
Pubblicazione: (2024)

GrndCtrl: Grounding World Models via Self-Supervised Reward Alignment
di: He, Haoyang, et al.
Pubblicazione: (2025)

Semantic Belief Behavior Graph: Enabling Autonomous Robot Inspection in Unknown Environments
di: Ginting, Muhammad Fadhil, et al.
Pubblicazione: (2024)

Pixels-to-Graph: Real-time Integration of Building Information Models and Scene Graphs for Semantic-Geometric Human-Robot Understanding
di: Longo, Antonello, et al.
Pubblicazione: (2025)

Arbitrary-Scale Image Generation and Upsampling using Latent Diffusion Model and Implicit Neural Decoder
di: Kim, Jinseok, et al.
Pubblicazione: (2024)

BiTT: Bi-directional Texture Reconstruction of Interacting Two Hands from a Single Image
di: Kim, Minje, et al.
Pubblicazione: (2024)

SRHand: Super-Resolving Hand Images and 3D Shapes via View/Pose-aware Neural Image Representations and Explicit 3D Meshes
di: Kim, Minje, et al.
Pubblicazione: (2025)

LieHMR: Autoregressive Human Mesh Recovery with $SO(3)$ Diffusion
di: Kim, Donghwan, et al.
Pubblicazione: (2025)

Object-aware Sound Source Localization via Audio-Visual Scene Understanding
di: Um, Sung Jin, et al.
Pubblicazione: (2025)

HeRCULES: Heterogeneous Radar Dataset in Complex Urban Environment for Multi-session Radar SLAM
di: Kim, Hanjun, et al.
Pubblicazione: (2025)

DySurface: Consistent 4D Surface Reconstruction via Bridging Explicit Gaussians and Implicit Functions
di: Kim, Minje, et al.
Pubblicazione: (2026)

Co-learning Single-Step Diffusion Upsampler and Downsampler with Two Discriminators and Distillation
di: Kim, Sohwi, et al.
Pubblicazione: (2024)

Learning Adaptive Pseudo-Label Selection for Semi-Supervised 3D Object Detection
di: Kong, Taehun, et al.
Pubblicazione: (2025)

Body-Hand Modality Expertized Networks with Cross-attention for Fine-grained Skeleton Action Recognition
di: Cho, Seungyeon, et al.
Pubblicazione: (2025)

Joint Learning of Pose Regression and Denoising Diffusion with Score Scaling Sampling for Category-level 6D Pose Estimation
di: Lee, Seunghyun, et al.
Pubblicazione: (2025)

3DPhysVideo: Consistency-Guided Flow SDE for Video Generation via 3D Scene Reconstruction and Physical Simulation
di: Kim, Hwidong, et al.
Pubblicazione: (2026)

Multi-hypotheses Conditioned Point Cloud Diffusion for 3D Human Reconstruction from Occluded Images
di: Kim, Donghwan, et al.
Pubblicazione: (2024)

InterHandGen: Two-Hand Interaction Generation via Cascaded Reverse Diffusion
di: Lee, Jihyun, et al.
Pubblicazione: (2024)

Dynamic Full-body Motion Agent with Object Interaction via Blending Pre-trained Modular Controllers
di: Nam, Sanghyeok, et al.
Pubblicazione: (2026)

Semi-Supervised 3D Object Detection with Channel Augmentation using Transformation Equivariance
di: Kang, Minju, et al.
Pubblicazione: (2024)

Prompt Augmentation for Self-supervised Text-guided Image Manipulation
di: Bodur, Rumeysa, et al.
Pubblicazione: (2024)

Cascaded Diffusion Framework for Probabilistic Coarse-to-Fine Hand Pose Estimation
di: Woo, Taeyun, et al.
Pubblicazione: (2025)

Generalist Multi-Class Anomaly Detection via Distillation to Two Heterogeneous Student Networks
di: Park, Hangil, et al.
Pubblicazione: (2025)

Multimodal Urban Tree Detection from Satellite and Street-Level Imagery via Annotation-Efficient Deep Learning Strategies
di: Kim, In Seon, et al.
Pubblicazione: (2026)

Learning to Visually Localize Sound Sources from Mixtures without Prior Source Knowledge
di: Kim, Dongjin, et al.
Pubblicazione: (2024)

NeuVolEx: Implicit Neural Features for Volume Exploration
di: An, Haill, et al.
Pubblicazione: (2026)

Generate, Analyze, and Refine: Training-Free Sound Source Localization via MLLM Meta-Reasoning
di: Park, Subin, et al.
Pubblicazione: (2026)

Distilling Vision-Language Pretraining for Efficient Cross-Modal Retrieval
di: Jang, Young Kyun, et al.
Pubblicazione: (2024)

MPMAvatar: Learning 3D Gaussian Avatars with Accurate and Robust Physics-Based Dynamics
di: Lee, Changmin, et al.
Pubblicazione: (2025)

Breaking the Visual Shortcuts in Multimodal Knowledge-Based Visual Question Answering
di: Lee, Dosung, et al.
Pubblicazione: (2025)

Locality-Aware Zero-Shot Human-Object Interaction Detection
di: Kim, Sanghyun, et al.
Pubblicazione: (2025)

Generalizable Person Re-identification via Balancing Alignment and Uniformity
di: Cho, Yoonki, et al.
Pubblicazione: (2024)

MonoSAOD: Monocular 3D Object Detection with Sparsely Annotated Label
di: Jung, Junyoung, et al.
Pubblicazione: (2026)

PhysHanDI: Physics-Based Reconstruction of Hand-Deformable Object Interactions
di: Lee, Jihyun, et al.
Pubblicazione: (2026)

Watch Video, Catch Keyword: Context-aware Keyword Attention for Moment Retrieval and Highlight Detection
di: Um, Sung Jin, et al.
Pubblicazione: (2025)

Energy-based Domain-Adaptive Segmentation with Depth Guidance
di: Zhu, Jinjing, et al.
Pubblicazione: (2024)

Hand-object reconstruction via interaction-aware graph attention mechanism
di: Woo, Taeyun, et al.
Pubblicazione: (2024)

MGHanD: Multi-modal Guidance for authentic Hand Diffusion
di: Eum, Taehyeon, et al.
Pubblicazione: (2025)

Rethinking Saliency-Guided Weakly-Supervised Semantic Segmentation
di: Kim, Beomyoung, et al.
Pubblicazione: (2024)

PartSTAD: 2D-to-3D Part Segmentation Task Adaptation
di: Kim, Hyunjin, et al.
Pubblicazione: (2024)