Salvato in:
| Autori principali: | Kim, Jinrae, Jung, Sunggoo, Kim, Sung-Kyun, Kim, Youdan, Agha-mohammadi, Ali-akbar |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2024
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2403.17330 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
FRAME: A Modular Framework for Autonomous Map Merging: Advancements in the Field
di: Stathoulopoulos, Nikolaos, et al.
Pubblicazione: (2024)
di: Stathoulopoulos, Nikolaos, et al.
Pubblicazione: (2024)
GrndCtrl: Grounding World Models via Self-Supervised Reward Alignment
di: He, Haoyang, et al.
Pubblicazione: (2025)
di: He, Haoyang, et al.
Pubblicazione: (2025)
Semantic Belief Behavior Graph: Enabling Autonomous Robot Inspection in Unknown Environments
di: Ginting, Muhammad Fadhil, et al.
Pubblicazione: (2024)
di: Ginting, Muhammad Fadhil, et al.
Pubblicazione: (2024)
Pixels-to-Graph: Real-time Integration of Building Information Models and Scene Graphs for Semantic-Geometric Human-Robot Understanding
di: Longo, Antonello, et al.
Pubblicazione: (2025)
di: Longo, Antonello, et al.
Pubblicazione: (2025)
Arbitrary-Scale Image Generation and Upsampling using Latent Diffusion Model and Implicit Neural Decoder
di: Kim, Jinseok, et al.
Pubblicazione: (2024)
di: Kim, Jinseok, et al.
Pubblicazione: (2024)
BiTT: Bi-directional Texture Reconstruction of Interacting Two Hands from a Single Image
di: Kim, Minje, et al.
Pubblicazione: (2024)
di: Kim, Minje, et al.
Pubblicazione: (2024)
SRHand: Super-Resolving Hand Images and 3D Shapes via View/Pose-aware Neural Image Representations and Explicit 3D Meshes
di: Kim, Minje, et al.
Pubblicazione: (2025)
di: Kim, Minje, et al.
Pubblicazione: (2025)
LieHMR: Autoregressive Human Mesh Recovery with $SO(3)$ Diffusion
di: Kim, Donghwan, et al.
Pubblicazione: (2025)
di: Kim, Donghwan, et al.
Pubblicazione: (2025)
Object-aware Sound Source Localization via Audio-Visual Scene Understanding
di: Um, Sung Jin, et al.
Pubblicazione: (2025)
di: Um, Sung Jin, et al.
Pubblicazione: (2025)
HeRCULES: Heterogeneous Radar Dataset in Complex Urban Environment for Multi-session Radar SLAM
di: Kim, Hanjun, et al.
Pubblicazione: (2025)
di: Kim, Hanjun, et al.
Pubblicazione: (2025)
DySurface: Consistent 4D Surface Reconstruction via Bridging Explicit Gaussians and Implicit Functions
di: Kim, Minje, et al.
Pubblicazione: (2026)
di: Kim, Minje, et al.
Pubblicazione: (2026)
Co-learning Single-Step Diffusion Upsampler and Downsampler with Two Discriminators and Distillation
di: Kim, Sohwi, et al.
Pubblicazione: (2024)
di: Kim, Sohwi, et al.
Pubblicazione: (2024)
Learning Adaptive Pseudo-Label Selection for Semi-Supervised 3D Object Detection
di: Kong, Taehun, et al.
Pubblicazione: (2025)
di: Kong, Taehun, et al.
Pubblicazione: (2025)
Body-Hand Modality Expertized Networks with Cross-attention for Fine-grained Skeleton Action Recognition
di: Cho, Seungyeon, et al.
Pubblicazione: (2025)
di: Cho, Seungyeon, et al.
Pubblicazione: (2025)
Joint Learning of Pose Regression and Denoising Diffusion with Score Scaling Sampling for Category-level 6D Pose Estimation
di: Lee, Seunghyun, et al.
Pubblicazione: (2025)
di: Lee, Seunghyun, et al.
Pubblicazione: (2025)
3DPhysVideo: Consistency-Guided Flow SDE for Video Generation via 3D Scene Reconstruction and Physical Simulation
di: Kim, Hwidong, et al.
Pubblicazione: (2026)
di: Kim, Hwidong, et al.
Pubblicazione: (2026)
Multi-hypotheses Conditioned Point Cloud Diffusion for 3D Human Reconstruction from Occluded Images
di: Kim, Donghwan, et al.
Pubblicazione: (2024)
di: Kim, Donghwan, et al.
Pubblicazione: (2024)
InterHandGen: Two-Hand Interaction Generation via Cascaded Reverse Diffusion
di: Lee, Jihyun, et al.
Pubblicazione: (2024)
di: Lee, Jihyun, et al.
Pubblicazione: (2024)
Dynamic Full-body Motion Agent with Object Interaction via Blending Pre-trained Modular Controllers
di: Nam, Sanghyeok, et al.
Pubblicazione: (2026)
di: Nam, Sanghyeok, et al.
Pubblicazione: (2026)
Semi-Supervised 3D Object Detection with Channel Augmentation using Transformation Equivariance
di: Kang, Minju, et al.
Pubblicazione: (2024)
di: Kang, Minju, et al.
Pubblicazione: (2024)
Prompt Augmentation for Self-supervised Text-guided Image Manipulation
di: Bodur, Rumeysa, et al.
Pubblicazione: (2024)
di: Bodur, Rumeysa, et al.
Pubblicazione: (2024)
Cascaded Diffusion Framework for Probabilistic Coarse-to-Fine Hand Pose Estimation
di: Woo, Taeyun, et al.
Pubblicazione: (2025)
di: Woo, Taeyun, et al.
Pubblicazione: (2025)
Generalist Multi-Class Anomaly Detection via Distillation to Two Heterogeneous Student Networks
di: Park, Hangil, et al.
Pubblicazione: (2025)
di: Park, Hangil, et al.
Pubblicazione: (2025)
Multimodal Urban Tree Detection from Satellite and Street-Level Imagery via Annotation-Efficient Deep Learning Strategies
di: Kim, In Seon, et al.
Pubblicazione: (2026)
di: Kim, In Seon, et al.
Pubblicazione: (2026)
Learning to Visually Localize Sound Sources from Mixtures without Prior Source Knowledge
di: Kim, Dongjin, et al.
Pubblicazione: (2024)
di: Kim, Dongjin, et al.
Pubblicazione: (2024)
NeuVolEx: Implicit Neural Features for Volume Exploration
di: An, Haill, et al.
Pubblicazione: (2026)
di: An, Haill, et al.
Pubblicazione: (2026)
Generate, Analyze, and Refine: Training-Free Sound Source Localization via MLLM Meta-Reasoning
di: Park, Subin, et al.
Pubblicazione: (2026)
di: Park, Subin, et al.
Pubblicazione: (2026)
Distilling Vision-Language Pretraining for Efficient Cross-Modal Retrieval
di: Jang, Young Kyun, et al.
Pubblicazione: (2024)
di: Jang, Young Kyun, et al.
Pubblicazione: (2024)
MPMAvatar: Learning 3D Gaussian Avatars with Accurate and Robust Physics-Based Dynamics
di: Lee, Changmin, et al.
Pubblicazione: (2025)
di: Lee, Changmin, et al.
Pubblicazione: (2025)
Breaking the Visual Shortcuts in Multimodal Knowledge-Based Visual Question Answering
di: Lee, Dosung, et al.
Pubblicazione: (2025)
di: Lee, Dosung, et al.
Pubblicazione: (2025)
Locality-Aware Zero-Shot Human-Object Interaction Detection
di: Kim, Sanghyun, et al.
Pubblicazione: (2025)
di: Kim, Sanghyun, et al.
Pubblicazione: (2025)
Generalizable Person Re-identification via Balancing Alignment and Uniformity
di: Cho, Yoonki, et al.
Pubblicazione: (2024)
di: Cho, Yoonki, et al.
Pubblicazione: (2024)
MonoSAOD: Monocular 3D Object Detection with Sparsely Annotated Label
di: Jung, Junyoung, et al.
Pubblicazione: (2026)
di: Jung, Junyoung, et al.
Pubblicazione: (2026)
PhysHanDI: Physics-Based Reconstruction of Hand-Deformable Object Interactions
di: Lee, Jihyun, et al.
Pubblicazione: (2026)
di: Lee, Jihyun, et al.
Pubblicazione: (2026)
Watch Video, Catch Keyword: Context-aware Keyword Attention for Moment Retrieval and Highlight Detection
di: Um, Sung Jin, et al.
Pubblicazione: (2025)
di: Um, Sung Jin, et al.
Pubblicazione: (2025)
Energy-based Domain-Adaptive Segmentation with Depth Guidance
di: Zhu, Jinjing, et al.
Pubblicazione: (2024)
di: Zhu, Jinjing, et al.
Pubblicazione: (2024)
Hand-object reconstruction via interaction-aware graph attention mechanism
di: Woo, Taeyun, et al.
Pubblicazione: (2024)
di: Woo, Taeyun, et al.
Pubblicazione: (2024)
MGHanD: Multi-modal Guidance for authentic Hand Diffusion
di: Eum, Taehyeon, et al.
Pubblicazione: (2025)
di: Eum, Taehyeon, et al.
Pubblicazione: (2025)
Rethinking Saliency-Guided Weakly-Supervised Semantic Segmentation
di: Kim, Beomyoung, et al.
Pubblicazione: (2024)
di: Kim, Beomyoung, et al.
Pubblicazione: (2024)
PartSTAD: 2D-to-3D Part Segmentation Task Adaptation
di: Kim, Hyunjin, et al.
Pubblicazione: (2024)
di: Kim, Hyunjin, et al.
Pubblicazione: (2024)
Documenti analoghi
-
FRAME: A Modular Framework for Autonomous Map Merging: Advancements in the Field
di: Stathoulopoulos, Nikolaos, et al.
Pubblicazione: (2024) -
GrndCtrl: Grounding World Models via Self-Supervised Reward Alignment
di: He, Haoyang, et al.
Pubblicazione: (2025) -
Semantic Belief Behavior Graph: Enabling Autonomous Robot Inspection in Unknown Environments
di: Ginting, Muhammad Fadhil, et al.
Pubblicazione: (2024) -
Pixels-to-Graph: Real-time Integration of Building Information Models and Scene Graphs for Semantic-Geometric Human-Robot Understanding
di: Longo, Antonello, et al.
Pubblicazione: (2025) -
Arbitrary-Scale Image Generation and Upsampling using Latent Diffusion Model and Implicit Neural Decoder
di: Kim, Jinseok, et al.
Pubblicazione: (2024)