Salvato in:
| Autori principali: | Foo, Alex, Hsu, Wynne, Lee, Mong Li |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2025
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2512.18192 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
TRUST-VL: An Explainable News Assistant for General Multimodal Misinformation Detection
di: Yan, Zehong, et al.
Pubblicazione: (2025)
di: Yan, Zehong, et al.
Pubblicazione: (2025)
LEAF-Mamba: Local Emphatic and Adaptive Fusion State Space Model for RGB-D Salient Object Detection
di: Wu, Lanhu, et al.
Pubblicazione: (2025)
di: Wu, Lanhu, et al.
Pubblicazione: (2025)
Mitigating GenAI-powered Evidence Pollution for Out-of-Context Multimodal Misinformation Detection
di: Yan, Zehong, et al.
Pubblicazione: (2025)
di: Yan, Zehong, et al.
Pubblicazione: (2025)
SNIFFER: Multimodal Large Language Model for Explainable Out-of-Context Misinformation Detection
di: Qi, Peng, et al.
Pubblicazione: (2024)
di: Qi, Peng, et al.
Pubblicazione: (2024)
Cross-Domain Feature Augmentation for Domain Generalization
di: Liu, Yingnan, et al.
Pubblicazione: (2024)
di: Liu, Yingnan, et al.
Pubblicazione: (2024)
Orthogonal Spatial-temporal Distributional Transfer for 4D Generation
di: Liu, Wei, et al.
Pubblicazione: (2026)
di: Liu, Wei, et al.
Pubblicazione: (2026)
Unsupervised Part Discovery via Dual Representation Alignment
di: Xia, Jiahao, et al.
Pubblicazione: (2024)
di: Xia, Jiahao, et al.
Pubblicazione: (2024)
PartCo: Part-Level Correspondence Priors Enhance Category Discovery
di: Cendra, Fernando Julio, et al.
Pubblicazione: (2025)
di: Cendra, Fernando Julio, et al.
Pubblicazione: (2025)
Video-of-Thought: Step-by-Step Video Reasoning from Perception to Cognition
di: Fei, Hao, et al.
Pubblicazione: (2024)
di: Fei, Hao, et al.
Pubblicazione: (2024)
Watch Out Your Album! On the Inadvertent Privacy Memorization in Multi-Modal Large Language Models
di: Ju, Tianjie, et al.
Pubblicazione: (2025)
di: Ju, Tianjie, et al.
Pubblicazione: (2025)
Task-aligned Part-aware Panoptic Segmentation through Joint Object-Part Representations
di: de Geus, Daan, et al.
Pubblicazione: (2024)
di: de Geus, Daan, et al.
Pubblicazione: (2024)
PartCraft: Crafting Creative Objects by Parts
di: Ng, Kam Woh, et al.
Pubblicazione: (2024)
di: Ng, Kam Woh, et al.
Pubblicazione: (2024)
PartStickers: Generating Parts of Objects for Rapid Prototyping
di: Zhou, Mo, et al.
Pubblicazione: (2025)
di: Zhou, Mo, et al.
Pubblicazione: (2025)
GUMBEL-NERF: Representing Unseen Objects as Part-Compositional Neural Radiance Fields
di: Sekikawa, Yusuke, et al.
Pubblicazione: (2024)
di: Sekikawa, Yusuke, et al.
Pubblicazione: (2024)
PartHOI: Part-based Hand-Object Interaction Transfer via Generalized Cylinders
di: Wang, Qiaochu, et al.
Pubblicazione: (2025)
di: Wang, Qiaochu, et al.
Pubblicazione: (2025)
BPJDet: Extended Object Representation for Generic Body-Part Joint Detection
di: Zhou, Huayi, et al.
Pubblicazione: (2023)
di: Zhou, Huayi, et al.
Pubblicazione: (2023)
AutoPartGen: Autogressive 3D Part Generation and Discovery
di: Chen, Minghao, et al.
Pubblicazione: (2025)
di: Chen, Minghao, et al.
Pubblicazione: (2025)
Unveiling the Cognitive Compass: Theory-of-Mind-Guided Multimodal Emotion Reasoning
di: Luo, Meng, et al.
Pubblicazione: (2026)
di: Luo, Meng, et al.
Pubblicazione: (2026)
PhysPart: Physically Plausible Part Completion for Interactable Objects
di: Luo, Rundong, et al.
Pubblicazione: (2024)
di: Luo, Rundong, et al.
Pubblicazione: (2024)
Beyond Viewpoint: Robust 3D Object Recognition under Arbitrary Views through Joint Multi-Part Representation
di: Fan, Linlong, et al.
Pubblicazione: (2024)
di: Fan, Linlong, et al.
Pubblicazione: (2024)
Articulate That Object Part (ATOP): 3D Part Articulation via Text and Motion Personalization
di: Vora, Aditya, et al.
Pubblicazione: (2025)
di: Vora, Aditya, et al.
Pubblicazione: (2025)
PLOT: Text-based Person Search with Part Slot Attention for Corresponding Part Discovery
di: Park, Jicheol, et al.
Pubblicazione: (2024)
di: Park, Jicheol, et al.
Pubblicazione: (2024)
Understanding Multi-Granularity for Open-Vocabulary Part Segmentation
di: Choi, Jiho, et al.
Pubblicazione: (2024)
di: Choi, Jiho, et al.
Pubblicazione: (2024)
MuSLR: Multimodal Symbolic Logical Reasoning
di: Xu, Jundong, et al.
Pubblicazione: (2025)
di: Xu, Jundong, et al.
Pubblicazione: (2025)
PartFormer: Awakening Latent Diverse Representation from Vision Transformer for Object Re-Identification
di: Tan, Lei, et al.
Pubblicazione: (2024)
di: Tan, Lei, et al.
Pubblicazione: (2024)
Efficient Part-level 3D Object Generation via Dual Volume Packing
di: Tang, Jiaxiang, et al.
Pubblicazione: (2025)
di: Tang, Jiaxiang, et al.
Pubblicazione: (2025)
Unsupervised Part Discovery via Descriptor-Based Masked Image Restoration with Optimized Constraints
di: Xia, Jiahao, et al.
Pubblicazione: (2025)
di: Xia, Jiahao, et al.
Pubblicazione: (2025)
SCP: Spatial Causal Prediction in Video
di: Zhao, Yanguang, et al.
Pubblicazione: (2026)
di: Zhao, Yanguang, et al.
Pubblicazione: (2026)
PartDiffuser: Part-wise 3D Mesh Generation via Discrete Diffusion
di: Yang, Yichen, et al.
Pubblicazione: (2025)
di: Yang, Yichen, et al.
Pubblicazione: (2025)
PartGLEE: A Foundation Model for Recognizing and Parsing Any Objects
di: Li, Junyi, et al.
Pubblicazione: (2024)
di: Li, Junyi, et al.
Pubblicazione: (2024)
OmniPart: Part-Aware 3D Generation with Semantic Decoupling and Structural Cohesion
di: Yang, Yunhan, et al.
Pubblicazione: (2025)
di: Yang, Yunhan, et al.
Pubblicazione: (2025)
ParCo: Part-Coordinating Text-to-Motion Synthesis
di: Zou, Qiran, et al.
Pubblicazione: (2024)
di: Zou, Qiran, et al.
Pubblicazione: (2024)
DragAPart: Learning a Part-Level Motion Prior for Articulated Objects
di: Li, Ruining, et al.
Pubblicazione: (2024)
di: Li, Ruining, et al.
Pubblicazione: (2024)
SINGAPO: Single Image Controlled Generation of Articulated Parts in Objects
di: Liu, Jiayi, et al.
Pubblicazione: (2024)
di: Liu, Jiayi, et al.
Pubblicazione: (2024)
UniTrack: Differentiable Graph Representation Learning for Multi-Object Tracking
di: Galoaa, Bishoy, et al.
Pubblicazione: (2026)
di: Galoaa, Bishoy, et al.
Pubblicazione: (2026)
Dr.V: A Hierarchical Perception-Temporal-Cognition Framework to Diagnose Video Hallucination by Fine-grained Spatial-Temporal Grounding
di: Luo, Meng, et al.
Pubblicazione: (2025)
di: Luo, Meng, et al.
Pubblicazione: (2025)
VIGIL: Part-Grounded Structured Reasoning for Generalizable Deepfake Detection
di: Li, Xinghan, et al.
Pubblicazione: (2026)
di: Li, Xinghan, et al.
Pubblicazione: (2026)
A Hyperbolic Perspective on Hierarchical Structure in Object-Centric Scene Representations
di: Madan, Neelu, et al.
Pubblicazione: (2026)
di: Madan, Neelu, et al.
Pubblicazione: (2026)
Few-shot Structure-Informed Machinery Part Segmentation with Foundation Models and Graph Neural Networks
di: Schwingshackl, Michael, et al.
Pubblicazione: (2025)
di: Schwingshackl, Michael, et al.
Pubblicazione: (2025)
Understanding Self-Supervised Pretraining with Part-Aware Representation Learning
di: Zhu, Jie, et al.
Pubblicazione: (2023)
di: Zhu, Jie, et al.
Pubblicazione: (2023)
Documenti analoghi
-
TRUST-VL: An Explainable News Assistant for General Multimodal Misinformation Detection
di: Yan, Zehong, et al.
Pubblicazione: (2025) -
LEAF-Mamba: Local Emphatic and Adaptive Fusion State Space Model for RGB-D Salient Object Detection
di: Wu, Lanhu, et al.
Pubblicazione: (2025) -
Mitigating GenAI-powered Evidence Pollution for Out-of-Context Multimodal Misinformation Detection
di: Yan, Zehong, et al.
Pubblicazione: (2025) -
SNIFFER: Multimodal Large Language Model for Explainable Out-of-Context Misinformation Detection
di: Qi, Peng, et al.
Pubblicazione: (2024) -
Cross-Domain Feature Augmentation for Domain Generalization
di: Liu, Yingnan, et al.
Pubblicazione: (2024)