:: Library Catalog

Copertina

Salvato in:

Dettagli Bibliografici
Autori principali:	Gong, Boyang, Zheng, Yu, Kong, Fanye, Zhou, Jie, Lu, Jiwen
Natura:	Preprint
Pubblicazione:	2026
Soggetti:	Computer Vision and Pattern Recognition Artificial Intelligence
Accesso online:	https://arxiv.org/abs/2604.01989
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Documenti analoghi

Learning Counterfactually Decoupled Attention for Open-World Model Attribution
di: Zheng, Yu, et al.
Pubblicazione: (2025)

Cross-Modal Attention Calibration for LVLM Hallucination Mitigation
di: Li, Jiaming, et al.
Pubblicazione: (2025)

BAMI: Training-Free Bias Mitigation in GUI Grounding
di: Zhang, Borui, et al.
Pubblicazione: (2026)

Causally-Grounded Dual-Path Attention Intervention for Object Hallucination Mitigation in LVLMs
di: Yu, Liu, et al.
Pubblicazione: (2025)

SpectralAR: Spectral Autoregressive Visual Generation
di: Huang, Yuanhui, et al.
Pubblicazione: (2025)

Streaming 4D Visual Geometry Transformer
di: Zhuo, Dong, et al.
Pubblicazione: (2025)

GaussianFormer: Scene as Gaussians for Vision-Based 3D Semantic Occupancy Prediction
di: Huang, Yuanhui, et al.
Pubblicazione: (2024)

Mitigating Visual Hallucinations via Semantic Curriculum Preference Optimization in MLLMs
di: Li, Yuanshuai, et al.
Pubblicazione: (2025)

Point3R: Streaming 3D Reconstruction with Explicit Spatial Pointer Memory
di: Wu, Yuqi, et al.
Pubblicazione: (2025)

XMask3D: Cross-modal Mask Reasoning for Open Vocabulary 3D Semantic Segmentation
di: Wang, Ziyi, et al.
Pubblicazione: (2024)

Finding the Correct Visual Evidence Without Forgetting: Mitigating Hallucination in LVLMs via Inter-Layer Visual Attention Discrepancy
di: Xie, Yutong, et al.
Pubblicazione: (2026)

UniPre3D: Unified Pre-training of 3D Point Cloud Models with Cross-Modal Gaussian Splatting
di: Wang, Ziyi, et al.
Pubblicazione: (2025)

Looking Back and Forth: Cross-Image Attention Calibration and Attentive Preference Learning for Multi-Image Hallucination Mitigation
di: Yang, Xiaochen, et al.
Pubblicazione: (2026)

$\bf{D^3}$QE: Learning Discrete Distribution Discrepancy-aware Quantization Error for Autoregressive-Generated Image Detection
di: Zhang, Yanran, et al.
Pubblicazione: (2025)

MHSA: A Lightweight Framework for Mitigating Hallucinations via Steered Attention in LVLMs
di: Ding, Wei, et al.
Pubblicazione: (2026)

Mitigating Object Hallucinations in LVLMs via Attention Imbalance Rectification
di: Sun, Han, et al.
Pubblicazione: (2026)

Thinking Before Looking: Improving Multimodal LLM Reasoning via Mitigating Visual Hallucination
di: Zheng, Haojie, et al.
Pubblicazione: (2024)

Vega: Learning to Drive with Natural Language Instructions
di: Zuo, Sicheng, et al.
Pubblicazione: (2026)

Kestrel: Grounding Self-Refinement for LVLM Hallucination Mitigation
di: Mao, Jiawei, et al.
Pubblicazione: (2026)

GaussianWorld: Gaussian World Model for Streaming 3D Occupancy Prediction
di: Zuo, Sicheng, et al.
Pubblicazione: (2024)

Dynamic Multimodal Activation Steering for Hallucination Mitigation in Large Vision-Language Models
di: Yin, Jianghao, et al.
Pubblicazione: (2026)

Mitigating Object Hallucinations in Large Vision-Language Models via Attention Calibration
di: Zhu, Younan, et al.
Pubblicazione: (2025)

Mitigating Object Hallucinations in Large Vision-Language Models with Assembly of Global and Local Attention
di: An, Wenbin, et al.
Pubblicazione: (2024)

Global Context or Local Detail? Adaptive Visual Grounding for Hallucination Mitigation
di: Jiang, Yubo, et al.
Pubblicazione: (2026)

Divide and Conquer: Object Co-occurrence Helps Mitigate Simplicity Bias in OOD Detection
di: Dai, Boyang, et al.
Pubblicazione: (2026)

TARAC: Mitigating Hallucination in LVLMs via Temporal Attention Real-time Accumulative Connection
di: Jiang, Lei, et al.
Pubblicazione: (2025)

MAP: Mitigating Hallucinations in Large Vision-Language Models with Map-Level Attention Processing
di: Li, Chenxi, et al.
Pubblicazione: (2025)

Black-Box Visual Prompt Engineering for Mitigating Object Hallucination in Large Vision Language Models
di: Woo, Sangmin, et al.
Pubblicazione: (2025)

Distill the Best, Ignore the Rest: Improving Dataset Distillation with Loss-Value-Based Pruning
di: Moser, Brian B., et al.
Pubblicazione: (2024)

When Looking Is Not Enough: Visual Attention Structure Reveals Hallucination in MLLMs
di: Cao, Fanpu, et al.
Pubblicazione: (2026)

SAVE: Sparse Autoencoder-Driven Visual Information Enhancement for Mitigating Object Hallucination
di: Park, Sangha, et al.
Pubblicazione: (2025)

Optimizing LVLMs with On-Policy Data for Effective Hallucination Mitigation
di: Yu, Chengzhi, et al.
Pubblicazione: (2025)

Attention-space Contrastive Guidance for Efficient Hallucination Mitigation in LVLMs
di: Jo, Yujin, et al.
Pubblicazione: (2026)

V-ITI: Mitigating Hallucinations in Multimodal Large Language Models via Visual Inference-Time Intervention
di: Sun, Nan, et al.
Pubblicazione: (2025)

Rest2Visual: Predicting Visually Evoked fMRI from Resting-State Scans
di: Zhou, Chuyang, et al.
Pubblicazione: (2025)

INTER: Mitigating Hallucination in Large Vision-Language Models by Interaction Guidance Sampling
di: Dong, Xin, et al.
Pubblicazione: (2025)

Correcting Visual Blur Induced by Attention Distraction to Reduce Hallucinations: Algorithm and Theory
di: Li, Quanjiang, et al.
Pubblicazione: (2026)

Doe-1: Closed-Loop Autonomous Driving with Large World Model
di: Zheng, Wenzhao, et al.
Pubblicazione: (2024)

EmbodiedOcc: Embodied 3D Occupancy Prediction for Vision-based Online Scene Understanding
di: Wu, Yuqi, et al.
Pubblicazione: (2024)

CLAIM: Mitigating Multilingual Object Hallucination in Large Vision-Language Models with Cross-Lingual Attention Intervention
di: Ye, Zekai, et al.
Pubblicazione: (2025)