Salvato in:
| Autori principali: | Gong, Boyang, Zheng, Yu, Kong, Fanye, Zhou, Jie, Lu, Jiwen |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2026
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2604.01989 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
Learning Counterfactually Decoupled Attention for Open-World Model Attribution
di: Zheng, Yu, et al.
Pubblicazione: (2025)
di: Zheng, Yu, et al.
Pubblicazione: (2025)
Cross-Modal Attention Calibration for LVLM Hallucination Mitigation
di: Li, Jiaming, et al.
Pubblicazione: (2025)
di: Li, Jiaming, et al.
Pubblicazione: (2025)
BAMI: Training-Free Bias Mitigation in GUI Grounding
di: Zhang, Borui, et al.
Pubblicazione: (2026)
di: Zhang, Borui, et al.
Pubblicazione: (2026)
Causally-Grounded Dual-Path Attention Intervention for Object Hallucination Mitigation in LVLMs
di: Yu, Liu, et al.
Pubblicazione: (2025)
di: Yu, Liu, et al.
Pubblicazione: (2025)
SpectralAR: Spectral Autoregressive Visual Generation
di: Huang, Yuanhui, et al.
Pubblicazione: (2025)
di: Huang, Yuanhui, et al.
Pubblicazione: (2025)
Streaming 4D Visual Geometry Transformer
di: Zhuo, Dong, et al.
Pubblicazione: (2025)
di: Zhuo, Dong, et al.
Pubblicazione: (2025)
GaussianFormer: Scene as Gaussians for Vision-Based 3D Semantic Occupancy Prediction
di: Huang, Yuanhui, et al.
Pubblicazione: (2024)
di: Huang, Yuanhui, et al.
Pubblicazione: (2024)
Mitigating Visual Hallucinations via Semantic Curriculum Preference Optimization in MLLMs
di: Li, Yuanshuai, et al.
Pubblicazione: (2025)
di: Li, Yuanshuai, et al.
Pubblicazione: (2025)
Point3R: Streaming 3D Reconstruction with Explicit Spatial Pointer Memory
di: Wu, Yuqi, et al.
Pubblicazione: (2025)
di: Wu, Yuqi, et al.
Pubblicazione: (2025)
XMask3D: Cross-modal Mask Reasoning for Open Vocabulary 3D Semantic Segmentation
di: Wang, Ziyi, et al.
Pubblicazione: (2024)
di: Wang, Ziyi, et al.
Pubblicazione: (2024)
Finding the Correct Visual Evidence Without Forgetting: Mitigating Hallucination in LVLMs via Inter-Layer Visual Attention Discrepancy
di: Xie, Yutong, et al.
Pubblicazione: (2026)
di: Xie, Yutong, et al.
Pubblicazione: (2026)
UniPre3D: Unified Pre-training of 3D Point Cloud Models with Cross-Modal Gaussian Splatting
di: Wang, Ziyi, et al.
Pubblicazione: (2025)
di: Wang, Ziyi, et al.
Pubblicazione: (2025)
Looking Back and Forth: Cross-Image Attention Calibration and Attentive Preference Learning for Multi-Image Hallucination Mitigation
di: Yang, Xiaochen, et al.
Pubblicazione: (2026)
di: Yang, Xiaochen, et al.
Pubblicazione: (2026)
$\bf{D^3}$QE: Learning Discrete Distribution Discrepancy-aware Quantization Error for Autoregressive-Generated Image Detection
di: Zhang, Yanran, et al.
Pubblicazione: (2025)
di: Zhang, Yanran, et al.
Pubblicazione: (2025)
MHSA: A Lightweight Framework for Mitigating Hallucinations via Steered Attention in LVLMs
di: Ding, Wei, et al.
Pubblicazione: (2026)
di: Ding, Wei, et al.
Pubblicazione: (2026)
Mitigating Object Hallucinations in LVLMs via Attention Imbalance Rectification
di: Sun, Han, et al.
Pubblicazione: (2026)
di: Sun, Han, et al.
Pubblicazione: (2026)
Thinking Before Looking: Improving Multimodal LLM Reasoning via Mitigating Visual Hallucination
di: Zheng, Haojie, et al.
Pubblicazione: (2024)
di: Zheng, Haojie, et al.
Pubblicazione: (2024)
Vega: Learning to Drive with Natural Language Instructions
di: Zuo, Sicheng, et al.
Pubblicazione: (2026)
di: Zuo, Sicheng, et al.
Pubblicazione: (2026)
Kestrel: Grounding Self-Refinement for LVLM Hallucination Mitigation
di: Mao, Jiawei, et al.
Pubblicazione: (2026)
di: Mao, Jiawei, et al.
Pubblicazione: (2026)
GaussianWorld: Gaussian World Model for Streaming 3D Occupancy Prediction
di: Zuo, Sicheng, et al.
Pubblicazione: (2024)
di: Zuo, Sicheng, et al.
Pubblicazione: (2024)
Dynamic Multimodal Activation Steering for Hallucination Mitigation in Large Vision-Language Models
di: Yin, Jianghao, et al.
Pubblicazione: (2026)
di: Yin, Jianghao, et al.
Pubblicazione: (2026)
Mitigating Object Hallucinations in Large Vision-Language Models via Attention Calibration
di: Zhu, Younan, et al.
Pubblicazione: (2025)
di: Zhu, Younan, et al.
Pubblicazione: (2025)
Mitigating Object Hallucinations in Large Vision-Language Models with Assembly of Global and Local Attention
di: An, Wenbin, et al.
Pubblicazione: (2024)
di: An, Wenbin, et al.
Pubblicazione: (2024)
Global Context or Local Detail? Adaptive Visual Grounding for Hallucination Mitigation
di: Jiang, Yubo, et al.
Pubblicazione: (2026)
di: Jiang, Yubo, et al.
Pubblicazione: (2026)
Divide and Conquer: Object Co-occurrence Helps Mitigate Simplicity Bias in OOD Detection
di: Dai, Boyang, et al.
Pubblicazione: (2026)
di: Dai, Boyang, et al.
Pubblicazione: (2026)
TARAC: Mitigating Hallucination in LVLMs via Temporal Attention Real-time Accumulative Connection
di: Jiang, Lei, et al.
Pubblicazione: (2025)
di: Jiang, Lei, et al.
Pubblicazione: (2025)
MAP: Mitigating Hallucinations in Large Vision-Language Models with Map-Level Attention Processing
di: Li, Chenxi, et al.
Pubblicazione: (2025)
di: Li, Chenxi, et al.
Pubblicazione: (2025)
Black-Box Visual Prompt Engineering for Mitigating Object Hallucination in Large Vision Language Models
di: Woo, Sangmin, et al.
Pubblicazione: (2025)
di: Woo, Sangmin, et al.
Pubblicazione: (2025)
Distill the Best, Ignore the Rest: Improving Dataset Distillation with Loss-Value-Based Pruning
di: Moser, Brian B., et al.
Pubblicazione: (2024)
di: Moser, Brian B., et al.
Pubblicazione: (2024)
When Looking Is Not Enough: Visual Attention Structure Reveals Hallucination in MLLMs
di: Cao, Fanpu, et al.
Pubblicazione: (2026)
di: Cao, Fanpu, et al.
Pubblicazione: (2026)
SAVE: Sparse Autoencoder-Driven Visual Information Enhancement for Mitigating Object Hallucination
di: Park, Sangha, et al.
Pubblicazione: (2025)
di: Park, Sangha, et al.
Pubblicazione: (2025)
Optimizing LVLMs with On-Policy Data for Effective Hallucination Mitigation
di: Yu, Chengzhi, et al.
Pubblicazione: (2025)
di: Yu, Chengzhi, et al.
Pubblicazione: (2025)
Attention-space Contrastive Guidance for Efficient Hallucination Mitigation in LVLMs
di: Jo, Yujin, et al.
Pubblicazione: (2026)
di: Jo, Yujin, et al.
Pubblicazione: (2026)
V-ITI: Mitigating Hallucinations in Multimodal Large Language Models via Visual Inference-Time Intervention
di: Sun, Nan, et al.
Pubblicazione: (2025)
di: Sun, Nan, et al.
Pubblicazione: (2025)
Rest2Visual: Predicting Visually Evoked fMRI from Resting-State Scans
di: Zhou, Chuyang, et al.
Pubblicazione: (2025)
di: Zhou, Chuyang, et al.
Pubblicazione: (2025)
INTER: Mitigating Hallucination in Large Vision-Language Models by Interaction Guidance Sampling
di: Dong, Xin, et al.
Pubblicazione: (2025)
di: Dong, Xin, et al.
Pubblicazione: (2025)
Correcting Visual Blur Induced by Attention Distraction to Reduce Hallucinations: Algorithm and Theory
di: Li, Quanjiang, et al.
Pubblicazione: (2026)
di: Li, Quanjiang, et al.
Pubblicazione: (2026)
Doe-1: Closed-Loop Autonomous Driving with Large World Model
di: Zheng, Wenzhao, et al.
Pubblicazione: (2024)
di: Zheng, Wenzhao, et al.
Pubblicazione: (2024)
EmbodiedOcc: Embodied 3D Occupancy Prediction for Vision-based Online Scene Understanding
di: Wu, Yuqi, et al.
Pubblicazione: (2024)
di: Wu, Yuqi, et al.
Pubblicazione: (2024)
CLAIM: Mitigating Multilingual Object Hallucination in Large Vision-Language Models with Cross-Lingual Attention Intervention
di: Ye, Zekai, et al.
Pubblicazione: (2025)
di: Ye, Zekai, et al.
Pubblicazione: (2025)
Documenti analoghi
-
Learning Counterfactually Decoupled Attention for Open-World Model Attribution
di: Zheng, Yu, et al.
Pubblicazione: (2025) -
Cross-Modal Attention Calibration for LVLM Hallucination Mitigation
di: Li, Jiaming, et al.
Pubblicazione: (2025) -
BAMI: Training-Free Bias Mitigation in GUI Grounding
di: Zhang, Borui, et al.
Pubblicazione: (2026) -
Causally-Grounded Dual-Path Attention Intervention for Object Hallucination Mitigation in LVLMs
di: Yu, Liu, et al.
Pubblicazione: (2025) -
SpectralAR: Spectral Autoregressive Visual Generation
di: Huang, Yuanhui, et al.
Pubblicazione: (2025)