:: Library Catalog

Buchumschlag

Gespeichert in:

Bibliographische Detailangaben
Hauptverfasser:	Lin, Jiajing, Jiang, Shu, Zeng, Qingyuan, Wang, Zhenzhong, Jiang, Min
Format:	Preprint
Veröffentlicht:	2025
Schlagworte:	Computer Vision and Pattern Recognition
Online-Zugang:	https://arxiv.org/abs/2508.13792
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Ähnliche Einträge

Fading the Digital Ink: A Universal Black-Box Attack Framework for 3DGS Watermarking Systems
von: Zeng, Qingyuan, et al.
Veröffentlicht: (2025)

Cross-Modality Attack Boosted by Gradient-Evolutionary Multiform Optimization
von: Gong, Yunpeng, et al.
Veröffentlicht: (2024)

Phys4DGen: Physics-Compliant 4D Generation with Multi-Material Composition Perception
von: Lin, Jiajing, et al.
Veröffentlicht: (2024)

Phy124: Fast Physics-Driven 4D Content Generation from a Single Image
von: Lin, Jiajing, et al.
Veröffentlicht: (2024)

Ask, Attend, Attack: A Effective Decision-Based Black-Box Targeted Attack for Image-to-Text Models
von: Zeng, Qingyuan, et al.
Veröffentlicht: (2024)

Cross-Task Attack: A Self-Supervision Generative Framework Based on Attention Shift
von: Zeng, Qingyuan, et al.
Veröffentlicht: (2024)

Facial Identity Anonymization via Intrinsic and Extrinsic Attention Distraction
von: Kuang, Zhenzhong, et al.
Veröffentlicht: (2024)

NexusSplats: Efficient 3D Gaussian Splatting in the Wild
von: Tang, Yuzhou, et al.
Veröffentlicht: (2024)

Intrinsic Concept Extraction Based on Compositional Interpretability
von: Shi, Hanyu, et al.
Veröffentlicht: (2026)

Part Segmentation and Motion Estimation for Articulated Objects with Dynamic 3D Gaussians
von: Chao, Jun-Jee, et al.
Veröffentlicht: (2025)

A Glimpse to Compress: Dynamic Visual Token Pruning for Large Vision-Language Models
von: Zeng, Quan-Sheng, et al.
Veröffentlicht: (2025)

ETC: Extreme Token Compression via Task-aware Visual Information Distillation in VLMs
von: Gao, Yiling, et al.
Veröffentlicht: (2026)

Visual Context Window Extension: A New Perspective for Long Video Understanding
von: Wei, Hongchen, et al.
Veröffentlicht: (2024)

Solution for OOD-CV UNICORN Challenge 2024 Object Detection Assistance LLM Counting Ability Improvement
von: Chi, Zhouyang, et al.
Veröffentlicht: (2024)

SemPT: Semantic Prompt Tuning for Vision-Language Models
von: Shi, Xiao, et al.
Veröffentlicht: (2025)

Improving Network Interpretability via Explanation Consistency Evaluation
von: Wu, Hefeng, et al.
Veröffentlicht: (2024)

Subject-Aware Multi-Granularity Alignment for Zero-Shot EEG-to-Image Retrieval
von: Jiang, Lin, et al.
Veröffentlicht: (2026)

Optimizing Vision-Language Consistency via Cross-Layer Regional Attention Alignment
von: Wang, Yifan, et al.
Veröffentlicht: (2025)

SSP-GNN: Learning to Track via Bilevel Optimization
von: Golias, Griffin, et al.
Veröffentlicht: (2024)

MedSynapse-V: Bridging Visual Perception and Clinical Intuition via Latent Memory Evolution
von: Zhu, Chunzheng, et al.
Veröffentlicht: (2026)

Exploring Interpretability for Visual Prompt Tuning with Cross-layer Concepts
von: Wang, Yubin, et al.
Veröffentlicht: (2025)

Spatial Information Bottleneck for Interpretable Visual Recognition
von: Shu, Kaixiang, et al.
Veröffentlicht: (2025)

The VEP Booster: A Closed-Loop AI System for Visual EEG Biomarker Auto-generation
von: Luo, Junwen, et al.
Veröffentlicht: (2024)

Dynamic Rank Adaptation for Vision-Language Models
von: Wang, Jiahui, et al.
Veröffentlicht: (2025)

Personalized Vision via Visual In-Context Learning
von: Jiang, Yuxin, et al.
Veröffentlicht: (2025)

TopoGaussian: Inferring Internal Topology Structures from Visual Clues
von: Xiong, Xiaoyu, et al.
Veröffentlicht: (2025)

ORXE: Orchestrating Experts for Dynamically Configurable Efficiency
von: Wang, Qingyuan, et al.
Veröffentlicht: (2025)

SAVER: Mitigating Hallucinations in Large Vision-Language Models via Style-Aware Visual Early Revision
von: Li, Zhaoxu, et al.
Veröffentlicht: (2025)

Learning to Infer Unseen Single-/Multi-Attribute-Object Compositions with Graph Networks
von: Chen, Hui, et al.
Veröffentlicht: (2020)

Style Alignment based Dynamic Observation Method for UAV-View Geo-localization
von: Shao, Jie, et al.
Veröffentlicht: (2024)

Camera Pose Refinement via 3D Gaussian Splatting
von: Hao, Lulu, et al.
Veröffentlicht: (2025)

AdaptInfer: Adaptive Token Pruning for Vision-Language Model Inference with Dynamical Text Guidance
von: Zhang, Weichen, et al.
Veröffentlicht: (2025)

Vision-EKIPL: External Knowledge-Infused Policy Learning for Visual Reasoning
von: Wang, Chaoyang, et al.
Veröffentlicht: (2025)

LeMeViT: Efficient Vision Transformer with Learnable Meta Tokens for Remote Sensing Image Interpretation
von: Jiang, Wentao, et al.
Veröffentlicht: (2024)

Sensing Surface Patches in Volume Rendering for Inferring Signed Distance Functions
von: Jiang, Sijia, et al.
Veröffentlicht: (2024)

Devils in Middle Layers of Large Vision-Language Models: Interpreting, Detecting and Mitigating Object Hallucinations via Attention Lens
von: Jiang, Zhangqi, et al.
Veröffentlicht: (2024)

Visual Text Meets Low-level Vision: A Comprehensive Survey on Visual Text Processing
von: Shu, Yan, et al.
Veröffentlicht: (2024)

Vision Remember: Recovering Visual Information in Efficient LVLM with Vision Feature Resampling
von: Feng, Ze, et al.
Veröffentlicht: (2025)

Tailored Visions: Enhancing Text-to-Image Generation with Personalized Prompt Rewriting
von: Chen, Zijie, et al.
Veröffentlicht: (2023)

Interpreting and Editing Vision-Language Representations to Mitigate Hallucinations
von: Jiang, Nick, et al.
Veröffentlicht: (2024)