Gespeichert in:
| Hauptverfasser: | Lin, Jiajing, Jiang, Shu, Zeng, Qingyuan, Wang, Zhenzhong, Jiang, Min |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2025
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2508.13792 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
Fading the Digital Ink: A Universal Black-Box Attack Framework for 3DGS Watermarking Systems
von: Zeng, Qingyuan, et al.
Veröffentlicht: (2025)
von: Zeng, Qingyuan, et al.
Veröffentlicht: (2025)
Cross-Modality Attack Boosted by Gradient-Evolutionary Multiform Optimization
von: Gong, Yunpeng, et al.
Veröffentlicht: (2024)
von: Gong, Yunpeng, et al.
Veröffentlicht: (2024)
Phys4DGen: Physics-Compliant 4D Generation with Multi-Material Composition Perception
von: Lin, Jiajing, et al.
Veröffentlicht: (2024)
von: Lin, Jiajing, et al.
Veröffentlicht: (2024)
Phy124: Fast Physics-Driven 4D Content Generation from a Single Image
von: Lin, Jiajing, et al.
Veröffentlicht: (2024)
von: Lin, Jiajing, et al.
Veröffentlicht: (2024)
Ask, Attend, Attack: A Effective Decision-Based Black-Box Targeted Attack for Image-to-Text Models
von: Zeng, Qingyuan, et al.
Veröffentlicht: (2024)
von: Zeng, Qingyuan, et al.
Veröffentlicht: (2024)
Cross-Task Attack: A Self-Supervision Generative Framework Based on Attention Shift
von: Zeng, Qingyuan, et al.
Veröffentlicht: (2024)
von: Zeng, Qingyuan, et al.
Veröffentlicht: (2024)
Facial Identity Anonymization via Intrinsic and Extrinsic Attention Distraction
von: Kuang, Zhenzhong, et al.
Veröffentlicht: (2024)
von: Kuang, Zhenzhong, et al.
Veröffentlicht: (2024)
NexusSplats: Efficient 3D Gaussian Splatting in the Wild
von: Tang, Yuzhou, et al.
Veröffentlicht: (2024)
von: Tang, Yuzhou, et al.
Veröffentlicht: (2024)
Intrinsic Concept Extraction Based on Compositional Interpretability
von: Shi, Hanyu, et al.
Veröffentlicht: (2026)
von: Shi, Hanyu, et al.
Veröffentlicht: (2026)
Part Segmentation and Motion Estimation for Articulated Objects with Dynamic 3D Gaussians
von: Chao, Jun-Jee, et al.
Veröffentlicht: (2025)
von: Chao, Jun-Jee, et al.
Veröffentlicht: (2025)
A Glimpse to Compress: Dynamic Visual Token Pruning for Large Vision-Language Models
von: Zeng, Quan-Sheng, et al.
Veröffentlicht: (2025)
von: Zeng, Quan-Sheng, et al.
Veröffentlicht: (2025)
ETC: Extreme Token Compression via Task-aware Visual Information Distillation in VLMs
von: Gao, Yiling, et al.
Veröffentlicht: (2026)
von: Gao, Yiling, et al.
Veröffentlicht: (2026)
Visual Context Window Extension: A New Perspective for Long Video Understanding
von: Wei, Hongchen, et al.
Veröffentlicht: (2024)
von: Wei, Hongchen, et al.
Veröffentlicht: (2024)
Solution for OOD-CV UNICORN Challenge 2024 Object Detection Assistance LLM Counting Ability Improvement
von: Chi, Zhouyang, et al.
Veröffentlicht: (2024)
von: Chi, Zhouyang, et al.
Veröffentlicht: (2024)
SemPT: Semantic Prompt Tuning for Vision-Language Models
von: Shi, Xiao, et al.
Veröffentlicht: (2025)
von: Shi, Xiao, et al.
Veröffentlicht: (2025)
Improving Network Interpretability via Explanation Consistency Evaluation
von: Wu, Hefeng, et al.
Veröffentlicht: (2024)
von: Wu, Hefeng, et al.
Veröffentlicht: (2024)
Subject-Aware Multi-Granularity Alignment for Zero-Shot EEG-to-Image Retrieval
von: Jiang, Lin, et al.
Veröffentlicht: (2026)
von: Jiang, Lin, et al.
Veröffentlicht: (2026)
Optimizing Vision-Language Consistency via Cross-Layer Regional Attention Alignment
von: Wang, Yifan, et al.
Veröffentlicht: (2025)
von: Wang, Yifan, et al.
Veröffentlicht: (2025)
SSP-GNN: Learning to Track via Bilevel Optimization
von: Golias, Griffin, et al.
Veröffentlicht: (2024)
von: Golias, Griffin, et al.
Veröffentlicht: (2024)
MedSynapse-V: Bridging Visual Perception and Clinical Intuition via Latent Memory Evolution
von: Zhu, Chunzheng, et al.
Veröffentlicht: (2026)
von: Zhu, Chunzheng, et al.
Veröffentlicht: (2026)
Exploring Interpretability for Visual Prompt Tuning with Cross-layer Concepts
von: Wang, Yubin, et al.
Veröffentlicht: (2025)
von: Wang, Yubin, et al.
Veröffentlicht: (2025)
Spatial Information Bottleneck for Interpretable Visual Recognition
von: Shu, Kaixiang, et al.
Veröffentlicht: (2025)
von: Shu, Kaixiang, et al.
Veröffentlicht: (2025)
The VEP Booster: A Closed-Loop AI System for Visual EEG Biomarker Auto-generation
von: Luo, Junwen, et al.
Veröffentlicht: (2024)
von: Luo, Junwen, et al.
Veröffentlicht: (2024)
Dynamic Rank Adaptation for Vision-Language Models
von: Wang, Jiahui, et al.
Veröffentlicht: (2025)
von: Wang, Jiahui, et al.
Veröffentlicht: (2025)
Personalized Vision via Visual In-Context Learning
von: Jiang, Yuxin, et al.
Veröffentlicht: (2025)
von: Jiang, Yuxin, et al.
Veröffentlicht: (2025)
TopoGaussian: Inferring Internal Topology Structures from Visual Clues
von: Xiong, Xiaoyu, et al.
Veröffentlicht: (2025)
von: Xiong, Xiaoyu, et al.
Veröffentlicht: (2025)
ORXE: Orchestrating Experts for Dynamically Configurable Efficiency
von: Wang, Qingyuan, et al.
Veröffentlicht: (2025)
von: Wang, Qingyuan, et al.
Veröffentlicht: (2025)
SAVER: Mitigating Hallucinations in Large Vision-Language Models via Style-Aware Visual Early Revision
von: Li, Zhaoxu, et al.
Veröffentlicht: (2025)
von: Li, Zhaoxu, et al.
Veröffentlicht: (2025)
Learning to Infer Unseen Single-/Multi-Attribute-Object Compositions with Graph Networks
von: Chen, Hui, et al.
Veröffentlicht: (2020)
von: Chen, Hui, et al.
Veröffentlicht: (2020)
Style Alignment based Dynamic Observation Method for UAV-View Geo-localization
von: Shao, Jie, et al.
Veröffentlicht: (2024)
von: Shao, Jie, et al.
Veröffentlicht: (2024)
Camera Pose Refinement via 3D Gaussian Splatting
von: Hao, Lulu, et al.
Veröffentlicht: (2025)
von: Hao, Lulu, et al.
Veröffentlicht: (2025)
AdaptInfer: Adaptive Token Pruning for Vision-Language Model Inference with Dynamical Text Guidance
von: Zhang, Weichen, et al.
Veröffentlicht: (2025)
von: Zhang, Weichen, et al.
Veröffentlicht: (2025)
Vision-EKIPL: External Knowledge-Infused Policy Learning for Visual Reasoning
von: Wang, Chaoyang, et al.
Veröffentlicht: (2025)
von: Wang, Chaoyang, et al.
Veröffentlicht: (2025)
LeMeViT: Efficient Vision Transformer with Learnable Meta Tokens for Remote Sensing Image Interpretation
von: Jiang, Wentao, et al.
Veröffentlicht: (2024)
von: Jiang, Wentao, et al.
Veröffentlicht: (2024)
Sensing Surface Patches in Volume Rendering for Inferring Signed Distance Functions
von: Jiang, Sijia, et al.
Veröffentlicht: (2024)
von: Jiang, Sijia, et al.
Veröffentlicht: (2024)
Devils in Middle Layers of Large Vision-Language Models: Interpreting, Detecting and Mitigating Object Hallucinations via Attention Lens
von: Jiang, Zhangqi, et al.
Veröffentlicht: (2024)
von: Jiang, Zhangqi, et al.
Veröffentlicht: (2024)
Visual Text Meets Low-level Vision: A Comprehensive Survey on Visual Text Processing
von: Shu, Yan, et al.
Veröffentlicht: (2024)
von: Shu, Yan, et al.
Veröffentlicht: (2024)
Vision Remember: Recovering Visual Information in Efficient LVLM with Vision Feature Resampling
von: Feng, Ze, et al.
Veröffentlicht: (2025)
von: Feng, Ze, et al.
Veröffentlicht: (2025)
Tailored Visions: Enhancing Text-to-Image Generation with Personalized Prompt Rewriting
von: Chen, Zijie, et al.
Veröffentlicht: (2023)
von: Chen, Zijie, et al.
Veröffentlicht: (2023)
Interpreting and Editing Vision-Language Representations to Mitigate Hallucinations
von: Jiang, Nick, et al.
Veröffentlicht: (2024)
von: Jiang, Nick, et al.
Veröffentlicht: (2024)
Ähnliche Einträge
-
Fading the Digital Ink: A Universal Black-Box Attack Framework for 3DGS Watermarking Systems
von: Zeng, Qingyuan, et al.
Veröffentlicht: (2025) -
Cross-Modality Attack Boosted by Gradient-Evolutionary Multiform Optimization
von: Gong, Yunpeng, et al.
Veröffentlicht: (2024) -
Phys4DGen: Physics-Compliant 4D Generation with Multi-Material Composition Perception
von: Lin, Jiajing, et al.
Veröffentlicht: (2024) -
Phy124: Fast Physics-Driven 4D Content Generation from a Single Image
von: Lin, Jiajing, et al.
Veröffentlicht: (2024) -
Ask, Attend, Attack: A Effective Decision-Based Black-Box Targeted Attack for Image-to-Text Models
von: Zeng, Qingyuan, et al.
Veröffentlicht: (2024)