Պահպանված է:
| Հիմնական հեղինակներ: | Wang, Che, Zhang, Fuyao, Zhang, Jiaming, Zhang, Ziqi, Wang, Yinghui, Huang, Longtao, Gao, Jianbo, Chen, Zhong, Lim, Wei Yang Bryan |
|---|---|
| Ձևաչափ: | Preprint |
| Հրապարակվել է: |
2026
|
| Խորագրեր: | |
| Առցանց հասանելիություն: | https://arxiv.org/abs/2602.20708 |
| Ցուցիչներ: |
Ավելացրեք ցուցիչ
Չկան պիտակներ, Եղեք առաջինը, ով նշում է այս գրառումը!
|
Նմանատիպ նյութեր
AdapTools: Adaptive Tool-based Indirect Prompt Injection Attacks on Agentic LLMs
: Wang, Che, և այլն
Հրապարակվել է: (2026)
: Wang, Che, և այլն
Հրապարակվել է: (2026)
DualTAP: A Dual-Task Adversarial Protector for Mobile MLLM Agents
: Zhang, Fuyao, և այլն
Հրապարակվել է: (2025)
: Zhang, Fuyao, և այլն
Հրապարակվել է: (2025)
MELON: Provable Defense Against Indirect Prompt Injection Attacks in AI Agents
: Zhu, Kaijie, և այլն
Հրապարակվել է: (2025)
: Zhu, Kaijie, և այլն
Հրապարակվել է: (2025)
VENOMREC: Cross-Modal Interactive Poisoning for Targeted Promotion in Multimodal LLM Recommender Systems
: Guan, Guowei, և այլն
Հրապարակվել է: (2026)
: Guan, Guowei, և այլն
Հրապարակվել է: (2026)
FATH: Authentication-based Test-time Defense against Indirect Prompt Injection Attacks
: Wang, Jiongxiao, և այլն
Հրապարակվել է: (2024)
: Wang, Jiongxiao, և այլն
Հրապարակվել է: (2024)
QueryIPI: Query-agnostic Indirect Prompt Injection on Coding Agents
: Xie, Yuchong, և այլն
Հրապարակվել է: (2025)
: Xie, Yuchong, և այլն
Հրապարակվել է: (2025)
Adaptive Attacks Break Defenses Against Indirect Prompt Injection Attacks on LLM Agents
: Zhan, Qiusi, և այլն
Հրապարակվել է: (2025)
: Zhan, Qiusi, և այլն
Հրապարակվել է: (2025)
Can Indirect Prompt Injection Attacks Be Detected and Removed?
: Chen, Yulin, և այլն
Հրապարակվել է: (2025)
: Chen, Yulin, և այլն
Հրապարակվել է: (2025)
TopicAttack: An Indirect Prompt Injection Attack via Topic Transition
: Chen, Yulin, և այլն
Հրապարակվել է: (2025)
: Chen, Yulin, և այլն
Հրապարակվել է: (2025)
IPIGuard: A Novel Tool Dependency Graph-Based Defense Against Indirect Prompt Injection in LLM Agents
: An, Hengyu, և այլն
Հրապարակվել է: (2025)
: An, Hengyu, և այլն
Հրապարակվել է: (2025)
Architecting Secure AI Agents: Perspectives on System-Level Defenses Against Indirect Prompt Injection Attacks
: Xiang, Chong, և այլն
Հրապարակվել է: (2026)
: Xiang, Chong, և այլն
Հրապարակվել է: (2026)
System-Level Defense against Indirect Prompt Injection Attacks: An Information Flow Control Perspective
: Wu, Fangzhou, և այլն
Հրապարակվել է: (2024)
: Wu, Fangzhou, և այլն
Հրապարակվել է: (2024)
Hidden-in-Plain-Text: A Benchmark for Social-Web Indirect Prompt Injection in RAG
: Guo, Haoze, և այլն
Հրապարակվել է: (2026)
: Guo, Haoze, և այլն
Հրապարակվել է: (2026)
Backdoor-Powered Prompt Injection Attacks Nullify Defense Methods
: Chen, Yulin, և այլն
Հրապարակվել է: (2025)
: Chen, Yulin, և այլն
Հրապարակվել է: (2025)
Indirect Prompt Injection in the Wild: An Empirical Study of Prevalence, Techniques, and Objectives
: Khodayari, Soheil, և այլն
Հրապարակվել է: (2026)
: Khodayari, Soheil, և այլն
Հրապարակվել է: (2026)
AegisAgent: An Autonomous Defense Agent Against Prompt Injection Attacks in LLM-HARs
: Wang, Yihan, և այլն
Հրապարակվել է: (2025)
: Wang, Yihan, և այլն
Հրապարակվել է: (2025)
Defense Against Prompt Injection Attack by Leveraging Attack Techniques
: Chen, Yulin, և այլն
Հրապարակվել է: (2024)
: Chen, Yulin, և այլն
Հրապարակվել է: (2024)
WARD: Adversarially Robust Defense of Web Agents Against Prompt Injections
: Cao, Tri, և այլն
Հրապարակվել է: (2026)
: Cao, Tri, և այլն
Հրապարակվել է: (2026)
PlanGuard: Defending Agents against Indirect Prompt Injection via Planning-based Consistency Verification
: Gong, Guangyu, և այլն
Հրապարակվել է: (2026)
: Gong, Guangyu, և այլն
Հրապարակվել է: (2026)
AgentVigil: Generic Black-Box Red-teaming for Indirect Prompt Injection against LLM Agents
: Wang, Zhun, և այլն
Հրապարակվել է: (2025)
: Wang, Zhun, և այլն
Հրապարակվել է: (2025)
The Cognitive Firewall:Securing Browser Based AI Agents Against Indirect Prompt Injection Via Hybrid Edge Cloud Defense
: Lan, Qianlong, և այլն
Հրապարակվել է: (2026)
: Lan, Qianlong, և այլն
Հրապարակվել է: (2026)
AgentDojo: A Dynamic Environment to Evaluate Prompt Injection Attacks and Defenses for LLM Agents
: Debenedetti, Edoardo, և այլն
Հրապարակվել է: (2024)
: Debenedetti, Edoardo, և այլն
Հրապարակվել է: (2024)
Attention is All You Need to Defend Against Indirect Prompt Injection Attacks in LLMs
: Zhong, Yinan, և այլն
Հրապարակվել է: (2025)
: Zhong, Yinan, և այլն
Հրապարակվել է: (2025)
PINA: Prompt Injection Attack against Navigation Agents
: Liu, Jiani, և այլն
Հրապարակվել է: (2026)
: Liu, Jiani, և այլն
Հրապարակվել է: (2026)
Tracing the Dynamics of Refusal: Exploiting Latent Refusal Trajectories for Robust Jailbreak Detection
: Hu, Xulin, և այլն
Հրապարակվել է: (2026)
: Hu, Xulin, և այլն
Հրապարակվել է: (2026)
Defending against Indirect Prompt Injection by Instruction Detection
: Wen, Tongyu, և այլն
Հրապարակվել է: (2025)
: Wen, Tongyu, և այլն
Հրապարակվել է: (2025)
VortexPIA: Indirect Prompt Injection Attack against LLMs for Efficient Extraction of User Privacy
: Cui, Yu, և այլն
Հրապարակվել է: (2025)
: Cui, Yu, և այլն
Հրապարակվել է: (2025)
Verifiably Forgotten? Gradient Differences Still Enable Data Reconstruction in Federated Unlearning
: Zhang, Fuyao, և այլն
Հրապարակվել է: (2025)
: Zhang, Fuyao, և այլն
Հրապարակվել է: (2025)
ClawGuard: A Runtime Security Framework for Tool-Augmented LLM Agents Against Indirect Prompt Injection
: Zhao, Wei, և այլն
Հրապարակվել է: (2026)
: Zhao, Wei, և այլն
Հրապարակվել է: (2026)
Defending Against Prompt Injection With a Few DefensiveTokens
: Chen, Sizhe, և այլն
Հրապարակվել է: (2025)
: Chen, Sizhe, և այլն
Հրապարակվել է: (2025)
ARGUS: Defending Against Multimodal Indirect Prompt Injection via Steering Instruction-Following Behavior
: Lu, Weikai, և այլն
Հրապարակվել է: (2025)
: Lu, Weikai, և այլն
Հրապարակվել է: (2025)
LogJack: Indirect Prompt Injection Through Cloud Logs Against LLM Debugging Agents
: Shah, Harsh
Հրապարակվել է: (2026)
: Shah, Harsh
Հրապարակվել է: (2026)
PromptArmor: Simple yet Effective Prompt Injection Defenses
: Shi, Tianneng, և այլն
Հրապարակվել է: (2025)
: Shi, Tianneng, և այլն
Հրապարակվել է: (2025)
PISmith: Reinforcement Learning-based Red Teaming for Prompt Injection Defenses
: Yin, Chenlong, և այլն
Հրապարակվել է: (2026)
: Yin, Chenlong, և այլն
Հրապարակվել է: (2026)
LivePI: More Realistic Benchmarking of Agents Against Indirect Prompt Injection
: Zhao, Lei, և այլն
Հրապարակվել է: (2026)
: Zhao, Lei, և այլն
Հրապարակվել է: (2026)
AgentWatcher: A Rule-based Prompt Injection Monitor
: Wang, Yanting, և այլն
Հրապարակվել է: (2026)
: Wang, Yanting, և այլն
Հրապարակվել է: (2026)
AttriGuard: Defeating Indirect Prompt Injection in LLM Agents via Causal Attribution of Tool Invocations
: He, Yu, և այլն
Հրապարակվել է: (2026)
: He, Yu, և այլն
Հրապարակվել է: (2026)
InjecAgent: Benchmarking Indirect Prompt Injections in Tool-Integrated Large Language Model Agents
: Zhan, Qiusi, և այլն
Հրապարակվել է: (2024)
: Zhan, Qiusi, և այլն
Հրապարակվել է: (2024)
Indirect Prompt Injections: Are Firewalls All You Need, or Stronger Benchmarks?
: Bhagwatkar, Rishika, և այլն
Հրապարակվել է: (2025)
: Bhagwatkar, Rishika, և այլն
Հրապարակվել է: (2025)
PromptSleuth: Detecting Prompt Injection via Semantic Intent Invariance
: Wang, Mengxiao, և այլն
Հրապարակվել է: (2025)
: Wang, Mengxiao, և այլն
Հրապարակվել է: (2025)
Նմանատիպ նյութեր
-
AdapTools: Adaptive Tool-based Indirect Prompt Injection Attacks on Agentic LLMs
: Wang, Che, և այլն
Հրապարակվել է: (2026) -
DualTAP: A Dual-Task Adversarial Protector for Mobile MLLM Agents
: Zhang, Fuyao, և այլն
Հրապարակվել է: (2025) -
MELON: Provable Defense Against Indirect Prompt Injection Attacks in AI Agents
: Zhu, Kaijie, և այլն
Հրապարակվել է: (2025) -
VENOMREC: Cross-Modal Interactive Poisoning for Targeted Promotion in Multimodal LLM Recommender Systems
: Guan, Guowei, և այլն
Հրապարակվել է: (2026) -
FATH: Authentication-based Test-time Defense against Indirect Prompt Injection Attacks
: Wang, Jiongxiao, և այլն
Հրապարակվել է: (2024)