Salvato in:
| Autori principali: | Jiang, Junyong, Tian, Buwei, Xu, Chenxing, Li, Songze, Dong, Lu |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2025
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2507.18113 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
Rethinking Adversarial Attacks in Reinforcement Learning from Policy Distribution Perspective
di: Duan, Tianyang, et al.
Pubblicazione: (2025)
di: Duan, Tianyang, et al.
Pubblicazione: (2025)
Off-Policy Value-Based Reinforcement Learning for Large Language Models
di: Wang, Peng-Yuan, et al.
Pubblicazione: (2026)
di: Wang, Peng-Yuan, et al.
Pubblicazione: (2026)
TooBadRL: Trigger Optimization to Boost Effectiveness of Backdoor Attacks on Deep Reinforcement Learning
di: Zhang, Mingxuan, et al.
Pubblicazione: (2025)
di: Zhang, Mingxuan, et al.
Pubblicazione: (2025)
Dynamic Adversarial Reinforcement Learning for Robust Multimodal Large Language Models
di: Bao, Yicheng, et al.
Pubblicazione: (2026)
di: Bao, Yicheng, et al.
Pubblicazione: (2026)
Constructing Adversarial Examples for Vertical Federated Learning: Optimal Client Corruption through Multi-Armed Bandit
di: Yao, Duanyi, et al.
Pubblicazione: (2024)
di: Yao, Duanyi, et al.
Pubblicazione: (2024)
MSfusion: A Dynamic Model Splitting Approach for Resource-Constrained Machines to Collaboratively Train Larger Models
di: Xie, Jin, et al.
Pubblicazione: (2024)
di: Xie, Jin, et al.
Pubblicazione: (2024)
Knowledge-Driven Multi-Turn Jailbreaking on Large Language Models
di: Li, Songze, et al.
Pubblicazione: (2026)
di: Li, Songze, et al.
Pubblicazione: (2026)
Noise as a Probe: Membership Inference Attacks on Diffusion Models Leveraging Initial Noise
di: Lian, Puwei, et al.
Pubblicazione: (2026)
di: Lian, Puwei, et al.
Pubblicazione: (2026)
Enhancing Membership Inference Attacks on Diffusion Models from a Frequency-Domain Perspective
di: Lian, Puwei, et al.
Pubblicazione: (2025)
di: Lian, Puwei, et al.
Pubblicazione: (2025)
URVFL: Undetectable Data Reconstruction Attack on Vertical Federated Learning
di: Yao, Duanyi, et al.
Pubblicazione: (2024)
di: Yao, Duanyi, et al.
Pubblicazione: (2024)
Towards Robust Policy: Enhancing Offline Reinforcement Learning with Adversarial Attacks and Defenses
di: Nguyen, Thanh, et al.
Pubblicazione: (2024)
di: Nguyen, Thanh, et al.
Pubblicazione: (2024)
Adversarial Reinforcement Learning for Large Language Model Agent Safety
di: Wang, Zizhao, et al.
Pubblicazione: (2025)
di: Wang, Zizhao, et al.
Pubblicazione: (2025)
TOP-ERL: Transformer-based Off-Policy Episodic Reinforcement Learning
di: Li, Ge, et al.
Pubblicazione: (2024)
di: Li, Ge, et al.
Pubblicazione: (2024)
Provably Invincible Adversarial Attacks on Reinforcement Learning Systems: A Rate-Distortion Information-Theoretic Approach
di: Lu, Ziqing, et al.
Pubblicazione: (2025)
di: Lu, Ziqing, et al.
Pubblicazione: (2025)
Adversarial Contrastive Learning for LLM Quantization Attacks
di: Song, Dinghong, et al.
Pubblicazione: (2026)
di: Song, Dinghong, et al.
Pubblicazione: (2026)
Sampling-aware Adversarial Attacks Against Large Language Models
di: Beyer, Tim, et al.
Pubblicazione: (2025)
di: Beyer, Tim, et al.
Pubblicazione: (2025)
Reinforcement Learning with Promising Tokens for Large Language Models
di: Pang, Jing-Cheng, et al.
Pubblicazione: (2026)
di: Pang, Jing-Cheng, et al.
Pubblicazione: (2026)
The Resurgence of GCG Adversarial Attacks on Large Language Models
di: Tan, Yuting, et al.
Pubblicazione: (2025)
di: Tan, Yuting, et al.
Pubblicazione: (2025)
DarkLLM: Learning Language-Driven Adversarial Attacks with Large Language Models
di: Sun, Ye, et al.
Pubblicazione: (2026)
di: Sun, Ye, et al.
Pubblicazione: (2026)
DiffPoGAN: Diffusion Policies with Generative Adversarial Networks for Offline Reinforcement Learning
di: Hu, Xuemin, et al.
Pubblicazione: (2024)
di: Hu, Xuemin, et al.
Pubblicazione: (2024)
Towards Client Driven Federated Learning
di: Li, Songze, et al.
Pubblicazione: (2024)
di: Li, Songze, et al.
Pubblicazione: (2024)
Adversarial Evasion Attack Efficiency against Large Language Models
di: Vitorino, João, et al.
Pubblicazione: (2024)
di: Vitorino, João, et al.
Pubblicazione: (2024)
Attacking Cooperative Multi-Agent Reinforcement Learning by Adversarial Minority Influence
di: Li, Simin, et al.
Pubblicazione: (2023)
di: Li, Simin, et al.
Pubblicazione: (2023)
Toward Evaluating Robustness of Reinforcement Learning with Adversarial Policy
di: Zheng, Xiang, et al.
Pubblicazione: (2023)
di: Zheng, Xiang, et al.
Pubblicazione: (2023)
Box Thirding: Anytime Best Arm Identification under Insufficient Sampling
di: Hwang, Seohwa, et al.
Pubblicazione: (2026)
di: Hwang, Seohwa, et al.
Pubblicazione: (2026)
FedMeS: Personalized Federated Continual Learning Leveraging Local Memory
di: Xie, Jin, et al.
Pubblicazione: (2024)
di: Xie, Jin, et al.
Pubblicazione: (2024)
Adversarial Inception Backdoor Attacks against Reinforcement Learning
di: Rathbun, Ethan, et al.
Pubblicazione: (2024)
di: Rathbun, Ethan, et al.
Pubblicazione: (2024)
Beyond Suffixes: Token Position in GCG Adversarial Attacks on Large Language Models
di: Eddoubi, Hicham, et al.
Pubblicazione: (2026)
di: Eddoubi, Hicham, et al.
Pubblicazione: (2026)
REINFORCE Adversarial Attacks on Large Language Models: An Adaptive, Distributional, and Semantic Objective
di: Geisler, Simon, et al.
Pubblicazione: (2025)
di: Geisler, Simon, et al.
Pubblicazione: (2025)
Exploring Modality Disruption in Multimodal Fake News Detection
di: Liu, Moyang, et al.
Pubblicazione: (2025)
di: Liu, Moyang, et al.
Pubblicazione: (2025)
TernaryLLM: Ternarized Large Language Model
di: Chen, Tianqi, et al.
Pubblicazione: (2024)
di: Chen, Tianqi, et al.
Pubblicazione: (2024)
Causal Policy Learning in Reinforcement Learning: Backdoor-Adjusted Soft Actor-Critic
di: Vo, Thanh Vinh, et al.
Pubblicazione: (2025)
di: Vo, Thanh Vinh, et al.
Pubblicazione: (2025)
Break the Visual Perception: Adversarial Attacks Targeting Encoded Visual Tokens of Large Vision-Language Models
di: Wang, Yubo, et al.
Pubblicazione: (2024)
di: Wang, Yubo, et al.
Pubblicazione: (2024)
Mildly Constrained Evaluation Policy for Offline Reinforcement Learning
di: Xu, Linjie, et al.
Pubblicazione: (2023)
di: Xu, Linjie, et al.
Pubblicazione: (2023)
Attributing and Exploiting Safety Vectors through Global Optimization in Large Language Models
di: Chu, Fengheng, et al.
Pubblicazione: (2026)
di: Chu, Fengheng, et al.
Pubblicazione: (2026)
Adversarially Trained Weighted Actor-Critic for Safe Offline Reinforcement Learning
di: Wei, Honghao, et al.
Pubblicazione: (2024)
di: Wei, Honghao, et al.
Pubblicazione: (2024)
Universal and Transferable Adversarial Attack on Large Language Models Using Exponentiated Gradient Descent
di: Biswas, Sajib, et al.
Pubblicazione: (2025)
di: Biswas, Sajib, et al.
Pubblicazione: (2025)
ReMax: A Simple, Effective, and Efficient Reinforcement Learning Method for Aligning Large Language Models
di: Li, Ziniu, et al.
Pubblicazione: (2023)
di: Li, Ziniu, et al.
Pubblicazione: (2023)
POLAR: Policy-based Layerwise Reinforcement Learning Method for Stealthy Backdoor Attacks in Federated Learning
di: Yu, Kuai, et al.
Pubblicazione: (2025)
di: Yu, Kuai, et al.
Pubblicazione: (2025)
Self-Hinting Language Models Enhance Reinforcement Learning
di: Liao, Baohao, et al.
Pubblicazione: (2026)
di: Liao, Baohao, et al.
Pubblicazione: (2026)
Documenti analoghi
-
Rethinking Adversarial Attacks in Reinforcement Learning from Policy Distribution Perspective
di: Duan, Tianyang, et al.
Pubblicazione: (2025) -
Off-Policy Value-Based Reinforcement Learning for Large Language Models
di: Wang, Peng-Yuan, et al.
Pubblicazione: (2026) -
TooBadRL: Trigger Optimization to Boost Effectiveness of Backdoor Attacks on Deep Reinforcement Learning
di: Zhang, Mingxuan, et al.
Pubblicazione: (2025) -
Dynamic Adversarial Reinforcement Learning for Robust Multimodal Large Language Models
di: Bao, Yicheng, et al.
Pubblicazione: (2026) -
Constructing Adversarial Examples for Vertical Federated Learning: Optimal Client Corruption through Multi-Armed Bandit
di: Yao, Duanyi, et al.
Pubblicazione: (2024)