:: Library Catalog

Copertina

Salvato in:

Dettagli Bibliografici
Autori principali:	Jiang, Junyong, Tian, Buwei, Xu, Chenxing, Li, Songze, Dong, Lu
Natura:	Preprint
Pubblicazione:	2025
Soggetti:	Machine Learning
Accesso online:	https://arxiv.org/abs/2507.18113
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Documenti analoghi

Rethinking Adversarial Attacks in Reinforcement Learning from Policy Distribution Perspective
di: Duan, Tianyang, et al.
Pubblicazione: (2025)

Off-Policy Value-Based Reinforcement Learning for Large Language Models
di: Wang, Peng-Yuan, et al.
Pubblicazione: (2026)

TooBadRL: Trigger Optimization to Boost Effectiveness of Backdoor Attacks on Deep Reinforcement Learning
di: Zhang, Mingxuan, et al.
Pubblicazione: (2025)

Dynamic Adversarial Reinforcement Learning for Robust Multimodal Large Language Models
di: Bao, Yicheng, et al.
Pubblicazione: (2026)

Constructing Adversarial Examples for Vertical Federated Learning: Optimal Client Corruption through Multi-Armed Bandit
di: Yao, Duanyi, et al.
Pubblicazione: (2024)

MSfusion: A Dynamic Model Splitting Approach for Resource-Constrained Machines to Collaboratively Train Larger Models
di: Xie, Jin, et al.
Pubblicazione: (2024)

Knowledge-Driven Multi-Turn Jailbreaking on Large Language Models
di: Li, Songze, et al.
Pubblicazione: (2026)

Noise as a Probe: Membership Inference Attacks on Diffusion Models Leveraging Initial Noise
di: Lian, Puwei, et al.
Pubblicazione: (2026)

Enhancing Membership Inference Attacks on Diffusion Models from a Frequency-Domain Perspective
di: Lian, Puwei, et al.
Pubblicazione: (2025)

URVFL: Undetectable Data Reconstruction Attack on Vertical Federated Learning
di: Yao, Duanyi, et al.
Pubblicazione: (2024)

Towards Robust Policy: Enhancing Offline Reinforcement Learning with Adversarial Attacks and Defenses
di: Nguyen, Thanh, et al.
Pubblicazione: (2024)

Adversarial Reinforcement Learning for Large Language Model Agent Safety
di: Wang, Zizhao, et al.
Pubblicazione: (2025)

TOP-ERL: Transformer-based Off-Policy Episodic Reinforcement Learning
di: Li, Ge, et al.
Pubblicazione: (2024)

Provably Invincible Adversarial Attacks on Reinforcement Learning Systems: A Rate-Distortion Information-Theoretic Approach
di: Lu, Ziqing, et al.
Pubblicazione: (2025)

Adversarial Contrastive Learning for LLM Quantization Attacks
di: Song, Dinghong, et al.
Pubblicazione: (2026)

Sampling-aware Adversarial Attacks Against Large Language Models
di: Beyer, Tim, et al.
Pubblicazione: (2025)

Reinforcement Learning with Promising Tokens for Large Language Models
di: Pang, Jing-Cheng, et al.
Pubblicazione: (2026)

The Resurgence of GCG Adversarial Attacks on Large Language Models
di: Tan, Yuting, et al.
Pubblicazione: (2025)

DarkLLM: Learning Language-Driven Adversarial Attacks with Large Language Models
di: Sun, Ye, et al.
Pubblicazione: (2026)

DiffPoGAN: Diffusion Policies with Generative Adversarial Networks for Offline Reinforcement Learning
di: Hu, Xuemin, et al.
Pubblicazione: (2024)

Towards Client Driven Federated Learning
di: Li, Songze, et al.
Pubblicazione: (2024)

Adversarial Evasion Attack Efficiency against Large Language Models
di: Vitorino, João, et al.
Pubblicazione: (2024)

Attacking Cooperative Multi-Agent Reinforcement Learning by Adversarial Minority Influence
di: Li, Simin, et al.
Pubblicazione: (2023)

Toward Evaluating Robustness of Reinforcement Learning with Adversarial Policy
di: Zheng, Xiang, et al.
Pubblicazione: (2023)

Box Thirding: Anytime Best Arm Identification under Insufficient Sampling
di: Hwang, Seohwa, et al.
Pubblicazione: (2026)

FedMeS: Personalized Federated Continual Learning Leveraging Local Memory
di: Xie, Jin, et al.
Pubblicazione: (2024)

Adversarial Inception Backdoor Attacks against Reinforcement Learning
di: Rathbun, Ethan, et al.
Pubblicazione: (2024)

Beyond Suffixes: Token Position in GCG Adversarial Attacks on Large Language Models
di: Eddoubi, Hicham, et al.
Pubblicazione: (2026)

REINFORCE Adversarial Attacks on Large Language Models: An Adaptive, Distributional, and Semantic Objective
di: Geisler, Simon, et al.
Pubblicazione: (2025)

Exploring Modality Disruption in Multimodal Fake News Detection
di: Liu, Moyang, et al.
Pubblicazione: (2025)

TernaryLLM: Ternarized Large Language Model
di: Chen, Tianqi, et al.
Pubblicazione: (2024)

Causal Policy Learning in Reinforcement Learning: Backdoor-Adjusted Soft Actor-Critic
di: Vo, Thanh Vinh, et al.
Pubblicazione: (2025)

Break the Visual Perception: Adversarial Attacks Targeting Encoded Visual Tokens of Large Vision-Language Models
di: Wang, Yubo, et al.
Pubblicazione: (2024)

Mildly Constrained Evaluation Policy for Offline Reinforcement Learning
di: Xu, Linjie, et al.
Pubblicazione: (2023)

Attributing and Exploiting Safety Vectors through Global Optimization in Large Language Models
di: Chu, Fengheng, et al.
Pubblicazione: (2026)

Adversarially Trained Weighted Actor-Critic for Safe Offline Reinforcement Learning
di: Wei, Honghao, et al.
Pubblicazione: (2024)

Universal and Transferable Adversarial Attack on Large Language Models Using Exponentiated Gradient Descent
di: Biswas, Sajib, et al.
Pubblicazione: (2025)

ReMax: A Simple, Effective, and Efficient Reinforcement Learning Method for Aligning Large Language Models
di: Li, Ziniu, et al.
Pubblicazione: (2023)

POLAR: Policy-based Layerwise Reinforcement Learning Method for Stealthy Backdoor Attacks in Federated Learning
di: Yu, Kuai, et al.
Pubblicazione: (2025)

Self-Hinting Language Models Enhance Reinforcement Learning
di: Liao, Baohao, et al.
Pubblicazione: (2026)