:: Library Catalog

Copertina

Salvato in:

Dettagli Bibliografici
Autori principali:	Wu, Tongxi, Zhang, Jian, Gao, Yang
Natura:	Preprint
Pubblicazione:	2026
Soggetti:	Cryptography and Security Artificial Intelligence Machine Learning
Accesso online:	https://arxiv.org/abs/2605.26158
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Documenti analoghi

Tracing the Dynamics of Refusal: Exploiting Latent Refusal Trajectories for Robust Jailbreak Detection
di: Hu, Xulin, et al.
Pubblicazione: (2026)

AlphaSteer: Learning Refusal Steering with Principled Null-Space Constraint
di: Sheng, Leheng, et al.
Pubblicazione: (2025)

Semantic Intent Fragmentation: A Single-Shot Compositional Attack on Multi-Agent AI Pipelines
di: Ahad, Tanzim, et al.
Pubblicazione: (2026)

Relationship between Uncertainty in DNNs and Adversarial Attacks
di: Ogonna, Mabel, et al.
Pubblicazione: (2024)

On Membership Inference Attacks in Knowledge Distillation
di: Cui, Ziyao, et al.
Pubblicazione: (2025)

Gradient Cuff: Detecting Jailbreak Attacks on Large Language Models by Exploring Refusal Loss Landscapes
di: Hu, Xiaomeng, et al.
Pubblicazione: (2024)

MixGAN: A Hybrid Semi-Supervised and Generative Approach for DDoS Detection in Cloud-Integrated IoT Networks
di: Wu, Tongxi, et al.
Pubblicazione: (2025)

Structure-Aware Distributed Backdoor Attacks in Federated Learning
di: Jian, Wang, et al.
Pubblicazione: (2026)

The Dark Side of Digital Twins: Adversarial Attacks on AI-Driven Water Forecasting
di: Homaei, Mohammadhossein, et al.
Pubblicazione: (2025)

Verification of Bit-Flip Attacks against Quantized Neural Networks
di: Zhang, Yedi, et al.
Pubblicazione: (2025)

EAB-FL: Exacerbating Algorithmic Bias through Model Poisoning Attacks in Federated Learning
di: Meerza, Syed Irfan Ali, et al.
Pubblicazione: (2024)

Quantifying the Noise of Structural Perturbations on Graph Adversarial Attacks
di: Fang, Junyuan, et al.
Pubblicazione: (2025)

Diffusion-Driven Synthetic Tabular Data Generation for Enhanced DoS/DDoS Attack Classification
di: B, Aravind, et al.
Pubblicazione: (2026)

Trusted Weights, Treacherous Optimizations? Optimization-Triggered Backdoor Attacks on LLMs
di: Wang, Yifei, et al.
Pubblicazione: (2026)

SoK: Benchmarking Poisoning Attacks and Defenses in Federated Learning
di: Zhang, Heyi, et al.
Pubblicazione: (2025)

Revisiting Backdoor Attacks on Time Series Classification in the Frequency Domain
di: Huang, Yuanmin, et al.
Pubblicazione: (2025)

GI-PIP: Do We Require Impractical Auxiliary Dataset for Gradient Inversion Attacks?
di: Sun, Yu, et al.
Pubblicazione: (2024)

Disttack: Graph Adversarial Attacks Toward Distributed GNN Training
di: Zhang, Yuxiang, et al.
Pubblicazione: (2024)

Turning Bias into Bugs: Bandit-Guided Style Manipulation Attacks on LLM Judges
di: Yang, Xianglin, et al.
Pubblicazione: (2026)

Unlearning Inversion Attacks for Graph Neural Networks
di: Zhang, Jiahao, et al.
Pubblicazione: (2025)

Guiding not Forcing: Enhancing the Transferability of Jailbreaking Attacks on LLMs via Removing Superfluous Constraints
di: Yang, Junxiao, et al.
Pubblicazione: (2025)

Winning the MIDST Challenge: New Membership Inference Attacks on Diffusion Models for Tabular Data Synthesis
di: Wu, Xiaoyu, et al.
Pubblicazione: (2025)

DCMI: A Differential Calibration Membership Inference Attack Against Retrieval-Augmented Generation
di: Gao, Xinyu, et al.
Pubblicazione: (2025)

UIFV: Data Reconstruction Attack in Vertical Federated Learning
di: Yang, Jirui, et al.
Pubblicazione: (2024)

Membership Inference Attack with Partial Features
di: Wang, Xurun, et al.
Pubblicazione: (2025)

Crypto Miner Attack: GPU Remote Code Execution Attacks
di: Szabo, Ariel, et al.
Pubblicazione: (2025)

Remote Rowhammer Attack using Adversarial Observations on Federated Learning Clients
di: Yuan, Jinsheng, et al.
Pubblicazione: (2025)

Compromising Embodied Agents with Contextual Backdoor Attacks
di: Liu, Aishan, et al.
Pubblicazione: (2024)

RoBCtrl: Attacking GNN-Based Social Bot Detectors via Reinforced Manipulation of Bots Control Interaction
di: Yang, Yingguang, et al.
Pubblicazione: (2025)

AGSOA:Graph Neural Network Targeted Attack Based on Average Gradient and Structure Optimization
di: Chen, Yang, et al.
Pubblicazione: (2024)

Can Differentially Private Fine-tuning LLMs Protect Against Privacy Attacks?
di: Du, Hao, et al.
Pubblicazione: (2025)

Jailbreaking GPT-4V via Self-Adversarial Attacks with System Prompts
di: Wu, Yuanwei, et al.
Pubblicazione: (2023)

Backdoor Attack on Vertical Federated Graph Neural Network Learning
di: Yang, Jirui, et al.
Pubblicazione: (2024)

Beyond Single-Agent Alignment: Preventing Context-Fragmented Violations in Multi-Agent Systems
di: Wu, Jie, et al.
Pubblicazione: (2026)

Data Overvaluation Attack and Truthful Data Valuation in Federated Learning
di: Zheng, Shuyuan, et al.
Pubblicazione: (2025)

Best-of-Venom: Attacking RLHF by Injecting Poisoned Preference Data
di: Baumgärtner, Tim, et al.
Pubblicazione: (2024)

Shadowcast: Stealthy Data Poisoning Attacks Against Vision-Language Models
di: Xu, Yuancheng, et al.
Pubblicazione: (2024)

Attacking LLMs and AI Agents: Advertisement Embedding Attacks Against Large Language Models
di: Guo, Qiming, et al.
Pubblicazione: (2025)

Prompt-Induced Over-Generation as Denial-of-Service: A Black-Box Attack-Side Benchmark
di: Manu, et al.
Pubblicazione: (2025)

Enhancing Security in Deep Reinforcement Learning: A Comprehensive Survey on Adversarial Attacks and Defenses
di: Yichao, Wu, et al.
Pubblicazione: (2025)