Salvato in:
| Autori principali: | Wu, Tongxi, Zhang, Jian, Gao, Yang |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2026
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2605.26158 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
Tracing the Dynamics of Refusal: Exploiting Latent Refusal Trajectories for Robust Jailbreak Detection
di: Hu, Xulin, et al.
Pubblicazione: (2026)
di: Hu, Xulin, et al.
Pubblicazione: (2026)
AlphaSteer: Learning Refusal Steering with Principled Null-Space Constraint
di: Sheng, Leheng, et al.
Pubblicazione: (2025)
di: Sheng, Leheng, et al.
Pubblicazione: (2025)
Semantic Intent Fragmentation: A Single-Shot Compositional Attack on Multi-Agent AI Pipelines
di: Ahad, Tanzim, et al.
Pubblicazione: (2026)
di: Ahad, Tanzim, et al.
Pubblicazione: (2026)
Relationship between Uncertainty in DNNs and Adversarial Attacks
di: Ogonna, Mabel, et al.
Pubblicazione: (2024)
di: Ogonna, Mabel, et al.
Pubblicazione: (2024)
On Membership Inference Attacks in Knowledge Distillation
di: Cui, Ziyao, et al.
Pubblicazione: (2025)
di: Cui, Ziyao, et al.
Pubblicazione: (2025)
Gradient Cuff: Detecting Jailbreak Attacks on Large Language Models by Exploring Refusal Loss Landscapes
di: Hu, Xiaomeng, et al.
Pubblicazione: (2024)
di: Hu, Xiaomeng, et al.
Pubblicazione: (2024)
MixGAN: A Hybrid Semi-Supervised and Generative Approach for DDoS Detection in Cloud-Integrated IoT Networks
di: Wu, Tongxi, et al.
Pubblicazione: (2025)
di: Wu, Tongxi, et al.
Pubblicazione: (2025)
Structure-Aware Distributed Backdoor Attacks in Federated Learning
di: Jian, Wang, et al.
Pubblicazione: (2026)
di: Jian, Wang, et al.
Pubblicazione: (2026)
The Dark Side of Digital Twins: Adversarial Attacks on AI-Driven Water Forecasting
di: Homaei, Mohammadhossein, et al.
Pubblicazione: (2025)
di: Homaei, Mohammadhossein, et al.
Pubblicazione: (2025)
Verification of Bit-Flip Attacks against Quantized Neural Networks
di: Zhang, Yedi, et al.
Pubblicazione: (2025)
di: Zhang, Yedi, et al.
Pubblicazione: (2025)
EAB-FL: Exacerbating Algorithmic Bias through Model Poisoning Attacks in Federated Learning
di: Meerza, Syed Irfan Ali, et al.
Pubblicazione: (2024)
di: Meerza, Syed Irfan Ali, et al.
Pubblicazione: (2024)
Quantifying the Noise of Structural Perturbations on Graph Adversarial Attacks
di: Fang, Junyuan, et al.
Pubblicazione: (2025)
di: Fang, Junyuan, et al.
Pubblicazione: (2025)
Diffusion-Driven Synthetic Tabular Data Generation for Enhanced DoS/DDoS Attack Classification
di: B, Aravind, et al.
Pubblicazione: (2026)
di: B, Aravind, et al.
Pubblicazione: (2026)
Trusted Weights, Treacherous Optimizations? Optimization-Triggered Backdoor Attacks on LLMs
di: Wang, Yifei, et al.
Pubblicazione: (2026)
di: Wang, Yifei, et al.
Pubblicazione: (2026)
SoK: Benchmarking Poisoning Attacks and Defenses in Federated Learning
di: Zhang, Heyi, et al.
Pubblicazione: (2025)
di: Zhang, Heyi, et al.
Pubblicazione: (2025)
Revisiting Backdoor Attacks on Time Series Classification in the Frequency Domain
di: Huang, Yuanmin, et al.
Pubblicazione: (2025)
di: Huang, Yuanmin, et al.
Pubblicazione: (2025)
GI-PIP: Do We Require Impractical Auxiliary Dataset for Gradient Inversion Attacks?
di: Sun, Yu, et al.
Pubblicazione: (2024)
di: Sun, Yu, et al.
Pubblicazione: (2024)
Disttack: Graph Adversarial Attacks Toward Distributed GNN Training
di: Zhang, Yuxiang, et al.
Pubblicazione: (2024)
di: Zhang, Yuxiang, et al.
Pubblicazione: (2024)
Turning Bias into Bugs: Bandit-Guided Style Manipulation Attacks on LLM Judges
di: Yang, Xianglin, et al.
Pubblicazione: (2026)
di: Yang, Xianglin, et al.
Pubblicazione: (2026)
Unlearning Inversion Attacks for Graph Neural Networks
di: Zhang, Jiahao, et al.
Pubblicazione: (2025)
di: Zhang, Jiahao, et al.
Pubblicazione: (2025)
Guiding not Forcing: Enhancing the Transferability of Jailbreaking Attacks on LLMs via Removing Superfluous Constraints
di: Yang, Junxiao, et al.
Pubblicazione: (2025)
di: Yang, Junxiao, et al.
Pubblicazione: (2025)
Winning the MIDST Challenge: New Membership Inference Attacks on Diffusion Models for Tabular Data Synthesis
di: Wu, Xiaoyu, et al.
Pubblicazione: (2025)
di: Wu, Xiaoyu, et al.
Pubblicazione: (2025)
DCMI: A Differential Calibration Membership Inference Attack Against Retrieval-Augmented Generation
di: Gao, Xinyu, et al.
Pubblicazione: (2025)
di: Gao, Xinyu, et al.
Pubblicazione: (2025)
UIFV: Data Reconstruction Attack in Vertical Federated Learning
di: Yang, Jirui, et al.
Pubblicazione: (2024)
di: Yang, Jirui, et al.
Pubblicazione: (2024)
Membership Inference Attack with Partial Features
di: Wang, Xurun, et al.
Pubblicazione: (2025)
di: Wang, Xurun, et al.
Pubblicazione: (2025)
Crypto Miner Attack: GPU Remote Code Execution Attacks
di: Szabo, Ariel, et al.
Pubblicazione: (2025)
di: Szabo, Ariel, et al.
Pubblicazione: (2025)
Remote Rowhammer Attack using Adversarial Observations on Federated Learning Clients
di: Yuan, Jinsheng, et al.
Pubblicazione: (2025)
di: Yuan, Jinsheng, et al.
Pubblicazione: (2025)
Compromising Embodied Agents with Contextual Backdoor Attacks
di: Liu, Aishan, et al.
Pubblicazione: (2024)
di: Liu, Aishan, et al.
Pubblicazione: (2024)
RoBCtrl: Attacking GNN-Based Social Bot Detectors via Reinforced Manipulation of Bots Control Interaction
di: Yang, Yingguang, et al.
Pubblicazione: (2025)
di: Yang, Yingguang, et al.
Pubblicazione: (2025)
AGSOA:Graph Neural Network Targeted Attack Based on Average Gradient and Structure Optimization
di: Chen, Yang, et al.
Pubblicazione: (2024)
di: Chen, Yang, et al.
Pubblicazione: (2024)
Can Differentially Private Fine-tuning LLMs Protect Against Privacy Attacks?
di: Du, Hao, et al.
Pubblicazione: (2025)
di: Du, Hao, et al.
Pubblicazione: (2025)
Jailbreaking GPT-4V via Self-Adversarial Attacks with System Prompts
di: Wu, Yuanwei, et al.
Pubblicazione: (2023)
di: Wu, Yuanwei, et al.
Pubblicazione: (2023)
Backdoor Attack on Vertical Federated Graph Neural Network Learning
di: Yang, Jirui, et al.
Pubblicazione: (2024)
di: Yang, Jirui, et al.
Pubblicazione: (2024)
Beyond Single-Agent Alignment: Preventing Context-Fragmented Violations in Multi-Agent Systems
di: Wu, Jie, et al.
Pubblicazione: (2026)
di: Wu, Jie, et al.
Pubblicazione: (2026)
Data Overvaluation Attack and Truthful Data Valuation in Federated Learning
di: Zheng, Shuyuan, et al.
Pubblicazione: (2025)
di: Zheng, Shuyuan, et al.
Pubblicazione: (2025)
Best-of-Venom: Attacking RLHF by Injecting Poisoned Preference Data
di: Baumgärtner, Tim, et al.
Pubblicazione: (2024)
di: Baumgärtner, Tim, et al.
Pubblicazione: (2024)
Shadowcast: Stealthy Data Poisoning Attacks Against Vision-Language Models
di: Xu, Yuancheng, et al.
Pubblicazione: (2024)
di: Xu, Yuancheng, et al.
Pubblicazione: (2024)
Attacking LLMs and AI Agents: Advertisement Embedding Attacks Against Large Language Models
di: Guo, Qiming, et al.
Pubblicazione: (2025)
di: Guo, Qiming, et al.
Pubblicazione: (2025)
Prompt-Induced Over-Generation as Denial-of-Service: A Black-Box Attack-Side Benchmark
di: Manu, et al.
Pubblicazione: (2025)
di: Manu, et al.
Pubblicazione: (2025)
Enhancing Security in Deep Reinforcement Learning: A Comprehensive Survey on Adversarial Attacks and Defenses
di: Yichao, Wu, et al.
Pubblicazione: (2025)
di: Yichao, Wu, et al.
Pubblicazione: (2025)
Documenti analoghi
-
Tracing the Dynamics of Refusal: Exploiting Latent Refusal Trajectories for Robust Jailbreak Detection
di: Hu, Xulin, et al.
Pubblicazione: (2026) -
AlphaSteer: Learning Refusal Steering with Principled Null-Space Constraint
di: Sheng, Leheng, et al.
Pubblicazione: (2025) -
Semantic Intent Fragmentation: A Single-Shot Compositional Attack on Multi-Agent AI Pipelines
di: Ahad, Tanzim, et al.
Pubblicazione: (2026) -
Relationship between Uncertainty in DNNs and Adversarial Attacks
di: Ogonna, Mabel, et al.
Pubblicazione: (2024) -
On Membership Inference Attacks in Knowledge Distillation
di: Cui, Ziyao, et al.
Pubblicazione: (2025)