Gespeichert in:
| Hauptverfasser: | Chai, Yidong, Liu, Yi, Ebrahimi, Mohammadreza, Li, Weifeng, Padmanabhan, Balaji |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2025
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2512.17367 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
From Machine Learning to Machine Unlearning: Complying with GDPR's Right to be Forgotten while Maintaining Business Value of Predictive Models
von: Yang, Yuncong, et al.
Veröffentlicht: (2024)
von: Yang, Yuncong, et al.
Veröffentlicht: (2024)
Adversarially-Aware Architecture Design for Robust Medical AI Systems
von: Gerhart, Alyssa, et al.
Veröffentlicht: (2025)
von: Gerhart, Alyssa, et al.
Veröffentlicht: (2025)
Optimal Transport Regularized Divergences: Application to Adversarial Robustness
von: Birrell, Jeremiah, et al.
Veröffentlicht: (2023)
von: Birrell, Jeremiah, et al.
Veröffentlicht: (2023)
Information-Consistent Language Model Recommendations through Group Relative Policy Optimization
von: Prabhune, Sonal, et al.
Veröffentlicht: (2025)
von: Prabhune, Sonal, et al.
Veröffentlicht: (2025)
Benchmarking the Robustness of Agentic Systems to Adversarially-Induced Harms
von: Nöther, Jonathan, et al.
Veröffentlicht: (2025)
von: Nöther, Jonathan, et al.
Veröffentlicht: (2025)
The Surprising Harmfulness of Benign Overfitting for Adversarial Robustness
von: Hao, Yifan, et al.
Veröffentlicht: (2024)
von: Hao, Yifan, et al.
Veröffentlicht: (2024)
ChineseHarm-Bench: A Chinese Harmful Content Detection Benchmark
von: Liu, Kangwei, et al.
Veröffentlicht: (2025)
von: Liu, Kangwei, et al.
Veröffentlicht: (2025)
CEAR: Certified Ensemble Adversarial Robustness in DNNs
von: Sadig, Daniel, et al.
Veröffentlicht: (2026)
von: Sadig, Daniel, et al.
Veröffentlicht: (2026)
Evading Deep Learning-Based Malware Detectors via Obfuscation: A Deep Reinforcement Learning Approach
von: Etter, Brian, et al.
Veröffentlicht: (2024)
von: Etter, Brian, et al.
Veröffentlicht: (2024)
Harmful Visual Content Manipulation Matters in Misinformation Detection Under Multimedia Scenarios
von: Wang, Bing, et al.
Veröffentlicht: (2026)
von: Wang, Bing, et al.
Veröffentlicht: (2026)
Towards Trustworthy Web Attack Detection: An Uncertainty-Aware Ensemble Deep Kernel Learning Model
von: Zhou, Yonghang, et al.
Veröffentlicht: (2024)
von: Zhou, Yonghang, et al.
Veröffentlicht: (2024)
Latent Adversarial Training Improves Robustness to Persistent Harmful Behaviors in LLMs
von: Sheshadri, Abhay, et al.
Veröffentlicht: (2024)
von: Sheshadri, Abhay, et al.
Veröffentlicht: (2024)
Detecting Fake News on Social Media: A Novel Reliability Aware Machine-Crowd Hybrid Intelligence-Based Method
von: Chai, Yidong, et al.
Veröffentlicht: (2024)
von: Chai, Yidong, et al.
Veröffentlicht: (2024)
Collaborative Management for Chronic Diseases and Depression: A Double Heterogeneity-based Multi-Task Learning Method
von: Chai, Yidong, et al.
Veröffentlicht: (2025)
von: Chai, Yidong, et al.
Veröffentlicht: (2025)
DariMis: Harm-Aware Modeling for Dari Misinformation Detection on YouTube
von: Baktash, Jawid Ahmad, et al.
Veröffentlicht: (2026)
von: Baktash, Jawid Ahmad, et al.
Veröffentlicht: (2026)
NERO-Net: A Neuroevolutionary Approach for the Design of Adversarially Robust CNNs
von: Valentim, Inês, et al.
Veröffentlicht: (2026)
von: Valentim, Inês, et al.
Veröffentlicht: (2026)
A Whole-Process Certifiably Robust Aggregation Method Against Backdoor Attacks in Federated Learning
von: Zhou, Anqi, et al.
Veröffentlicht: (2024)
von: Zhou, Anqi, et al.
Veröffentlicht: (2024)
High-Pass Graph Convolutional Network for Enhanced Anomaly Detection: A Novel Approach
von: Li, Shelei, et al.
Veröffentlicht: (2024)
von: Li, Shelei, et al.
Veröffentlicht: (2024)
A Bayesian Hybrid Parameter-Efficient Fine-Tuning Method for Large Language Models
von: Chai, Yidong, et al.
Veröffentlicht: (2025)
von: Chai, Yidong, et al.
Veröffentlicht: (2025)
Short-Form Videos and Mental Health: A Knowledge-Guided Neural Topic Model
von: Xie, Jiaheng, et al.
Veröffentlicht: (2024)
von: Xie, Jiaheng, et al.
Veröffentlicht: (2024)
SocialDF: Benchmark Dataset and Detection Model for Mitigating Harmful Deepfake Content on Social Media Platforms
von: Batra, Arnesh, et al.
Veröffentlicht: (2025)
von: Batra, Arnesh, et al.
Veröffentlicht: (2025)
A Novel Plug-and-Play Approach for Adversarially Robust Generalization
von: Maurya, Deepak, et al.
Veröffentlicht: (2022)
von: Maurya, Deepak, et al.
Veröffentlicht: (2022)
Detecting fake accounts through Generative Adversarial Network in online social media
von: Bordbar, Jinus, et al.
Veröffentlicht: (2022)
von: Bordbar, Jinus, et al.
Veröffentlicht: (2022)
Trading Inference-Time Compute for Adversarial Robustness
von: Zaremba, Wojciech, et al.
Veröffentlicht: (2025)
von: Zaremba, Wojciech, et al.
Veröffentlicht: (2025)
Online Bidding under RoS Constraints without Knowing the Value
von: Vijayan, Sushant, et al.
Veröffentlicht: (2025)
von: Vijayan, Sushant, et al.
Veröffentlicht: (2025)
Enhancing Adversarial Robustness in Network Intrusion Detection: A Layer-wise Adaptive Regularization Approach
von: Nasir, Hira, et al.
Veröffentlicht: (2026)
von: Nasir, Hira, et al.
Veröffentlicht: (2026)
PromptRobust: Towards Evaluating the Robustness of Large Language Models on Adversarial Prompts
von: Zhu, Kaijie, et al.
Veröffentlicht: (2023)
von: Zhu, Kaijie, et al.
Veröffentlicht: (2023)
Online Learning to Rank under Corruption: A Robust Cascading Bandits Approach
von: Ghaffari, Fatemeh, et al.
Veröffentlicht: (2025)
von: Ghaffari, Fatemeh, et al.
Veröffentlicht: (2025)
Residual Learning and Context Encoding for Adaptive Offline-to-Online Reinforcement Learning
von: Nakhaei, Mohammadreza, et al.
Veröffentlicht: (2024)
von: Nakhaei, Mohammadreza, et al.
Veröffentlicht: (2024)
Advancements In Heart Disease Prediction: A Machine Learning Approach For Early Detection And Risk Assessment
von: Ingole, Balaji Shesharao, et al.
Veröffentlicht: (2024)
von: Ingole, Balaji Shesharao, et al.
Veröffentlicht: (2024)
RCDM: Enabling Robustness for Conditional Diffusion Model
von: Xu, Weifeng, et al.
Veröffentlicht: (2024)
von: Xu, Weifeng, et al.
Veröffentlicht: (2024)
GRAID: Synthetic Data Generation with Geometric Constraints and Multi-Agentic Reflection for Harmful Content Detection
von: Rad, Melissa Kazemi, et al.
Veröffentlicht: (2025)
von: Rad, Melissa Kazemi, et al.
Veröffentlicht: (2025)
FrameShield: Adversarially Robust Video Anomaly Detection
von: Nafez, Mojtaba, et al.
Veröffentlicht: (2025)
von: Nafez, Mojtaba, et al.
Veröffentlicht: (2025)
Killing it with Zero-Shot: Adversarially Robust Novelty Detection
von: Mirzaei, Hossein, et al.
Veröffentlicht: (2025)
von: Mirzaei, Hossein, et al.
Veröffentlicht: (2025)
Adaptive Group Robust Ensemble Knowledge Distillation
von: Kenfack, Patrik, et al.
Veröffentlicht: (2024)
von: Kenfack, Patrik, et al.
Veröffentlicht: (2024)
Online MDP with Transition Prototypes: A Robust Adaptive Approach
von: Sun, Shuo, et al.
Veröffentlicht: (2024)
von: Sun, Shuo, et al.
Veröffentlicht: (2024)
Reducing Redundant Computation in Multi-Agent Coordination through Locally Centralized Execution
von: Bai, Yidong, et al.
Veröffentlicht: (2024)
von: Bai, Yidong, et al.
Veröffentlicht: (2024)
Sequential Harmful Shift Detection Without Labels
von: Amoukou, Salim I., et al.
Veröffentlicht: (2024)
von: Amoukou, Salim I., et al.
Veröffentlicht: (2024)
Evaluating the Adversarial Robustness of Detection Transformers
von: Nazeri, Amirhossein, et al.
Veröffentlicht: (2024)
von: Nazeri, Amirhossein, et al.
Veröffentlicht: (2024)
DARD: Dice Adversarial Robustness Distillation against Adversarial Attacks
von: Zou, Jing, et al.
Veröffentlicht: (2025)
von: Zou, Jing, et al.
Veröffentlicht: (2025)
Ähnliche Einträge
-
From Machine Learning to Machine Unlearning: Complying with GDPR's Right to be Forgotten while Maintaining Business Value of Predictive Models
von: Yang, Yuncong, et al.
Veröffentlicht: (2024) -
Adversarially-Aware Architecture Design for Robust Medical AI Systems
von: Gerhart, Alyssa, et al.
Veröffentlicht: (2025) -
Optimal Transport Regularized Divergences: Application to Adversarial Robustness
von: Birrell, Jeremiah, et al.
Veröffentlicht: (2023) -
Information-Consistent Language Model Recommendations through Group Relative Policy Optimization
von: Prabhune, Sonal, et al.
Veröffentlicht: (2025) -
Benchmarking the Robustness of Agentic Systems to Adversarially-Induced Harms
von: Nöther, Jonathan, et al.
Veröffentlicht: (2025)