Enregistré dans:
| Auteurs principaux: | McDonald, Tavish, Lei, Bo, Fort, Stanislav, Kailkhura, Bhavya, Bartoldson, Brian |
|---|---|
| Format: | Preprint |
| Publié: |
2025
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2510.06790 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
Adversarial Robustness Limits via Scaling-Law and Human-Alignment Studies
par: Bartoldson, Brian R., et autres
Publié: (2024)
par: Bartoldson, Brian R., et autres
Publié: (2024)
Scaling up Test-Time Compute with Latent Reasoning: A Recurrent Depth Approach
par: Geiping, Jonas, et autres
Publié: (2025)
par: Geiping, Jonas, et autres
Publié: (2025)
AegisLLM: Scaling Agentic Systems for Self-Reflective Defense in LLM Security
par: Cai, Zikui, et autres
Publié: (2025)
par: Cai, Zikui, et autres
Publié: (2025)
Act Only When It Pays: Efficient Reinforcement Learning for LLM Reasoning via Selective Rollouts
par: Zheng, Haizhong, et autres
Publié: (2025)
par: Zheng, Haizhong, et autres
Publié: (2025)
Speculative Diffusion Decoding: Accelerating Language Generation through Diffusion
par: Christopher, Jacob K, et autres
Publié: (2024)
par: Christopher, Jacob K, et autres
Publié: (2024)
Double Visual Defense: Adversarial Pre-training and Instruction Tuning for Improving Vision-Language Model Robustness
par: Wang, Zeyu, et autres
Publié: (2025)
par: Wang, Zeyu, et autres
Publié: (2025)
Certifiably-Robust Federated Adversarial Learning via Randomized Smoothing
par: Chen, Cheng, et autres
Publié: (2021)
par: Chen, Cheng, et autres
Publié: (2021)
Improving Robustness In Sparse Autoencoders via Masked Regularization
par: Narayanaswamy, Vivek, et autres
Publié: (2026)
par: Narayanaswamy, Vivek, et autres
Publié: (2026)
Trajectory Balance with Asynchrony: Decoupling Exploration and Learning for Fast, Scalable LLM Post-Training
par: Bartoldson, Brian, et autres
Publié: (2025)
par: Bartoldson, Brian, et autres
Publié: (2025)
LongCoT: Benchmarking Long-Horizon Chain-of-Thought Reasoning
par: Motwani, Sumeet Ramesh, et autres
Publié: (2026)
par: Motwani, Sumeet Ramesh, et autres
Publié: (2026)
Transformers Can Do Arithmetic with the Right Embeddings
par: McLeish, Sean, et autres
Publié: (2024)
par: McLeish, Sean, et autres
Publié: (2024)
A Note on Implementation Errors in Recent Adaptive Attacks Against Multi-Resolution Self-Ensembles
par: Fort, Stanislav
Publié: (2025)
par: Fort, Stanislav
Publié: (2025)
Teaching Pretrained Language Models to Think Deeper with Retrofitted Recurrence
par: McLeish, Sean, et autres
Publié: (2025)
par: McLeish, Sean, et autres
Publié: (2025)
FedCluster: Boosting the Convergence of Federated Learning via Cluster-Cycling
par: Chen, Cheng, et autres
Publié: (2020)
par: Chen, Cheng, et autres
Publié: (2020)
Training Dynamics of Transformers to Recognize Word Co-occurrence via Gradient Flow Analysis
par: Yang, Hongru, et autres
Publié: (2024)
par: Yang, Hongru, et autres
Publié: (2024)
Recursive Self-Aggregation Unlocks Deep Thinking in Large Language Models
par: Venkatraman, Siddarth, et autres
Publié: (2025)
par: Venkatraman, Siddarth, et autres
Publié: (2025)
Mixture of Robust Experts (MoRE):A Robust Denoising Method towards multiple perturbations
par: Cheng, Hao, et autres
Publié: (2021)
par: Cheng, Hao, et autres
Publié: (2021)
End-to-End Mesh Optimization of a Hybrid Deep Learning Black-Box PDE Solver
par: Ma, Shaocong, et autres
Publié: (2024)
par: Ma, Shaocong, et autres
Publié: (2024)
Ensemble everything everywhere: Multi-scale aggregation for adversarial robustness
par: Fort, Stanislav, et autres
Publié: (2024)
par: Fort, Stanislav, et autres
Publié: (2024)
A Comedy of Estimators: On KL Regularization in RL Training of LLMs
par: Shah, Vedant, et autres
Publié: (2025)
par: Shah, Vedant, et autres
Publié: (2025)
Forecasting Fails: Unveiling Evasion Attacks in Weather Prediction Models
par: Arif, Huzaifa, et autres
Publié: (2025)
par: Arif, Huzaifa, et autres
Publié: (2025)
LLM Unlearning Reveals a Stronger-Than-Expected Coreset Effect in Current Benchmarks
par: Pal, Soumyadeep, et autres
Publié: (2025)
par: Pal, Soumyadeep, et autres
Publié: (2025)
Constrained Discrete Diffusion
par: Cardei, Michael, et autres
Publié: (2025)
par: Cardei, Michael, et autres
Publié: (2025)
ProtAlign: Contrastive learning paradigm for Sequence and structure alignment
par: Ranganath, Aditya, et autres
Publié: (2026)
par: Ranganath, Aditya, et autres
Publié: (2026)
Trading Inference-Time Compute for Adversarial Robustness
par: Zaremba, Wojciech, et autres
Publié: (2025)
par: Zaremba, Wojciech, et autres
Publié: (2025)
Solving adversarial examples requires solving exponential misalignment
par: Salvatore, Alessandro, et autres
Publié: (2026)
par: Salvatore, Alessandro, et autres
Publié: (2026)
DeepZero: Scaling up Zeroth-Order Optimization for Deep Model Training
par: Chen, Aochuan, et autres
Publié: (2023)
par: Chen, Aochuan, et autres
Publié: (2023)
UProp: Investigating the Uncertainty Propagation of LLMs in Multi-Step Agentic Decision-Making
par: Duan, Jinhao, et autres
Publié: (2025)
par: Duan, Jinhao, et autres
Publié: (2025)
Low-rank finetuning for LLMs: A fairness perspective
par: Das, Saswat, et autres
Publié: (2024)
par: Das, Saswat, et autres
Publié: (2024)
Near Optimal Decision Trees in a SPLIT Second
par: Babbar, Varun, et autres
Publié: (2025)
par: Babbar, Varun, et autres
Publié: (2025)
Interpretable Generalized Additive Models for Datasets with Missing Values
par: McTavish, Hayden, et autres
Publié: (2024)
par: McTavish, Hayden, et autres
Publié: (2024)
Active Learning Enables Extrapolation in Molecular Generative Models
par: Antoniuk, Evan R., et autres
Publié: (2025)
par: Antoniuk, Evan R., et autres
Publié: (2025)
Leveraging Hierarchical Feature Sharing for Efficient Dataset Condensation
par: Zheng, Haizhong, et autres
Publié: (2023)
par: Zheng, Haizhong, et autres
Publié: (2023)
floq: Training Critics via Flow-Matching for Scaling Compute in Value-Based RL
par: Agrawalla, Bhavya, et autres
Publié: (2025)
par: Agrawalla, Bhavya, et autres
Publié: (2025)
SOUL: Unlocking the Power of Second-Order Optimization for LLM Unlearning
par: Jia, Jinghan, et autres
Publié: (2024)
par: Jia, Jinghan, et autres
Publié: (2024)
A Bayesian Approach to Robust Inverse Reinforcement Learning
par: Wei, Ran, et autres
Publié: (2023)
par: Wei, Ran, et autres
Publié: (2023)
GRNFormer: A Biologically-Guided Framework for Integrating Gene Regulatory Networks into RNA Foundation Models
par: Qiu, Mufan, et autres
Publié: (2025)
par: Qiu, Mufan, et autres
Publié: (2025)
Position: Zeroth-Order Optimization in Deep Learning Is Underexplored, Not Underpowered
par: Liu, Sijia, et autres
Publié: (2026)
par: Liu, Sijia, et autres
Publié: (2026)
ELFS: Label-Free Coreset Selection with Proxy Training Dynamics
par: Zheng, Haizhong, et autres
Publié: (2024)
par: Zheng, Haizhong, et autres
Publié: (2024)
StockBench: Can LLM Agents Trade Stocks Profitably In Real-world Markets?
par: Chen, Yanxu, et autres
Publié: (2025)
par: Chen, Yanxu, et autres
Publié: (2025)
Documents similaires
-
Adversarial Robustness Limits via Scaling-Law and Human-Alignment Studies
par: Bartoldson, Brian R., et autres
Publié: (2024) -
Scaling up Test-Time Compute with Latent Reasoning: A Recurrent Depth Approach
par: Geiping, Jonas, et autres
Publié: (2025) -
AegisLLM: Scaling Agentic Systems for Self-Reflective Defense in LLM Security
par: Cai, Zikui, et autres
Publié: (2025) -
Act Only When It Pays: Efficient Reinforcement Learning for LLM Reasoning via Selective Rollouts
par: Zheng, Haizhong, et autres
Publié: (2025) -
Speculative Diffusion Decoding: Accelerating Language Generation through Diffusion
par: Christopher, Jacob K, et autres
Publié: (2024)