:: Library Catalog

Image de couverture de livre

Enregistré dans:

Détails bibliographiques
Auteurs principaux:	McDonald, Tavish, Lei, Bo, Fort, Stanislav, Kailkhura, Bhavya, Bartoldson, Brian
Format:	Preprint
Publié:	2025
Sujets:	Machine Learning
Accès en ligne:	https://arxiv.org/abs/2510.06790
Tags:	Ajouter un tag Pas de tags, Soyez le premier à ajouter un tag!

Documents similaires

Adversarial Robustness Limits via Scaling-Law and Human-Alignment Studies
par: Bartoldson, Brian R., et autres
Publié: (2024)

Scaling up Test-Time Compute with Latent Reasoning: A Recurrent Depth Approach
par: Geiping, Jonas, et autres
Publié: (2025)

AegisLLM: Scaling Agentic Systems for Self-Reflective Defense in LLM Security
par: Cai, Zikui, et autres
Publié: (2025)

Act Only When It Pays: Efficient Reinforcement Learning for LLM Reasoning via Selective Rollouts
par: Zheng, Haizhong, et autres
Publié: (2025)

Speculative Diffusion Decoding: Accelerating Language Generation through Diffusion
par: Christopher, Jacob K, et autres
Publié: (2024)

Double Visual Defense: Adversarial Pre-training and Instruction Tuning for Improving Vision-Language Model Robustness
par: Wang, Zeyu, et autres
Publié: (2025)

Certifiably-Robust Federated Adversarial Learning via Randomized Smoothing
par: Chen, Cheng, et autres
Publié: (2021)

Improving Robustness In Sparse Autoencoders via Masked Regularization
par: Narayanaswamy, Vivek, et autres
Publié: (2026)

Trajectory Balance with Asynchrony: Decoupling Exploration and Learning for Fast, Scalable LLM Post-Training
par: Bartoldson, Brian, et autres
Publié: (2025)

LongCoT: Benchmarking Long-Horizon Chain-of-Thought Reasoning
par: Motwani, Sumeet Ramesh, et autres
Publié: (2026)

Transformers Can Do Arithmetic with the Right Embeddings
par: McLeish, Sean, et autres
Publié: (2024)

A Note on Implementation Errors in Recent Adaptive Attacks Against Multi-Resolution Self-Ensembles
par: Fort, Stanislav
Publié: (2025)

Teaching Pretrained Language Models to Think Deeper with Retrofitted Recurrence
par: McLeish, Sean, et autres
Publié: (2025)

FedCluster: Boosting the Convergence of Federated Learning via Cluster-Cycling
par: Chen, Cheng, et autres
Publié: (2020)

Training Dynamics of Transformers to Recognize Word Co-occurrence via Gradient Flow Analysis
par: Yang, Hongru, et autres
Publié: (2024)

Recursive Self-Aggregation Unlocks Deep Thinking in Large Language Models
par: Venkatraman, Siddarth, et autres
Publié: (2025)

Mixture of Robust Experts (MoRE):A Robust Denoising Method towards multiple perturbations
par: Cheng, Hao, et autres
Publié: (2021)

End-to-End Mesh Optimization of a Hybrid Deep Learning Black-Box PDE Solver
par: Ma, Shaocong, et autres
Publié: (2024)

Ensemble everything everywhere: Multi-scale aggregation for adversarial robustness
par: Fort, Stanislav, et autres
Publié: (2024)

A Comedy of Estimators: On KL Regularization in RL Training of LLMs
par: Shah, Vedant, et autres
Publié: (2025)

Forecasting Fails: Unveiling Evasion Attacks in Weather Prediction Models
par: Arif, Huzaifa, et autres
Publié: (2025)

LLM Unlearning Reveals a Stronger-Than-Expected Coreset Effect in Current Benchmarks
par: Pal, Soumyadeep, et autres
Publié: (2025)

Constrained Discrete Diffusion
par: Cardei, Michael, et autres
Publié: (2025)

ProtAlign: Contrastive learning paradigm for Sequence and structure alignment
par: Ranganath, Aditya, et autres
Publié: (2026)

Trading Inference-Time Compute for Adversarial Robustness
par: Zaremba, Wojciech, et autres
Publié: (2025)

Solving adversarial examples requires solving exponential misalignment
par: Salvatore, Alessandro, et autres
Publié: (2026)

DeepZero: Scaling up Zeroth-Order Optimization for Deep Model Training
par: Chen, Aochuan, et autres
Publié: (2023)

UProp: Investigating the Uncertainty Propagation of LLMs in Multi-Step Agentic Decision-Making
par: Duan, Jinhao, et autres
Publié: (2025)

Low-rank finetuning for LLMs: A fairness perspective
par: Das, Saswat, et autres
Publié: (2024)

Near Optimal Decision Trees in a SPLIT Second
par: Babbar, Varun, et autres
Publié: (2025)

Interpretable Generalized Additive Models for Datasets with Missing Values
par: McTavish, Hayden, et autres
Publié: (2024)

Active Learning Enables Extrapolation in Molecular Generative Models
par: Antoniuk, Evan R., et autres
Publié: (2025)

Leveraging Hierarchical Feature Sharing for Efficient Dataset Condensation
par: Zheng, Haizhong, et autres
Publié: (2023)

floq: Training Critics via Flow-Matching for Scaling Compute in Value-Based RL
par: Agrawalla, Bhavya, et autres
Publié: (2025)

SOUL: Unlocking the Power of Second-Order Optimization for LLM Unlearning
par: Jia, Jinghan, et autres
Publié: (2024)

A Bayesian Approach to Robust Inverse Reinforcement Learning
par: Wei, Ran, et autres
Publié: (2023)

GRNFormer: A Biologically-Guided Framework for Integrating Gene Regulatory Networks into RNA Foundation Models
par: Qiu, Mufan, et autres
Publié: (2025)

Position: Zeroth-Order Optimization in Deep Learning Is Underexplored, Not Underpowered
par: Liu, Sijia, et autres
Publié: (2026)

ELFS: Label-Free Coreset Selection with Proxy Training Dynamics
par: Zheng, Haizhong, et autres
Publié: (2024)

StockBench: Can LLM Agents Trade Stocks Profitably In Real-world Markets?
par: Chen, Yanxu, et autres
Publié: (2025)