:: Library Catalog

Copertina

Salvato in:

Dettagli Bibliografici
Autori principali:	Deng, Yuyang, Qiao, Fuli, Mahdavi, Mehrdad
Natura:	Preprint
Pubblicazione:	2025
Soggetti:	Machine Learning
Accesso online:	https://arxiv.org/abs/2511.06132
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Documenti analoghi

Stochastic Compositional Minimax Optimization with Provable Convergence Guarantees
di: Deng, Yuyang, et al.
Pubblicazione: (2024)

Merge before Forget: A Single LoRA Continual Learning via Continual Merging
di: Qiao, Fuli, et al.
Pubblicazione: (2025)

On the Generalization Ability of Unsupervised Pretraining
di: Deng, Yuyang, et al.
Pubblicazione: (2024)

Low-rank Momentum Factorization for Memory Efficient Training
di: Mahdavinia, Pouria, et al.
Pubblicazione: (2025)

Understanding Deep Gradient Leakage via Inversion Influence Functions
di: Zhang, Haobo, et al.
Pubblicazione: (2023)

Harnessing Optimization Dynamics for Curvature-Informed Model Merging
di: Mahdavinia, Pouria, et al.
Pubblicazione: (2025)

Model Merging via Multi-Teacher Knowledge Distillation
di: Dalili, Seyed Arshan, et al.
Pubblicazione: (2025)

Collaborative Learning with Different Labeling Functions
di: Deng, Yuyang, et al.
Pubblicazione: (2024)

On the Generalization Capability of Temporal Graph Learning Algorithms: Theoretical Insights and a Simpler Method
di: Cong, Weilin, et al.
Pubblicazione: (2024)

Quantum Speedups for Markov Chain Monte Carlo Methods with Application to Optimization
di: Ozgul, Guneykan, et al.
Pubblicazione: (2025)

Enhancing Distributional Stability among Sub-populations
di: Liu, Jiashuo, et al.
Pubblicazione: (2022)

Training-Conditional Coverage Bounds under Covariate Shift
di: Pournaderi, Mehrdad, et al.
Pubblicazione: (2024)

Training-Conditional Coverage Bounds for Uniformly Stable Learning Algorithms
di: Pournaderi, Mehrdad, et al.
Pubblicazione: (2024)

Advantage Shaping as Surrogate Reward Maximization: Unifying Pass@K Policy Gradients
di: Thrampoulidis, Christos, et al.
Pubblicazione: (2025)

Stabilizing MoE Reinforcement Learning by Aligning Training and Inference Routers
di: Ma, Wenhan, et al.
Pubblicazione: (2025)

Understanding Generalization from Embedding Dimension and Distributional Convergence
di: Yu, Junjie, et al.
Pubblicazione: (2026)

Neyman-Pearson Classification under Both Null and Alternative Distributions Shift
di: Kalan, Mohammadreza M., et al.
Pubblicazione: (2025)

Tail Distribution of Regret in Optimistic Reinforcement Learning
di: Khodadadian, Sajad, et al.
Pubblicazione: (2025)

Beyond CVaR: Leveraging Static Spectral Risk Measures for Enhanced Decision-Making in Distributional Reinforcement Learning
di: Moghimi, Mehrdad, et al.
Pubblicazione: (2025)

On the Convergence of Modified Policy Iteration in Risk Sensitive Exponential Cost Markov Decision Processes
di: Murthy, Yashaswini, et al.
Pubblicazione: (2023)

Mixed-Sample SGD: an End-to-end Analysis of Supervised Transfer Learning
di: Deng, Yuyang, et al.
Pubblicazione: (2025)

Product-Stability: Provable Convergence for Gradient Descent on the Edge of Stability
di: Gan, Eric
Pubblicazione: (2026)

Vector-Valued Distributional Reinforcement Learning Policy Evaluation: A Hilbert Space Embedding Approach
di: Mohammadi, Mehrdad, et al.
Pubblicazione: (2026)

Shock-Aware Physics-Guided Fusion-DeepONet Operator for Rarefied Micro-Nozzle Flows
di: Roohi, Ehsan, et al.
Pubblicazione: (2025)

Memorization Capacity of Multi-Head Attention in Transformers
di: Mahdavi, Sadegh, et al.
Pubblicazione: (2023)

On the Maximal Local Disparity of Fairness-Aware Classifiers
di: Jin, Jinqiu, et al.
Pubblicazione: (2024)

Learning Stable Predictors from Weak Supervision under Distribution Shift
di: Shoeibi, Mehrdad, et al.
Pubblicazione: (2026)

Informed Decision-Making through Advancements in Open Set Recognition and Unknown Sample Detection
di: Mahdavi, Atefeh, et al.
Pubblicazione: (2024)

Fair Recommendations with Limited Sensitive Attributes: A Distributionally Robust Optimization Approach
di: Shi, Tianhao, et al.
Pubblicazione: (2024)

SubTrack++ : Gradient Subspace Tracking for Scalable LLM Training
di: Rajabi, Sahar, et al.
Pubblicazione: (2025)

Distributed Gradient Clustering: Convergence and the Effect of Initialization
di: Armacki, Aleksandar, et al.
Pubblicazione: (2026)

Stabilizing the Kumaraswamy Distribution
di: Wasserman, Max, et al.
Pubblicazione: (2024)

Leveraging Online Olympiad-Level Math Problems for LLMs Training and Contamination-Resistant Evaluation
di: Mahdavi, Sadegh, et al.
Pubblicazione: (2025)

Risk-sensitive Actor-Critic with Static Spectral Risk Measures for Online and Offline Reinforcement Learning
di: Moghimi, Mehrdad, et al.
Pubblicazione: (2025)

Offline Constrained RLHF with Multiple Preference Oracles
di: Latham, Brenden, et al.
Pubblicazione: (2026)

Computational Bottlenecks of Training Small-scale Large Language Models
di: Ashkboos, Saleh, et al.
Pubblicazione: (2024)

Convergence Theorems for Entropy-Regularized and Distributional Reinforcement Learning
di: Jhaveri, Yash, et al.
Pubblicazione: (2025)

Convergence Rates for Distribution Matching with Sliced Optimal Transport
di: Thurin, Gauthier, et al.
Pubblicazione: (2026)

Convergence Guarantees for Federated SARSA with Local Training and Heterogeneous Agents
di: Mangold, Paul, et al.
Pubblicazione: (2025)

Provably Convergent Subgraph-wise Sampling for Fast GNN Training
di: Wang, Jie, et al.
Pubblicazione: (2023)