Salvato in:
| Autori principali: | Deng, Yuyang, Qiao, Fuli, Mahdavi, Mehrdad |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2025
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2511.06132 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
Stochastic Compositional Minimax Optimization with Provable Convergence Guarantees
di: Deng, Yuyang, et al.
Pubblicazione: (2024)
di: Deng, Yuyang, et al.
Pubblicazione: (2024)
Merge before Forget: A Single LoRA Continual Learning via Continual Merging
di: Qiao, Fuli, et al.
Pubblicazione: (2025)
di: Qiao, Fuli, et al.
Pubblicazione: (2025)
On the Generalization Ability of Unsupervised Pretraining
di: Deng, Yuyang, et al.
Pubblicazione: (2024)
di: Deng, Yuyang, et al.
Pubblicazione: (2024)
Low-rank Momentum Factorization for Memory Efficient Training
di: Mahdavinia, Pouria, et al.
Pubblicazione: (2025)
di: Mahdavinia, Pouria, et al.
Pubblicazione: (2025)
Understanding Deep Gradient Leakage via Inversion Influence Functions
di: Zhang, Haobo, et al.
Pubblicazione: (2023)
di: Zhang, Haobo, et al.
Pubblicazione: (2023)
Harnessing Optimization Dynamics for Curvature-Informed Model Merging
di: Mahdavinia, Pouria, et al.
Pubblicazione: (2025)
di: Mahdavinia, Pouria, et al.
Pubblicazione: (2025)
Model Merging via Multi-Teacher Knowledge Distillation
di: Dalili, Seyed Arshan, et al.
Pubblicazione: (2025)
di: Dalili, Seyed Arshan, et al.
Pubblicazione: (2025)
Collaborative Learning with Different Labeling Functions
di: Deng, Yuyang, et al.
Pubblicazione: (2024)
di: Deng, Yuyang, et al.
Pubblicazione: (2024)
On the Generalization Capability of Temporal Graph Learning Algorithms: Theoretical Insights and a Simpler Method
di: Cong, Weilin, et al.
Pubblicazione: (2024)
di: Cong, Weilin, et al.
Pubblicazione: (2024)
Quantum Speedups for Markov Chain Monte Carlo Methods with Application to Optimization
di: Ozgul, Guneykan, et al.
Pubblicazione: (2025)
di: Ozgul, Guneykan, et al.
Pubblicazione: (2025)
Enhancing Distributional Stability among Sub-populations
di: Liu, Jiashuo, et al.
Pubblicazione: (2022)
di: Liu, Jiashuo, et al.
Pubblicazione: (2022)
Training-Conditional Coverage Bounds under Covariate Shift
di: Pournaderi, Mehrdad, et al.
Pubblicazione: (2024)
di: Pournaderi, Mehrdad, et al.
Pubblicazione: (2024)
Training-Conditional Coverage Bounds for Uniformly Stable Learning Algorithms
di: Pournaderi, Mehrdad, et al.
Pubblicazione: (2024)
di: Pournaderi, Mehrdad, et al.
Pubblicazione: (2024)
Advantage Shaping as Surrogate Reward Maximization: Unifying Pass@K Policy Gradients
di: Thrampoulidis, Christos, et al.
Pubblicazione: (2025)
di: Thrampoulidis, Christos, et al.
Pubblicazione: (2025)
Stabilizing MoE Reinforcement Learning by Aligning Training and Inference Routers
di: Ma, Wenhan, et al.
Pubblicazione: (2025)
di: Ma, Wenhan, et al.
Pubblicazione: (2025)
Understanding Generalization from Embedding Dimension and Distributional Convergence
di: Yu, Junjie, et al.
Pubblicazione: (2026)
di: Yu, Junjie, et al.
Pubblicazione: (2026)
Neyman-Pearson Classification under Both Null and Alternative Distributions Shift
di: Kalan, Mohammadreza M., et al.
Pubblicazione: (2025)
di: Kalan, Mohammadreza M., et al.
Pubblicazione: (2025)
Tail Distribution of Regret in Optimistic Reinforcement Learning
di: Khodadadian, Sajad, et al.
Pubblicazione: (2025)
di: Khodadadian, Sajad, et al.
Pubblicazione: (2025)
Beyond CVaR: Leveraging Static Spectral Risk Measures for Enhanced Decision-Making in Distributional Reinforcement Learning
di: Moghimi, Mehrdad, et al.
Pubblicazione: (2025)
di: Moghimi, Mehrdad, et al.
Pubblicazione: (2025)
On the Convergence of Modified Policy Iteration in Risk Sensitive Exponential Cost Markov Decision Processes
di: Murthy, Yashaswini, et al.
Pubblicazione: (2023)
di: Murthy, Yashaswini, et al.
Pubblicazione: (2023)
Mixed-Sample SGD: an End-to-end Analysis of Supervised Transfer Learning
di: Deng, Yuyang, et al.
Pubblicazione: (2025)
di: Deng, Yuyang, et al.
Pubblicazione: (2025)
Product-Stability: Provable Convergence for Gradient Descent on the Edge of Stability
di: Gan, Eric
Pubblicazione: (2026)
di: Gan, Eric
Pubblicazione: (2026)
Vector-Valued Distributional Reinforcement Learning Policy Evaluation: A Hilbert Space Embedding Approach
di: Mohammadi, Mehrdad, et al.
Pubblicazione: (2026)
di: Mohammadi, Mehrdad, et al.
Pubblicazione: (2026)
Shock-Aware Physics-Guided Fusion-DeepONet Operator for Rarefied Micro-Nozzle Flows
di: Roohi, Ehsan, et al.
Pubblicazione: (2025)
di: Roohi, Ehsan, et al.
Pubblicazione: (2025)
Memorization Capacity of Multi-Head Attention in Transformers
di: Mahdavi, Sadegh, et al.
Pubblicazione: (2023)
di: Mahdavi, Sadegh, et al.
Pubblicazione: (2023)
On the Maximal Local Disparity of Fairness-Aware Classifiers
di: Jin, Jinqiu, et al.
Pubblicazione: (2024)
di: Jin, Jinqiu, et al.
Pubblicazione: (2024)
Learning Stable Predictors from Weak Supervision under Distribution Shift
di: Shoeibi, Mehrdad, et al.
Pubblicazione: (2026)
di: Shoeibi, Mehrdad, et al.
Pubblicazione: (2026)
Informed Decision-Making through Advancements in Open Set Recognition and Unknown Sample Detection
di: Mahdavi, Atefeh, et al.
Pubblicazione: (2024)
di: Mahdavi, Atefeh, et al.
Pubblicazione: (2024)
Fair Recommendations with Limited Sensitive Attributes: A Distributionally Robust Optimization Approach
di: Shi, Tianhao, et al.
Pubblicazione: (2024)
di: Shi, Tianhao, et al.
Pubblicazione: (2024)
SubTrack++ : Gradient Subspace Tracking for Scalable LLM Training
di: Rajabi, Sahar, et al.
Pubblicazione: (2025)
di: Rajabi, Sahar, et al.
Pubblicazione: (2025)
Distributed Gradient Clustering: Convergence and the Effect of Initialization
di: Armacki, Aleksandar, et al.
Pubblicazione: (2026)
di: Armacki, Aleksandar, et al.
Pubblicazione: (2026)
Stabilizing the Kumaraswamy Distribution
di: Wasserman, Max, et al.
Pubblicazione: (2024)
di: Wasserman, Max, et al.
Pubblicazione: (2024)
Leveraging Online Olympiad-Level Math Problems for LLMs Training and Contamination-Resistant Evaluation
di: Mahdavi, Sadegh, et al.
Pubblicazione: (2025)
di: Mahdavi, Sadegh, et al.
Pubblicazione: (2025)
Risk-sensitive Actor-Critic with Static Spectral Risk Measures for Online and Offline Reinforcement Learning
di: Moghimi, Mehrdad, et al.
Pubblicazione: (2025)
di: Moghimi, Mehrdad, et al.
Pubblicazione: (2025)
Offline Constrained RLHF with Multiple Preference Oracles
di: Latham, Brenden, et al.
Pubblicazione: (2026)
di: Latham, Brenden, et al.
Pubblicazione: (2026)
Computational Bottlenecks of Training Small-scale Large Language Models
di: Ashkboos, Saleh, et al.
Pubblicazione: (2024)
di: Ashkboos, Saleh, et al.
Pubblicazione: (2024)
Convergence Theorems for Entropy-Regularized and Distributional Reinforcement Learning
di: Jhaveri, Yash, et al.
Pubblicazione: (2025)
di: Jhaveri, Yash, et al.
Pubblicazione: (2025)
Convergence Rates for Distribution Matching with Sliced Optimal Transport
di: Thurin, Gauthier, et al.
Pubblicazione: (2026)
di: Thurin, Gauthier, et al.
Pubblicazione: (2026)
Convergence Guarantees for Federated SARSA with Local Training and Heterogeneous Agents
di: Mangold, Paul, et al.
Pubblicazione: (2025)
di: Mangold, Paul, et al.
Pubblicazione: (2025)
Provably Convergent Subgraph-wise Sampling for Fast GNN Training
di: Wang, Jie, et al.
Pubblicazione: (2023)
di: Wang, Jie, et al.
Pubblicazione: (2023)
Documenti analoghi
-
Stochastic Compositional Minimax Optimization with Provable Convergence Guarantees
di: Deng, Yuyang, et al.
Pubblicazione: (2024) -
Merge before Forget: A Single LoRA Continual Learning via Continual Merging
di: Qiao, Fuli, et al.
Pubblicazione: (2025) -
On the Generalization Ability of Unsupervised Pretraining
di: Deng, Yuyang, et al.
Pubblicazione: (2024) -
Low-rank Momentum Factorization for Memory Efficient Training
di: Mahdavinia, Pouria, et al.
Pubblicazione: (2025) -
Understanding Deep Gradient Leakage via Inversion Influence Functions
di: Zhang, Haobo, et al.
Pubblicazione: (2023)