Gespeichert in:
| Hauptverfasser: | Yang, Hui, Ren, Tao, Jiang, Jinyang, Tian, Wan, Peng, Yijie |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2026
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2603.05960 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
RiskPO: Risk-based Policy Optimization via Verifiable Reward for LLM Post-Training
von: Ren, Tao, et al.
Veröffentlicht: (2025)
von: Ren, Tao, et al.
Veröffentlicht: (2025)
Stochastic Approximation Methods for Distortion Risk Measure Optimization
von: Jiang, Jinyang, et al.
Veröffentlicht: (2025)
von: Jiang, Jinyang, et al.
Veröffentlicht: (2025)
Learning Provably Improves the Convergence of Gradient Descent
von: Song, Qingyu, et al.
Veröffentlicht: (2025)
von: Song, Qingyu, et al.
Veröffentlicht: (2025)
An Algebraically Converging Stochastic Gradient Descent Algorithm for Global Optimization
von: Engquist, Björn, et al.
Veröffentlicht: (2022)
von: Engquist, Björn, et al.
Veröffentlicht: (2022)
Optimizing Decoding Paths in Masked Diffusion Models by Quantifying Uncertainty
von: Chen, Ziyu, et al.
Veröffentlicht: (2025)
von: Chen, Ziyu, et al.
Veröffentlicht: (2025)
FlashMask: Efficient and Rich Mask Extension of FlashAttention
von: Wang, Guoxia, et al.
Veröffentlicht: (2024)
von: Wang, Guoxia, et al.
Veröffentlicht: (2024)
Nonparametric Bayesian Optimization for General Rewards
von: Zhang, Zishi, et al.
Veröffentlicht: (2026)
von: Zhang, Zishi, et al.
Veröffentlicht: (2026)
Multi-Agent Debate with Memory Masking
von: Tian, Hongduan, et al.
Veröffentlicht: (2026)
von: Tian, Hongduan, et al.
Veröffentlicht: (2026)
Increasing Batch Size Improves Convergence of Stochastic Gradient Descent with Momentum
von: Kamo, Keisuke, et al.
Veröffentlicht: (2025)
von: Kamo, Keisuke, et al.
Veröffentlicht: (2025)
Closing the Loop: Coordinating Inventory and Recommendation via Deep Reinforcement Learning on Multiple Timescales
von: Jiang, Jinyang, et al.
Veröffentlicht: (2025)
von: Jiang, Jinyang, et al.
Veröffentlicht: (2025)
Where to Mask: Structure-Guided Masking for Graph Masked Autoencoders
von: Liu, Chuang, et al.
Veröffentlicht: (2024)
von: Liu, Chuang, et al.
Veröffentlicht: (2024)
CoNNect: Connectivity-Based Regularization for Structural Pruning
von: Franssen, Christian, et al.
Veröffentlicht: (2025)
von: Franssen, Christian, et al.
Veröffentlicht: (2025)
On the Convergence of Gradient Descent on Learning Transformers with Residual Connections
von: Qin, Zhen, et al.
Veröffentlicht: (2025)
von: Qin, Zhen, et al.
Veröffentlicht: (2025)
FLOPS: Forward Learning with OPtimal Sampling
von: Ren, Tao, et al.
Veröffentlicht: (2024)
von: Ren, Tao, et al.
Veröffentlicht: (2024)
Machine Learning-Assisted High-Dimensional Matrix Estimation
von: Tian, Wan, et al.
Veröffentlicht: (2026)
von: Tian, Wan, et al.
Veröffentlicht: (2026)
How to Compress KV Cache in RL Post-Training? Shadow Mask Distillation for Memory-Efficient Alignment
von: Zhu, Rui, et al.
Veröffentlicht: (2026)
von: Zhu, Rui, et al.
Veröffentlicht: (2026)
Memory-Efficient Optimization with Factorized Hamiltonian Descent
von: Nguyen, Son, et al.
Veröffentlicht: (2024)
von: Nguyen, Son, et al.
Veröffentlicht: (2024)
On the Convergence Rate of LoRA Gradient Descent
von: Mu, Siqiao, et al.
Veröffentlicht: (2025)
von: Mu, Siqiao, et al.
Veröffentlicht: (2025)
Sculpting Memory: Multi-Concept Forgetting in Diffusion Models via Dynamic Mask and Concept-Aware Optimization
von: Li, Gen, et al.
Veröffentlicht: (2025)
von: Li, Gen, et al.
Veröffentlicht: (2025)
SeWA: Selective Weight Average via Probabilistic Masking
von: Wang, Peng, et al.
Veröffentlicht: (2025)
von: Wang, Peng, et al.
Veröffentlicht: (2025)
Sharp Convergence Rates for Masked Diffusion Models
von: Liang, Yuchen, et al.
Veröffentlicht: (2026)
von: Liang, Yuchen, et al.
Veröffentlicht: (2026)
Robust Federated Learning against Noisy Clients via Masked Optimization
von: Jiang, Xuefeng, et al.
Veröffentlicht: (2025)
von: Jiang, Xuefeng, et al.
Veröffentlicht: (2025)
Improved Finite-Particle Convergence Rates for Stein Variational Gradient Descent
von: Banerjee, Sayan, et al.
Veröffentlicht: (2024)
von: Banerjee, Sayan, et al.
Veröffentlicht: (2024)
Accelerating Convergence of Stein Variational Gradient Descent via Deep Unfolding
von: Kawamura, Yuya, et al.
Veröffentlicht: (2024)
von: Kawamura, Yuya, et al.
Veröffentlicht: (2024)
Accelerated Gradient Descent for Faster Convergence with Minimal Overhead
von: Graca, Manuel, et al.
Veröffentlicht: (2026)
von: Graca, Manuel, et al.
Veröffentlicht: (2026)
Convergence of Alternating Gradient Descent for Matrix Factorization
von: Ward, Rachel, et al.
Veröffentlicht: (2023)
von: Ward, Rachel, et al.
Veröffentlicht: (2023)
Forward Learning with Differential Privacy
von: Feng, Mingqian, et al.
Veröffentlicht: (2025)
von: Feng, Mingqian, et al.
Veröffentlicht: (2025)
Learning Associative Memories with Gradient Descent
von: Cabannes, Vivien, et al.
Veröffentlicht: (2024)
von: Cabannes, Vivien, et al.
Veröffentlicht: (2024)
Convergence of Spectral Descent for Non-smooth Optimization
von: Yang, Yixuan, et al.
Veröffentlicht: (2026)
von: Yang, Yixuan, et al.
Veröffentlicht: (2026)
On the Convergence of Gradient Descent for Large Learning Rates
von: Crăciun, Alexandru, et al.
Veröffentlicht: (2024)
von: Crăciun, Alexandru, et al.
Veröffentlicht: (2024)
Deep Reinforcement Learning for Solving Management Problems: Towards A Large Management Mode
von: Jiang, Jinyang, et al.
Veröffentlicht: (2024)
von: Jiang, Jinyang, et al.
Veröffentlicht: (2024)
Optimizing Predictive AI in Physical Design Flows with Mini Pixel Batch Gradient Descent
von: Yang, Haoyu, et al.
Veröffentlicht: (2024)
von: Yang, Haoyu, et al.
Veröffentlicht: (2024)
PolyG: Adaptive Graph Traversal for Diverse GraphRAG Questions
von: Liu, Renjie, et al.
Veröffentlicht: (2025)
von: Liu, Renjie, et al.
Veröffentlicht: (2025)
Improving Robustness In Sparse Autoencoders via Masked Regularization
von: Narayanaswamy, Vivek, et al.
Veröffentlicht: (2026)
von: Narayanaswamy, Vivek, et al.
Veröffentlicht: (2026)
Product-Stability: Provable Convergence for Gradient Descent on the Edge of Stability
von: Gan, Eric
Veröffentlicht: (2026)
von: Gan, Eric
Veröffentlicht: (2026)
Gradient Routing: Masking Gradients to Localize Computation in Neural Networks
von: Cloud, Alex, et al.
Veröffentlicht: (2024)
von: Cloud, Alex, et al.
Veröffentlicht: (2024)
Convergence Analysis of Fractional Gradient Descent
von: Aggarwal, Ashwani
Veröffentlicht: (2023)
von: Aggarwal, Ashwani
Veröffentlicht: (2023)
SAU: Sparsity-Aware Unlearning for LLMs via Gradient Masking and Importance Redistribution
von: Wang, Yuze, et al.
Veröffentlicht: (2026)
von: Wang, Yuze, et al.
Veröffentlicht: (2026)
Convergence Analysis of Stochastic Gradient Descent with MCMC Estimators
von: Li, Tianyou, et al.
Veröffentlicht: (2023)
von: Li, Tianyou, et al.
Veröffentlicht: (2023)
Open Problem: Anytime Convergence Rate of Gradient Descent
von: Kornowski, Guy, et al.
Veröffentlicht: (2024)
von: Kornowski, Guy, et al.
Veröffentlicht: (2024)
Ähnliche Einträge
-
RiskPO: Risk-based Policy Optimization via Verifiable Reward for LLM Post-Training
von: Ren, Tao, et al.
Veröffentlicht: (2025) -
Stochastic Approximation Methods for Distortion Risk Measure Optimization
von: Jiang, Jinyang, et al.
Veröffentlicht: (2025) -
Learning Provably Improves the Convergence of Gradient Descent
von: Song, Qingyu, et al.
Veröffentlicht: (2025) -
An Algebraically Converging Stochastic Gradient Descent Algorithm for Global Optimization
von: Engquist, Björn, et al.
Veröffentlicht: (2022) -
Optimizing Decoding Paths in Masked Diffusion Models by Quantifying Uncertainty
von: Chen, Ziyu, et al.
Veröffentlicht: (2025)