:: Library Catalog

Buchumschlag

Gespeichert in:

Bibliographische Detailangaben
Hauptverfasser:	Yang, Hui, Ren, Tao, Jiang, Jinyang, Tian, Wan, Peng, Yijie
Format:	Preprint
Veröffentlicht:	2026
Schlagworte:	Machine Learning
Online-Zugang:	https://arxiv.org/abs/2603.05960
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Ähnliche Einträge

RiskPO: Risk-based Policy Optimization via Verifiable Reward for LLM Post-Training
von: Ren, Tao, et al.
Veröffentlicht: (2025)

Stochastic Approximation Methods for Distortion Risk Measure Optimization
von: Jiang, Jinyang, et al.
Veröffentlicht: (2025)

Learning Provably Improves the Convergence of Gradient Descent
von: Song, Qingyu, et al.
Veröffentlicht: (2025)

An Algebraically Converging Stochastic Gradient Descent Algorithm for Global Optimization
von: Engquist, Björn, et al.
Veröffentlicht: (2022)

Optimizing Decoding Paths in Masked Diffusion Models by Quantifying Uncertainty
von: Chen, Ziyu, et al.
Veröffentlicht: (2025)

FlashMask: Efficient and Rich Mask Extension of FlashAttention
von: Wang, Guoxia, et al.
Veröffentlicht: (2024)

Nonparametric Bayesian Optimization for General Rewards
von: Zhang, Zishi, et al.
Veröffentlicht: (2026)

Multi-Agent Debate with Memory Masking
von: Tian, Hongduan, et al.
Veröffentlicht: (2026)

Increasing Batch Size Improves Convergence of Stochastic Gradient Descent with Momentum
von: Kamo, Keisuke, et al.
Veröffentlicht: (2025)

Closing the Loop: Coordinating Inventory and Recommendation via Deep Reinforcement Learning on Multiple Timescales
von: Jiang, Jinyang, et al.
Veröffentlicht: (2025)

Where to Mask: Structure-Guided Masking for Graph Masked Autoencoders
von: Liu, Chuang, et al.
Veröffentlicht: (2024)

CoNNect: Connectivity-Based Regularization for Structural Pruning
von: Franssen, Christian, et al.
Veröffentlicht: (2025)

On the Convergence of Gradient Descent on Learning Transformers with Residual Connections
von: Qin, Zhen, et al.
Veröffentlicht: (2025)

FLOPS: Forward Learning with OPtimal Sampling
von: Ren, Tao, et al.
Veröffentlicht: (2024)

Machine Learning-Assisted High-Dimensional Matrix Estimation
von: Tian, Wan, et al.
Veröffentlicht: (2026)

How to Compress KV Cache in RL Post-Training? Shadow Mask Distillation for Memory-Efficient Alignment
von: Zhu, Rui, et al.
Veröffentlicht: (2026)

Memory-Efficient Optimization with Factorized Hamiltonian Descent
von: Nguyen, Son, et al.
Veröffentlicht: (2024)

On the Convergence Rate of LoRA Gradient Descent
von: Mu, Siqiao, et al.
Veröffentlicht: (2025)

Sculpting Memory: Multi-Concept Forgetting in Diffusion Models via Dynamic Mask and Concept-Aware Optimization
von: Li, Gen, et al.
Veröffentlicht: (2025)

SeWA: Selective Weight Average via Probabilistic Masking
von: Wang, Peng, et al.
Veröffentlicht: (2025)

Sharp Convergence Rates for Masked Diffusion Models
von: Liang, Yuchen, et al.
Veröffentlicht: (2026)

Robust Federated Learning against Noisy Clients via Masked Optimization
von: Jiang, Xuefeng, et al.
Veröffentlicht: (2025)

Improved Finite-Particle Convergence Rates for Stein Variational Gradient Descent
von: Banerjee, Sayan, et al.
Veröffentlicht: (2024)

Accelerating Convergence of Stein Variational Gradient Descent via Deep Unfolding
von: Kawamura, Yuya, et al.
Veröffentlicht: (2024)

Accelerated Gradient Descent for Faster Convergence with Minimal Overhead
von: Graca, Manuel, et al.
Veröffentlicht: (2026)

Convergence of Alternating Gradient Descent for Matrix Factorization
von: Ward, Rachel, et al.
Veröffentlicht: (2023)

Forward Learning with Differential Privacy
von: Feng, Mingqian, et al.
Veröffentlicht: (2025)

Learning Associative Memories with Gradient Descent
von: Cabannes, Vivien, et al.
Veröffentlicht: (2024)

Convergence of Spectral Descent for Non-smooth Optimization
von: Yang, Yixuan, et al.
Veröffentlicht: (2026)

On the Convergence of Gradient Descent for Large Learning Rates
von: Crăciun, Alexandru, et al.
Veröffentlicht: (2024)

Deep Reinforcement Learning for Solving Management Problems: Towards A Large Management Mode
von: Jiang, Jinyang, et al.
Veröffentlicht: (2024)

Optimizing Predictive AI in Physical Design Flows with Mini Pixel Batch Gradient Descent
von: Yang, Haoyu, et al.
Veröffentlicht: (2024)

PolyG: Adaptive Graph Traversal for Diverse GraphRAG Questions
von: Liu, Renjie, et al.
Veröffentlicht: (2025)

Improving Robustness In Sparse Autoencoders via Masked Regularization
von: Narayanaswamy, Vivek, et al.
Veröffentlicht: (2026)

Product-Stability: Provable Convergence for Gradient Descent on the Edge of Stability
von: Gan, Eric
Veröffentlicht: (2026)

Gradient Routing: Masking Gradients to Localize Computation in Neural Networks
von: Cloud, Alex, et al.
Veröffentlicht: (2024)

Convergence Analysis of Fractional Gradient Descent
von: Aggarwal, Ashwani
Veröffentlicht: (2023)

SAU: Sparsity-Aware Unlearning for LLMs via Gradient Masking and Importance Redistribution
von: Wang, Yuze, et al.
Veröffentlicht: (2026)

Convergence Analysis of Stochastic Gradient Descent with MCMC Estimators
von: Li, Tianyou, et al.
Veröffentlicht: (2023)

Open Problem: Anytime Convergence Rate of Gradient Descent
von: Kornowski, Guy, et al.
Veröffentlicht: (2024)