:: Library Catalog

Copertina

Salvato in:

Dettagli Bibliografici
Autori principali:	Kim, Junhyung Lyle, Gidel, Gauthier, Kyrillidis, Anastasios, Pedregosa, Fabian
Natura:	Preprint
Pubblicazione:	2022
Soggetti:	Machine Learning Optimization and Control
Accesso online:	https://arxiv.org/abs/2211.04659
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Documenti analoghi

On the Error-Propagation of Inexact Hotelling's Deflation for Principal Component Analysis
di: Liao, Fangshuo, et al.
Pubblicazione: (2023)

A Catalyst Framework for the Quantum Linear System Problem via the Proximal Point Algorithm
di: Kim, Junhyung Lyle, et al.
Pubblicazione: (2024)

Provable Accelerated Convergence of Nesterov's Momentum for Deep ReLU Neural Networks
di: Liao, Fangshuo, et al.
Pubblicazione: (2023)

Solving Hidden Monotone Variational Inequalities with Surrogate Losses
di: D'Orazio, Ryan, et al.
Pubblicazione: (2024)

Adaptive Federated Learning with Auto-Tuned Clients
di: Kim, Junhyung Lyle, et al.
Pubblicazione: (2023)

Dimension-adapted Momentum Outscales SGD
di: Ferbach, Damien, et al.
Pubblicazione: (2025)

Logarithmic-time Schedules for Scaling Language Models with Momentum
di: Ferbach, Damien, et al.
Pubblicazione: (2026)

Guided by the Experts: Provable Feature Learning Dynamic of Soft-Routed Mixture-of-Experts
di: Liao, Fangshuo, et al.
Pubblicazione: (2025)

Sarah Frank-Wolfe: Methods for Constrained Optimization with Best Rates and Practical Features
di: Beznosikov, Aleksandr, et al.
Pubblicazione: (2023)

Unveiling Hidden Pivotal Players with GoalNet: A GNN-Based Soccer Player Evaluation System
di: Jiang, Jacky Hao, et al.
Pubblicazione: (2025)

Provable Model-Parallel Distributed Principal Component Analysis with Parallel Deflation
di: Liao, Fangshuo, et al.
Pubblicazione: (2025)

One Model, Two Roles: Emergent Specialization in a Shared Recurrent Transformer
di: Shen, Jucheng, et al.
Pubblicazione: (2026)

SGD at the Edge of Stability: The Stochastic Sharpness Gap
di: Liao, Fangshuo, et al.
Pubblicazione: (2026)

Omega: Optimistic EMA Gradients
di: Ramirez, Juan, et al.
Pubblicazione: (2023)

One Rank at a Time: Cascading Error Dynamics in Sequential Learning
di: Vandchali, Mahtab Alizadeh, et al.
Pubblicazione: (2025)

On the Interplay Between Stepsize Tuning and Progressive Sharpening
di: Roulet, Vincent, et al.
Pubblicazione: (2023)

Two-timescale Extragradient for Finding Local Minimax Points
di: Chae, Jiseok, et al.
Pubblicazione: (2023)

Quantum EigenGame for excited state calculation
di: Quiroga, David, et al.
Pubblicazione: (2025)

Stochastic Extragradient with Flip-Flop Shuffling & Anchoring: Provable Improvements
di: Chae, Jiseok, et al.
Pubblicazione: (2024)

TwIST: Rigging the Lottery in Transformers with Independent Subnetwork Training
di: Menezes, Michael, et al.
Pubblicazione: (2025)

Stochastic Newton Proximal Extragradient Method
di: Jiang, Ruichen, et al.
Pubblicazione: (2024)

Convergence Analysis of Two-Layer Neural Networks under Gaussian Input Masking
di: Kolomvaki, Afroditi, et al.
Pubblicazione: (2026)

Extragradient Type Methods for Riemannian Variational Inequality Problems
di: Hu, Zihao, et al.
Pubblicazione: (2023)

Low-Rank Extragradient Methods for Scalable Semidefinite Optimization
di: Garber, Dan, et al.
Pubblicazione: (2024)

Anytime Training with Schedule-Free Spectral Optimization
di: Apte, Anuj, et al.
Pubblicazione: (2026)

High-Probability Convergence for Composite and Distributed Stochastic Minimization and Variational Inequalities with Heavy-Tailed Noise
di: Gorbunov, Eduard, et al.
Pubblicazione: (2023)

Low-Rank Extragradient Method for Nonsmooth and Low-Rank Matrix Optimization Problems
di: Garber, Dan, et al.
Pubblicazione: (2022)

Extragradient Method for $(L_0, L_1)$-Lipschitz Root-finding Problems
di: Choudhury, Sayantan, et al.
Pubblicazione: (2025)

Parameter-Free Non-Ergodic Extragradient Algorithms for Solving Monotone Variational Inequalities
di: Shen, Lingqing, et al.
Pubblicazione: (2026)

Exploiting Low-Rank Structure in Max-K-Cut Problems
di: Stevens, Ria, et al.
Pubblicazione: (2026)

Fast Computation of Optimal Transport via Entropy-Regularized Extragradient Methods
di: Li, Gen, et al.
Pubblicazione: (2023)

Thinking Out of the Box: Hybrid SAT Solving by Unconstrained Continuous Optimization
di: Zhang, Zhiwei, et al.
Pubblicazione: (2025)

Leveraging Continuous Time to Understand Momentum When Training Diagonal Linear Networks
di: Papazov, Hristo, et al.
Pubblicazione: (2024)

RecCrysFormer: Refined Protein Structural Prediction from 3D Patterson Maps via Recycling Training Runs
di: Pan, Tom, et al.
Pubblicazione: (2025)

Stochastic Extragradient with Random Reshuffling: Improved Convergence for Variational Inequalities
di: Emmanouilidis, Konstantinos, et al.
Pubblicazione: (2024)

SGD with Adaptive Preconditioning: Unified Analysis and Momentum Acceleration
di: Kovalev, Dmitry
Pubblicazione: (2025)

Improved Analysis for Sign-based Methods with Momentum Updates
di: Jiang, Wei, et al.
Pubblicazione: (2025)

Using non-convex optimization in quantum process tomography: Factored gradient descent is tough to beat
di: Quiroga, David A., et al.
Pubblicazione: (2023)

Learning to Specialize: Joint Gating-Expert Training for Adaptive MoEs in Decentralized Settings
di: Farhat, Yehya, et al.
Pubblicazione: (2023)

Accelerated Stochastic Min-Max Optimization Based on Bias-corrected Momentum
di: Cai, Haoyuan, et al.
Pubblicazione: (2024)