Salvato in:
| Autori principali: | Kim, Junhyung Lyle, Gidel, Gauthier, Kyrillidis, Anastasios, Pedregosa, Fabian |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2022
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2211.04659 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
On the Error-Propagation of Inexact Hotelling's Deflation for Principal Component Analysis
di: Liao, Fangshuo, et al.
Pubblicazione: (2023)
di: Liao, Fangshuo, et al.
Pubblicazione: (2023)
A Catalyst Framework for the Quantum Linear System Problem via the Proximal Point Algorithm
di: Kim, Junhyung Lyle, et al.
Pubblicazione: (2024)
di: Kim, Junhyung Lyle, et al.
Pubblicazione: (2024)
Provable Accelerated Convergence of Nesterov's Momentum for Deep ReLU Neural Networks
di: Liao, Fangshuo, et al.
Pubblicazione: (2023)
di: Liao, Fangshuo, et al.
Pubblicazione: (2023)
Solving Hidden Monotone Variational Inequalities with Surrogate Losses
di: D'Orazio, Ryan, et al.
Pubblicazione: (2024)
di: D'Orazio, Ryan, et al.
Pubblicazione: (2024)
Adaptive Federated Learning with Auto-Tuned Clients
di: Kim, Junhyung Lyle, et al.
Pubblicazione: (2023)
di: Kim, Junhyung Lyle, et al.
Pubblicazione: (2023)
Dimension-adapted Momentum Outscales SGD
di: Ferbach, Damien, et al.
Pubblicazione: (2025)
di: Ferbach, Damien, et al.
Pubblicazione: (2025)
Logarithmic-time Schedules for Scaling Language Models with Momentum
di: Ferbach, Damien, et al.
Pubblicazione: (2026)
di: Ferbach, Damien, et al.
Pubblicazione: (2026)
Guided by the Experts: Provable Feature Learning Dynamic of Soft-Routed Mixture-of-Experts
di: Liao, Fangshuo, et al.
Pubblicazione: (2025)
di: Liao, Fangshuo, et al.
Pubblicazione: (2025)
Sarah Frank-Wolfe: Methods for Constrained Optimization with Best Rates and Practical Features
di: Beznosikov, Aleksandr, et al.
Pubblicazione: (2023)
di: Beznosikov, Aleksandr, et al.
Pubblicazione: (2023)
Unveiling Hidden Pivotal Players with GoalNet: A GNN-Based Soccer Player Evaluation System
di: Jiang, Jacky Hao, et al.
Pubblicazione: (2025)
di: Jiang, Jacky Hao, et al.
Pubblicazione: (2025)
Provable Model-Parallel Distributed Principal Component Analysis with Parallel Deflation
di: Liao, Fangshuo, et al.
Pubblicazione: (2025)
di: Liao, Fangshuo, et al.
Pubblicazione: (2025)
One Model, Two Roles: Emergent Specialization in a Shared Recurrent Transformer
di: Shen, Jucheng, et al.
Pubblicazione: (2026)
di: Shen, Jucheng, et al.
Pubblicazione: (2026)
SGD at the Edge of Stability: The Stochastic Sharpness Gap
di: Liao, Fangshuo, et al.
Pubblicazione: (2026)
di: Liao, Fangshuo, et al.
Pubblicazione: (2026)
Omega: Optimistic EMA Gradients
di: Ramirez, Juan, et al.
Pubblicazione: (2023)
di: Ramirez, Juan, et al.
Pubblicazione: (2023)
One Rank at a Time: Cascading Error Dynamics in Sequential Learning
di: Vandchali, Mahtab Alizadeh, et al.
Pubblicazione: (2025)
di: Vandchali, Mahtab Alizadeh, et al.
Pubblicazione: (2025)
On the Interplay Between Stepsize Tuning and Progressive Sharpening
di: Roulet, Vincent, et al.
Pubblicazione: (2023)
di: Roulet, Vincent, et al.
Pubblicazione: (2023)
Two-timescale Extragradient for Finding Local Minimax Points
di: Chae, Jiseok, et al.
Pubblicazione: (2023)
di: Chae, Jiseok, et al.
Pubblicazione: (2023)
Quantum EigenGame for excited state calculation
di: Quiroga, David, et al.
Pubblicazione: (2025)
di: Quiroga, David, et al.
Pubblicazione: (2025)
Stochastic Extragradient with Flip-Flop Shuffling & Anchoring: Provable Improvements
di: Chae, Jiseok, et al.
Pubblicazione: (2024)
di: Chae, Jiseok, et al.
Pubblicazione: (2024)
TwIST: Rigging the Lottery in Transformers with Independent Subnetwork Training
di: Menezes, Michael, et al.
Pubblicazione: (2025)
di: Menezes, Michael, et al.
Pubblicazione: (2025)
Stochastic Newton Proximal Extragradient Method
di: Jiang, Ruichen, et al.
Pubblicazione: (2024)
di: Jiang, Ruichen, et al.
Pubblicazione: (2024)
Convergence Analysis of Two-Layer Neural Networks under Gaussian Input Masking
di: Kolomvaki, Afroditi, et al.
Pubblicazione: (2026)
di: Kolomvaki, Afroditi, et al.
Pubblicazione: (2026)
Extragradient Type Methods for Riemannian Variational Inequality Problems
di: Hu, Zihao, et al.
Pubblicazione: (2023)
di: Hu, Zihao, et al.
Pubblicazione: (2023)
Low-Rank Extragradient Methods for Scalable Semidefinite Optimization
di: Garber, Dan, et al.
Pubblicazione: (2024)
di: Garber, Dan, et al.
Pubblicazione: (2024)
Anytime Training with Schedule-Free Spectral Optimization
di: Apte, Anuj, et al.
Pubblicazione: (2026)
di: Apte, Anuj, et al.
Pubblicazione: (2026)
High-Probability Convergence for Composite and Distributed Stochastic Minimization and Variational Inequalities with Heavy-Tailed Noise
di: Gorbunov, Eduard, et al.
Pubblicazione: (2023)
di: Gorbunov, Eduard, et al.
Pubblicazione: (2023)
Low-Rank Extragradient Method for Nonsmooth and Low-Rank Matrix Optimization Problems
di: Garber, Dan, et al.
Pubblicazione: (2022)
di: Garber, Dan, et al.
Pubblicazione: (2022)
Extragradient Method for $(L_0, L_1)$-Lipschitz Root-finding Problems
di: Choudhury, Sayantan, et al.
Pubblicazione: (2025)
di: Choudhury, Sayantan, et al.
Pubblicazione: (2025)
Parameter-Free Non-Ergodic Extragradient Algorithms for Solving Monotone Variational Inequalities
di: Shen, Lingqing, et al.
Pubblicazione: (2026)
di: Shen, Lingqing, et al.
Pubblicazione: (2026)
Exploiting Low-Rank Structure in Max-K-Cut Problems
di: Stevens, Ria, et al.
Pubblicazione: (2026)
di: Stevens, Ria, et al.
Pubblicazione: (2026)
Fast Computation of Optimal Transport via Entropy-Regularized Extragradient Methods
di: Li, Gen, et al.
Pubblicazione: (2023)
di: Li, Gen, et al.
Pubblicazione: (2023)
Thinking Out of the Box: Hybrid SAT Solving by Unconstrained Continuous Optimization
di: Zhang, Zhiwei, et al.
Pubblicazione: (2025)
di: Zhang, Zhiwei, et al.
Pubblicazione: (2025)
Leveraging Continuous Time to Understand Momentum When Training Diagonal Linear Networks
di: Papazov, Hristo, et al.
Pubblicazione: (2024)
di: Papazov, Hristo, et al.
Pubblicazione: (2024)
RecCrysFormer: Refined Protein Structural Prediction from 3D Patterson Maps via Recycling Training Runs
di: Pan, Tom, et al.
Pubblicazione: (2025)
di: Pan, Tom, et al.
Pubblicazione: (2025)
Stochastic Extragradient with Random Reshuffling: Improved Convergence for Variational Inequalities
di: Emmanouilidis, Konstantinos, et al.
Pubblicazione: (2024)
di: Emmanouilidis, Konstantinos, et al.
Pubblicazione: (2024)
SGD with Adaptive Preconditioning: Unified Analysis and Momentum Acceleration
di: Kovalev, Dmitry
Pubblicazione: (2025)
di: Kovalev, Dmitry
Pubblicazione: (2025)
Improved Analysis for Sign-based Methods with Momentum Updates
di: Jiang, Wei, et al.
Pubblicazione: (2025)
di: Jiang, Wei, et al.
Pubblicazione: (2025)
Using non-convex optimization in quantum process tomography: Factored gradient descent is tough to beat
di: Quiroga, David A., et al.
Pubblicazione: (2023)
di: Quiroga, David A., et al.
Pubblicazione: (2023)
Learning to Specialize: Joint Gating-Expert Training for Adaptive MoEs in Decentralized Settings
di: Farhat, Yehya, et al.
Pubblicazione: (2023)
di: Farhat, Yehya, et al.
Pubblicazione: (2023)
Accelerated Stochastic Min-Max Optimization Based on Bias-corrected Momentum
di: Cai, Haoyuan, et al.
Pubblicazione: (2024)
di: Cai, Haoyuan, et al.
Pubblicazione: (2024)
Documenti analoghi
-
On the Error-Propagation of Inexact Hotelling's Deflation for Principal Component Analysis
di: Liao, Fangshuo, et al.
Pubblicazione: (2023) -
A Catalyst Framework for the Quantum Linear System Problem via the Proximal Point Algorithm
di: Kim, Junhyung Lyle, et al.
Pubblicazione: (2024) -
Provable Accelerated Convergence of Nesterov's Momentum for Deep ReLU Neural Networks
di: Liao, Fangshuo, et al.
Pubblicazione: (2023) -
Solving Hidden Monotone Variational Inequalities with Surrogate Losses
di: D'Orazio, Ryan, et al.
Pubblicazione: (2024) -
Adaptive Federated Learning with Auto-Tuned Clients
di: Kim, Junhyung Lyle, et al.
Pubblicazione: (2023)