Gespeichert in:
| Hauptverfasser: | Rajabi, Sahar, Nonta, Nayeema, Rambhatla, Sirisha |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2025
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2502.01586 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
Randomized Gradient Subspaces for Efficient Large Language Model Training
von: Rajabi, Sahar, et al.
Veröffentlicht: (2025)
von: Rajabi, Sahar, et al.
Veröffentlicht: (2025)
SafeTuneBed: A Toolkit for Benchmarking LLM Safety Alignment in Fine-Tuning
von: Hossain, Saad, et al.
Veröffentlicht: (2025)
von: Hossain, Saad, et al.
Veröffentlicht: (2025)
TamperBench: Systematically Stress-Testing LLM Safety Under Fine-Tuning and Tampering
von: Hossain, Saad, et al.
Veröffentlicht: (2026)
von: Hossain, Saad, et al.
Veröffentlicht: (2026)
Gradient Multi-Normalization for Stateless and Scalable LLM Training
von: Scetbon, Meyer, et al.
Veröffentlicht: (2025)
von: Scetbon, Meyer, et al.
Veröffentlicht: (2025)
CapTrack: Multifaceted Evaluation of Forgetting in LLM Post-Training
von: Thede, Lukas, et al.
Veröffentlicht: (2026)
von: Thede, Lukas, et al.
Veröffentlicht: (2026)
Lotus: Efficient LLM Training by Randomized Low-Rank Gradient Projection with Adaptive Subspace Switching
von: Miao, Tianhao, et al.
Veröffentlicht: (2026)
von: Miao, Tianhao, et al.
Veröffentlicht: (2026)
Tracking the Feature Dynamics in LLM Training: A Mechanistic Study
von: Xu, Yang, et al.
Veröffentlicht: (2024)
von: Xu, Yang, et al.
Veröffentlicht: (2024)
Powering Up Zeroth-Order Training via Subspace Gradient Orthogonalization
von: Lang, Yicheng, et al.
Veröffentlicht: (2026)
von: Lang, Yicheng, et al.
Veröffentlicht: (2026)
Diffusion Autoencoders are Scalable Image Tokenizers
von: Chen, Yinbo, et al.
Veröffentlicht: (2025)
von: Chen, Yinbo, et al.
Veröffentlicht: (2025)
Deep Q-Learning with Gradient Target Tracking
von: Park, Bum Geun, et al.
Veröffentlicht: (2025)
von: Park, Bum Geun, et al.
Veröffentlicht: (2025)
Learning Scalable Model Soup on a Single GPU: An Efficient Subspace Training Strategy
von: Li, Tao, et al.
Veröffentlicht: (2024)
von: Li, Tao, et al.
Veröffentlicht: (2024)
SelfEval: Leveraging the discriminative nature of generative models for evaluation
von: Rambhatla, Sai Saketh, et al.
Veröffentlicht: (2023)
von: Rambhatla, Sai Saketh, et al.
Veröffentlicht: (2023)
Optimized Gradient Tracking for Decentralized Online Learning
von: Sharma, Shivangi Dubey, et al.
Veröffentlicht: (2023)
von: Sharma, Shivangi Dubey, et al.
Veröffentlicht: (2023)
Log Probability Tracking of LLM APIs
von: Chauvin, Timothée, et al.
Veröffentlicht: (2025)
von: Chauvin, Timothée, et al.
Veröffentlicht: (2025)
Memory-Efficient LLM Training with Online Subspace Descent
von: Liang, Kaizhao, et al.
Veröffentlicht: (2024)
von: Liang, Kaizhao, et al.
Veröffentlicht: (2024)
LOCATEdit: Graph Laplacian Optimized Cross Attention for Localized Text-Guided Image Editing
von: Soni, Achint, et al.
Veröffentlicht: (2025)
von: Soni, Achint, et al.
Veröffentlicht: (2025)
Identifying Policy Gradient Subspaces
von: Schneider, Jan, et al.
Veröffentlicht: (2024)
von: Schneider, Jan, et al.
Veröffentlicht: (2024)
PRAC: Principal-Random Subspace for LLM Activation Compression and Memory-Efficient Training
von: Li, Yanyi, et al.
Veröffentlicht: (2026)
von: Li, Yanyi, et al.
Veröffentlicht: (2026)
SOMP: Scalable Gradient Inversion for Large Language Models via Subspace-Guided Orthogonal Matching Pursuit
von: Li, Yibo, et al.
Veröffentlicht: (2026)
von: Li, Yibo, et al.
Veröffentlicht: (2026)
Robust Decentralized Learning with Local Updates and Gradient Tracking
von: Ghiasvand, Sajjad, et al.
Veröffentlicht: (2024)
von: Ghiasvand, Sajjad, et al.
Veröffentlicht: (2024)
LangDA: Building Context-Awareness via Language for Domain Adaptive Semantic Segmentation
von: Liu, Chang, et al.
Veröffentlicht: (2025)
von: Liu, Chang, et al.
Veröffentlicht: (2025)
A Weighted Gradient Tracking Privacy-Preserving Method for Distributed Optimization
von: Xie, Furan, et al.
Veröffentlicht: (2025)
von: Xie, Furan, et al.
Veröffentlicht: (2025)
Accelerated Gradient Tracking over Time-varying Graphs for Decentralized Optimization
von: Li, Huan, et al.
Veröffentlicht: (2021)
von: Li, Huan, et al.
Veröffentlicht: (2021)
Muon is Scalable for LLM Training
von: Liu, Jingyuan, et al.
Veröffentlicht: (2025)
von: Liu, Jingyuan, et al.
Veröffentlicht: (2025)
Context-Based Fake News Detection using Graph Based Approach: ACOVID-19 Use-case
von: Muniyappa, Chandrashekar, et al.
Veröffentlicht: (2025)
von: Muniyappa, Chandrashekar, et al.
Veröffentlicht: (2025)
Decentralized Optimization on Compact Submanifolds by Quantized Riemannian Gradient Tracking
von: Chen, Jun, et al.
Veröffentlicht: (2025)
von: Chen, Jun, et al.
Veröffentlicht: (2025)
High-Probability Convergence in Decentralized Stochastic Optimization with Gradient Tracking
von: Armacki, Aleksandar, et al.
Veröffentlicht: (2026)
von: Armacki, Aleksandar, et al.
Veröffentlicht: (2026)
Enhancing Convergence of Decentralized Gradient Tracking under the KL Property
von: Chen, Xiaokai, et al.
Veröffentlicht: (2024)
von: Chen, Xiaokai, et al.
Veröffentlicht: (2024)
EnviroLLM: Resource Tracking and Optimization for Local AI
von: Allen, Troy
Veröffentlicht: (2025)
von: Allen, Troy
Veröffentlicht: (2025)
FuSeFL: Fully Secure and Scalable Federated Learning
von: Ghinani, Sahar Ghoflsaz, et al.
Veröffentlicht: (2025)
von: Ghinani, Sahar Ghoflsaz, et al.
Veröffentlicht: (2025)
Decentralized Federated Learning with Gradient Tracking over Time-Varying Directed Networks
von: Nguyen, Duong Thuy Anh, et al.
Veröffentlicht: (2024)
von: Nguyen, Duong Thuy Anh, et al.
Veröffentlicht: (2024)
TRAVEL: Training-Free Retrieval and Alignment for Vision-and-Language Navigation
von: Rajabi, Navid, et al.
Veröffentlicht: (2025)
von: Rajabi, Navid, et al.
Veröffentlicht: (2025)
BootsTAP: Bootstrapped Training for Tracking-Any-Point
von: Doersch, Carl, et al.
Veröffentlicht: (2024)
von: Doersch, Carl, et al.
Veröffentlicht: (2024)
Fast Decentralized Gradient Tracking for Federated Minimax Optimization with Local Updates
von: Li, Chris Junchi
Veröffentlicht: (2024)
von: Li, Chris Junchi
Veröffentlicht: (2024)
Convergence of Byzantine-Resilient Gradient Tracking via Probabilistic Edge Dropout
von: Dezhboro, Amirhossein, et al.
Veröffentlicht: (2026)
von: Dezhboro, Amirhossein, et al.
Veröffentlicht: (2026)
GraphRank Pro+: Advancing Talent Analytics Through Knowledge Graphs and Sentiment-Enhanced Skill Profiling
von: Velampalli, Sirisha, et al.
Veröffentlicht: (2025)
von: Velampalli, Sirisha, et al.
Veröffentlicht: (2025)
Decentralized Nonconvex Composite Federated Learning with Gradient Tracking and Momentum
von: Zhou, Yuan, et al.
Veröffentlicht: (2025)
von: Zhou, Yuan, et al.
Veröffentlicht: (2025)
SUMO: Subspace-Aware Moment-Orthogonalization for Accelerating Memory-Efficient LLM Training
von: Refael, Yehonathan, et al.
Veröffentlicht: (2025)
von: Refael, Yehonathan, et al.
Veröffentlicht: (2025)
Fast and Scalable Semi-Supervised Learning for Multi-View Subspace Clustering
von: Ling, Huaming, et al.
Veröffentlicht: (2024)
von: Ling, Huaming, et al.
Veröffentlicht: (2024)
Beyond Scaffold: A Unified Spatio-Temporal Gradient Tracking Method
von: Huang, Yan, et al.
Veröffentlicht: (2025)
von: Huang, Yan, et al.
Veröffentlicht: (2025)
Ähnliche Einträge
-
Randomized Gradient Subspaces for Efficient Large Language Model Training
von: Rajabi, Sahar, et al.
Veröffentlicht: (2025) -
SafeTuneBed: A Toolkit for Benchmarking LLM Safety Alignment in Fine-Tuning
von: Hossain, Saad, et al.
Veröffentlicht: (2025) -
TamperBench: Systematically Stress-Testing LLM Safety Under Fine-Tuning and Tampering
von: Hossain, Saad, et al.
Veröffentlicht: (2026) -
Gradient Multi-Normalization for Stateless and Scalable LLM Training
von: Scetbon, Meyer, et al.
Veröffentlicht: (2025) -
CapTrack: Multifaceted Evaluation of Forgetting in LLM Post-Training
von: Thede, Lukas, et al.
Veröffentlicht: (2026)