Enregistré dans:
| Auteurs principaux: | Seddik, Fahd, Elbedewy, Abdulrahman, Sami, Gaser, Abdelmoniem, Mohamed, Zakaria, Yahia |
|---|---|
| Format: | Preprint |
| Publié: |
2026
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2601.15473 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
High-dimensional Learning with Noisy Labels
par: Firdoussi, Aymane El, et autres
Publié: (2024)
par: Firdoussi, Aymane El, et autres
Publié: (2024)
Sample and Oracle Efficient Reinforcement Learning for MDPs with Linearly-Realizable Value Functions
par: Mhammedi, Zakaria
Publié: (2024)
par: Mhammedi, Zakaria
Publié: (2024)
Practical Insights into Knowledge Distillation for Pre-Trained Models
par: Alballa, Norah, et autres
Publié: (2024)
par: Alballa, Norah, et autres
Publié: (2024)
Maximizing the Potential of Synthetic Data: Insights from Random Matrix Theory
par: Firdoussi, Aymane El, et autres
Publié: (2024)
par: Firdoussi, Aymane El, et autres
Publié: (2024)
A Meta-learning based Stacked Regression Approach for Customer Lifetime Value Prediction
par: Gadgil, Karan, et autres
Publié: (2023)
par: Gadgil, Karan, et autres
Publié: (2023)
Stock Market Price Prediction: A Hybrid LSTM and Sequential Self-Attention based Approach
par: Pardeshi, Karan, et autres
Publié: (2023)
par: Pardeshi, Karan, et autres
Publié: (2023)
$α$-LoRA: Effective Fine-Tuning via Base Model Rescaling
par: Firdoussi, Aymane El, et autres
Publié: (2025)
par: Firdoussi, Aymane El, et autres
Publié: (2025)
Noise-corrected GRPO: From Noisy Rewards to Unbiased Gradients
par: Mansouri, Omar El, et autres
Publié: (2025)
par: Mansouri, Omar El, et autres
Publié: (2025)
Towards Cheaper Inference in Deep Networks with Lower Bit-Width Accumulators
par: Blumenfeld, Yaniv, et autres
Publié: (2024)
par: Blumenfeld, Yaniv, et autres
Publié: (2024)
A Communication and Computation Efficient Fully First-order Method for Decentralized Bilevel Optimization
par: Wen, Min, et autres
Publié: (2024)
par: Wen, Min, et autres
Publié: (2024)
How Bad is Training on Synthetic Data? A Statistical Analysis of Language Model Collapse
par: Seddik, Mohamed El Amine, et autres
Publié: (2024)
par: Seddik, Mohamed El Amine, et autres
Publié: (2024)
Linear Transformers Implicitly Discover Unified Numerical Algorithms
par: Lutz, Patrick, et autres
Publié: (2025)
par: Lutz, Patrick, et autres
Publié: (2025)
Closed-Form Interpretation of Neural Network Latent Spaces with Symbolic Gradients
par: Wetzel, Sebastian J., et autres
Publié: (2024)
par: Wetzel, Sebastian J., et autres
Publié: (2024)
MC-RFM: Geometry-Aware Few-Shot Adaptation via Mixed-Curvature Riemannian Flow Matching
par: Khazem, Salim, et autres
Publié: (2026)
par: Khazem, Salim, et autres
Publié: (2026)
DeepFusion: Accelerating MoE Training via Federated Knowledge Distillation from Heterogeneous Edge Devices
par: Li, Songyuan, et autres
Publié: (2026)
par: Li, Songyuan, et autres
Publié: (2026)
Faster, Cheaper, Better: Multi-Objective Hyperparameter Optimization for LLM and RAG Systems
par: Barker, Matthew, et autres
Publié: (2025)
par: Barker, Matthew, et autres
Publié: (2025)
The Price Reversal Phenomenon: When Cheaper Reasoning Models Cost More
par: Chen, Lingjiao, et autres
Publié: (2026)
par: Chen, Lingjiao, et autres
Publié: (2026)
Causal Direction from Convergence Time: Faster Training in the True Causal Direction
par: Tamim, Abdulrahman
Publié: (2026)
par: Tamim, Abdulrahman
Publié: (2026)
Is a Good Foundation Necessary for Efficient Reinforcement Learning? The Computational Role of the Base Model in Exploration
par: Foster, Dylan J., et autres
Publié: (2025)
par: Foster, Dylan J., et autres
Publié: (2025)
Sign-Symmetry Learning Rules are Robust Fine-Tuners
par: Berriche, Aymene, et autres
Publié: (2025)
par: Berriche, Aymene, et autres
Publié: (2025)
The Power of Resets in Online Reinforcement Learning
par: Mhammedi, Zakaria, et autres
Publié: (2024)
par: Mhammedi, Zakaria, et autres
Publié: (2024)
ANO : Faster is Better in Noisy Landscape
par: Kegreisz, Adrien
Publié: (2025)
par: Kegreisz, Adrien
Publié: (2025)
Federated Knowledge Transfer Fine-tuning Large Server Model with Resource-Constrained IoT Clients
par: Chen, Shaoyuan, et autres
Publié: (2024)
par: Chen, Shaoyuan, et autres
Publié: (2024)
Veli: Unsupervised Method and Unified Benchmark for Low-Cost Air Quality Sensor Correction
par: Dalbah, Yahia, et autres
Publié: (2025)
par: Dalbah, Yahia, et autres
Publié: (2025)
Standing on the Shoulders of Giants: Stabilized Knowledge Distillation for Cross--Language Code Clone Detection
par: Khajezade, Mohamad, et autres
Publié: (2026)
par: Khajezade, Mohamad, et autres
Publié: (2026)
HashAttention: Semantic Sparsity for Faster Inference
par: Desai, Aditya, et autres
Publié: (2024)
par: Desai, Aditya, et autres
Publié: (2024)
Calibrated Dataset Condensation for Faster Hyperparameter Search
par: Ding, Mucong, et autres
Publié: (2024)
par: Ding, Mucong, et autres
Publié: (2024)
On Faster Marginalization with Squared Circuits via Orthonormalization
par: Loconte, Lorenzo, et autres
Publié: (2024)
par: Loconte, Lorenzo, et autres
Publié: (2024)
Adaptive Hoeffding Tree with Transfer Learning for Streaming Synchrophasor Data Sets
par: Mrabet, Zakaria El, et autres
Publié: (2025)
par: Mrabet, Zakaria El, et autres
Publié: (2025)
A Comparison of Baseline Models and a Transformer Network for SOC Prediction in Lithium-Ion Batteries
par: Aboueidah, Hadeel, et autres
Publié: (2024)
par: Aboueidah, Hadeel, et autres
Publié: (2024)
Robust Deep Monte Carlo Counterfactual Regret Minimization: Addressing Theoretical Risks in Neural Fictitious Self-Play
par: Jaafari, Zakaria El
Publié: (2025)
par: Jaafari, Zakaria El
Publié: (2025)
Mashup Learning: Faster Finetuning by Remixing Past Checkpoints
par: Vaina, Sofia Maria Lo Cicero, et autres
Publié: (2026)
par: Vaina, Sofia Maria Lo Cicero, et autres
Publié: (2026)
On Tuning Neural ODE for Stability, Consistency and Faster Convergence
par: Akhtar, Sheikh Waqas
Publié: (2023)
par: Akhtar, Sheikh Waqas
Publié: (2023)
On the Role of DAG topology in Energy-Aware Cloud Scheduling : A GNN-Based Deep Reinforcement Learning Approach
par: Hattay, Anas, et autres
Publié: (2026)
par: Hattay, Anas, et autres
Publié: (2026)
FLStore: Efficient Federated Learning Storage for non-training workloads
par: Khan, Ahmad Faraz, et autres
Publié: (2025)
par: Khan, Ahmad Faraz, et autres
Publié: (2025)
Retrieval-Augmented Generation for Reliable Interpretation of Radio Regulations
par: Kassimi, Zakaria El, et autres
Publié: (2025)
par: Kassimi, Zakaria El, et autres
Publié: (2025)
ReaLitE: Enrichment of Relation Embeddings in Knowledge Graphs using Numeric Literals
par: Klironomos, Antonis, et autres
Publié: (2025)
par: Klironomos, Antonis, et autres
Publié: (2025)
SPADE: Faster Drug Discovery by Learning from Sparse Data
par: Nandakumar, Rahul, et autres
Publié: (2026)
par: Nandakumar, Rahul, et autres
Publié: (2026)
FedLion: Faster Adaptive Federated Optimization with Fewer Communication
par: Tang, Zhiwei, et autres
Publié: (2024)
par: Tang, Zhiwei, et autres
Publié: (2024)
Faster Convergence for Transformer Fine-tuning with Line Search Methods
par: Kenneweg, Philip, et autres
Publié: (2024)
par: Kenneweg, Philip, et autres
Publié: (2024)
Documents similaires
-
High-dimensional Learning with Noisy Labels
par: Firdoussi, Aymane El, et autres
Publié: (2024) -
Sample and Oracle Efficient Reinforcement Learning for MDPs with Linearly-Realizable Value Functions
par: Mhammedi, Zakaria
Publié: (2024) -
Practical Insights into Knowledge Distillation for Pre-Trained Models
par: Alballa, Norah, et autres
Publié: (2024) -
Maximizing the Potential of Synthetic Data: Insights from Random Matrix Theory
par: Firdoussi, Aymane El, et autres
Publié: (2024) -
A Meta-learning based Stacked Regression Approach for Customer Lifetime Value Prediction
par: Gadgil, Karan, et autres
Publié: (2023)