Enregistré dans:
| Auteur principal: | Menghani, Gaurav |
|---|---|
| Format: | Preprint |
| Publié: |
2021
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2106.08962 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
LAuReL: Learned Augmented Residual Layer
par: Menghani, Gaurav, et autres
Publié: (2024)
par: Menghani, Gaurav, et autres
Publié: (2024)
GUIDE: Guided Initialization and Distillation of Embeddings
par: Trinh, Khoa, et autres
Publié: (2025)
par: Trinh, Khoa, et autres
Publié: (2025)
Smaller, Faster, Cheaper: Architectural Designs for Efficient Machine Learning
par: Walton, Steven
Publié: (2025)
par: Walton, Steven
Publié: (2025)
FERRET: Private Deep Learning Faster And Better Than DPSGD
par: Zagardo, David
Publié: (2025)
par: Zagardo, David
Publié: (2025)
Smaller But Better: Unifying Layout Generation with Smaller Large Language Models
par: Zhang, Peirong, et autres
Publié: (2025)
par: Zhang, Peirong, et autres
Publié: (2025)
Resource-Efficient Deep Learning: A Survey on Model-, Arithmetic-, and Implementation-Level Techniques
par: Lee, JunKyu, et autres
Publié: (2021)
par: Lee, JunKyu, et autres
Publié: (2021)
Sig-DEG for Distillation: Making Diffusion Models Faster and Lighter
par: Jiang, Lei, et autres
Publié: (2025)
par: Jiang, Lei, et autres
Publié: (2025)
Earthquake Damage Grades Prediction using An Ensemble Approach Integrating Advanced Machine and Deep Learning Models
par: Panda, Anurag, et autres
Publié: (2025)
par: Panda, Anurag, et autres
Publié: (2025)
FREE: Faster and Better Data-Free Meta-Learning
par: Wei, Yongxian, et autres
Publié: (2024)
par: Wei, Yongxian, et autres
Publié: (2024)
Deep Learning and Foundation Models for Weather Prediction: A Survey
par: Shi, Jimeng, et autres
Publié: (2025)
par: Shi, Jimeng, et autres
Publié: (2025)
Hyperbolic Deep Learning for Foundation Models: A Survey
par: He, Neil, et autres
Publié: (2025)
par: He, Neil, et autres
Publié: (2025)
Reward Models in Deep Reinforcement Learning: A Survey
par: Yu, Rui, et autres
Publié: (2025)
par: Yu, Rui, et autres
Publié: (2025)
Why and When Deep is Better than Shallow: Implementation-Agnostic State-Transition Model of Deep Learning
par: Sonoda, Sho, et autres
Publié: (2025)
par: Sonoda, Sho, et autres
Publié: (2025)
A Survey on Deep Tabular Learning
par: Somvanshi, Shriyank, et autres
Publié: (2024)
par: Somvanshi, Shriyank, et autres
Publié: (2024)
Smaller Language Models are Better Black-box Machine-Generated Text Detectors
par: Mireshghallah, Niloofar, et autres
Publié: (2023)
par: Mireshghallah, Niloofar, et autres
Publié: (2023)
Faster, Smaller, and Smarter: Task-Aware Expert Merging for Online MoE Inference
par: Han, Ziyi, et autres
Publié: (2025)
par: Han, Ziyi, et autres
Publié: (2025)
A Survey of Deep Learning and Foundation Models for Time Series Forecasting
par: Miller, John A., et autres
Publié: (2024)
par: Miller, John A., et autres
Publié: (2024)
A Survey on Uncertainty Quantification Methods for Deep Learning
par: He, Wenchong, et autres
Publié: (2023)
par: He, Wenchong, et autres
Publié: (2023)
500+ Times Faster Than Deep Learning (A Case Study Exploring Faster Methods for Text Mining StackOverflow)
par: Majumder, Suvodeep, et autres
Publié: (2018)
par: Majumder, Suvodeep, et autres
Publié: (2018)
From Tiny Machine Learning to Tiny Deep Learning: A Survey
par: Somvanshi, Shriyank, et autres
Publié: (2025)
par: Somvanshi, Shriyank, et autres
Publié: (2025)
Sample-Efficient Reinforcement Learning Controller for Deep Brain Stimulation in Parkinson's Disease
par: Ravivarapu, Harsh, et autres
Publié: (2025)
par: Ravivarapu, Harsh, et autres
Publié: (2025)
A Survey on Explainable Deep Reinforcement Learning
par: Cheng, Zelei, et autres
Publié: (2025)
par: Cheng, Zelei, et autres
Publié: (2025)
Late-to-Early Training: LET LLMs Learn Earlier, So Faster and Better
par: Zhao, Ji, et autres
Publié: (2026)
par: Zhao, Ji, et autres
Publié: (2026)
A Survey of State Representation Learning for Deep Reinforcement Learning
par: Echchahed, Ayoub, et autres
Publié: (2025)
par: Echchahed, Ayoub, et autres
Publié: (2025)
Efficient Preference-Based Reinforcement Learning Using Learned Dynamics Models
par: Liu, Yi, et autres
Publié: (2023)
par: Liu, Yi, et autres
Publié: (2023)
Is Smaller Always Faster? Tradeoffs in Compressing Self-Supervised Speech Transformers
par: Lin, Tzu-Quan, et autres
Publié: (2022)
par: Lin, Tzu-Quan, et autres
Publié: (2022)
Higher Resolution, Better Generalization: Unlocking Visual Scaling in Deep Reinforcement Learning
par: Trumpp, Raphael, et autres
Publié: (2026)
par: Trumpp, Raphael, et autres
Publié: (2026)
Sparser, Better, Faster, Stronger: Sparsity Detection for Efficient Automatic Differentiation
par: Hill, Adrian, et autres
Publié: (2025)
par: Hill, Adrian, et autres
Publié: (2025)
The AdEMAMix Optimizer: Better, Faster, Older
par: Pagliardini, Matteo, et autres
Publié: (2024)
par: Pagliardini, Matteo, et autres
Publié: (2024)
Efficient Deep Learning with Decorrelated Backpropagation
par: Dalm, Sander, et autres
Publié: (2024)
par: Dalm, Sander, et autres
Publié: (2024)
A Survey on State-of-the-art Deep Learning Applications and Challenges
par: Noor, Mohd Halim Mohd, et autres
Publié: (2024)
par: Noor, Mohd Halim Mohd, et autres
Publié: (2024)
Deep Learning Advancements in Anomaly Detection: A Comprehensive Survey
par: Huang, Haoqi, et autres
Publié: (2025)
par: Huang, Haoqi, et autres
Publié: (2025)
Deep Reinforcement Learning for Autonomous Cyber Defence: A Survey
par: Palmer, Gregory, et autres
Publié: (2023)
par: Palmer, Gregory, et autres
Publié: (2023)
ANO : Faster is Better in Noisy Landscape
par: Kegreisz, Adrien
Publié: (2025)
par: Kegreisz, Adrien
Publié: (2025)
Making Batch Normalization Great in Federated Deep Learning
par: Zhong, Jike, et autres
Publié: (2023)
par: Zhong, Jike, et autres
Publié: (2023)
Deep Grokking: Would Deep Neural Networks Generalize Better?
par: Fan, Simin, et autres
Publié: (2024)
par: Fan, Simin, et autres
Publié: (2024)
Deep Generative Models in Robotics: A Survey on Learning from Multimodal Demonstrations
par: Urain, Julen, et autres
Publié: (2024)
par: Urain, Julen, et autres
Publié: (2024)
A Survey Analyzing Generalization in Deep Reinforcement Learning
par: Korkmaz, Ezgi
Publié: (2024)
par: Korkmaz, Ezgi
Publié: (2024)
A Survey of Deep Learning: From Activations to Transformers
par: Schneider, Johannes, et autres
Publié: (2023)
par: Schneider, Johannes, et autres
Publié: (2023)
Calibration in Deep Learning: A Survey of the State-of-the-Art
par: Wang, Cheng
Publié: (2023)
par: Wang, Cheng
Publié: (2023)
Documents similaires
-
LAuReL: Learned Augmented Residual Layer
par: Menghani, Gaurav, et autres
Publié: (2024) -
GUIDE: Guided Initialization and Distillation of Embeddings
par: Trinh, Khoa, et autres
Publié: (2025) -
Smaller, Faster, Cheaper: Architectural Designs for Efficient Machine Learning
par: Walton, Steven
Publié: (2025) -
FERRET: Private Deep Learning Faster And Better Than DPSGD
par: Zagardo, David
Publié: (2025) -
Smaller But Better: Unifying Layout Generation with Smaller Large Language Models
par: Zhang, Peirong, et autres
Publié: (2025)