Gespeichert in:
| Hauptverfasser: | Yao, Yunzhen, He, Lie, Gastpar, Michael |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2025
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2501.18282 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
Non-Asymptotic Analysis of Efficiency in Conformalized Regression
von: Yao, Yunzhen, et al.
Veröffentlicht: (2025)
von: Yao, Yunzhen, et al.
Veröffentlicht: (2025)
PILAF: Optimal Human Preference Sampling for Reward Modeling
von: Feng, Yunzhen, et al.
Veröffentlicht: (2025)
von: Feng, Yunzhen, et al.
Veröffentlicht: (2025)
zip2zip: Inference-Time Adaptive Tokenization via Online Compression
von: Geng, Saibo, et al.
Veröffentlicht: (2025)
von: Geng, Saibo, et al.
Veröffentlicht: (2025)
Block-Sample MAC-Bayes Generalization Bounds
von: Frey, Matthias, et al.
Veröffentlicht: (2026)
von: Frey, Matthias, et al.
Veröffentlicht: (2026)
Joint Consistency: A Unified Test-Time Aggregation Framework via Energy Minimization
von: Yao, Yunzhen, et al.
Veröffentlicht: (2026)
von: Yao, Yunzhen, et al.
Veröffentlicht: (2026)
The Conditional Regret-Capacity Theorem for Batch Universal Prediction
von: Bondaschi, Marco, et al.
Veröffentlicht: (2025)
von: Bondaschi, Marco, et al.
Veröffentlicht: (2025)
Batch Universal Prediction
von: Bondaschi, Marco, et al.
Veröffentlicht: (2024)
von: Bondaschi, Marco, et al.
Veröffentlicht: (2024)
Don't Waste Mistakes: Leveraging Negative RL-Groups via Confidence Reweighting
von: Feng, Yunzhen, et al.
Veröffentlicht: (2025)
von: Feng, Yunzhen, et al.
Veröffentlicht: (2025)
Determining Layer-wise Sparsity for Large Language Models Through a Theoretical Perspective
von: Huang, Weizhong, et al.
Veröffentlicht: (2025)
von: Huang, Weizhong, et al.
Veröffentlicht: (2025)
Boosting Robustness in Preference-Based Reinforcement Learning with Dynamic Sparsity
von: Muslimani, Calarina, et al.
Veröffentlicht: (2024)
von: Muslimani, Calarina, et al.
Veröffentlicht: (2024)
Amber Pruner: Leveraging N:M Activation Sparsity for Efficient Prefill in Large Language Models
von: An, Tai, et al.
Veröffentlicht: (2025)
von: An, Tai, et al.
Veröffentlicht: (2025)
Which Algorithms Have Tight Generalization Bounds?
von: Gastpar, Michael, et al.
Veröffentlicht: (2024)
von: Gastpar, Michael, et al.
Veröffentlicht: (2024)
DeLTa: A Decoding Strategy based on Logit Trajectory Prediction Improves Factuality and Reasoning Ability
von: He, Yunzhen, et al.
Veröffentlicht: (2025)
von: He, Yunzhen, et al.
Veröffentlicht: (2025)
Information Theoretic Perspective on Representation Learning
von: Pereg, Deborah, et al.
Veröffentlicht: (2026)
von: Pereg, Deborah, et al.
Veröffentlicht: (2026)
The Fundamental Limits of Least-Privilege Learning
von: Stadler, Theresa, et al.
Veröffentlicht: (2024)
von: Stadler, Theresa, et al.
Veröffentlicht: (2024)
Preference VLM: Leveraging VLMs for Scalable Preference-Based Reinforcement Learning
von: Ghosh, Udita, et al.
Veröffentlicht: (2025)
von: Ghosh, Udita, et al.
Veröffentlicht: (2025)
Sampling Foundational Transformer: A Theoretical Perspective
von: Nguyen, Viet Anh, et al.
Veröffentlicht: (2024)
von: Nguyen, Viet Anh, et al.
Veröffentlicht: (2024)
Activity Sparsity Complements Weight Sparsity for Efficient RNN Inference
von: Mukherji, Rishav, et al.
Veröffentlicht: (2023)
von: Mukherji, Rishav, et al.
Veröffentlicht: (2023)
The Sample Complexity of Online Reinforcement Learning: A Multi-model Perspective
von: Muehlebach, Michael, et al.
Veröffentlicht: (2025)
von: Muehlebach, Michael, et al.
Veröffentlicht: (2025)
Batch Normalization Decomposed
von: Nachum, Ido, et al.
Veröffentlicht: (2024)
von: Nachum, Ido, et al.
Veröffentlicht: (2024)
Sparsity Forcing: Reinforcing Token Sparsity of MLLMs
von: Chen, Feng, et al.
Veröffentlicht: (2025)
von: Chen, Feng, et al.
Veröffentlicht: (2025)
Random Projections and Natural Sparsity in Time-Series Classification: A Theoretical Analysis
von: Marco-Blanco, Jorge, et al.
Veröffentlicht: (2025)
von: Marco-Blanco, Jorge, et al.
Veröffentlicht: (2025)
Multi-Task Learning for Sparsity Pattern Heterogeneity: Statistical and Computational Perspectives
von: Behdin, Kayhan, et al.
Veröffentlicht: (2022)
von: Behdin, Kayhan, et al.
Veröffentlicht: (2022)
Model Collapse Demystified: The Case of Regression
von: Dohmatob, Elvis, et al.
Veröffentlicht: (2024)
von: Dohmatob, Elvis, et al.
Veröffentlicht: (2024)
Sample-Efficient Preference-based Reinforcement Learning with Dynamics Aware Rewards
von: Metcalf, Katherine, et al.
Veröffentlicht: (2024)
von: Metcalf, Katherine, et al.
Veröffentlicht: (2024)
Locally Private Parametric Methods for Change-Point Detection
von: Yadav, Anuj Kumar, et al.
Veröffentlicht: (2026)
von: Yadav, Anuj Kumar, et al.
Veröffentlicht: (2026)
Strong Model Collapse
von: Dohmatob, Elvis, et al.
Veröffentlicht: (2024)
von: Dohmatob, Elvis, et al.
Veröffentlicht: (2024)
Do Efficient Transformers Really Save Computation?
von: Yang, Kai, et al.
Veröffentlicht: (2024)
von: Yang, Kai, et al.
Veröffentlicht: (2024)
Enhancing In-Context Learning Performance with just SVD-Based Weight Pruning: A Theoretical Perspective
von: Yao, Xinhao, et al.
Veröffentlicht: (2024)
von: Yao, Xinhao, et al.
Veröffentlicht: (2024)
Learning Parametric Distributions from Samples and Preferences
von: Jourdan, Marc, et al.
Veröffentlicht: (2025)
von: Jourdan, Marc, et al.
Veröffentlicht: (2025)
CoBo: Collaborative Learning via Bilevel Optimization
von: Hashemi, Diba, et al.
Veröffentlicht: (2024)
von: Hashemi, Diba, et al.
Veröffentlicht: (2024)
A Sparsity Principle for Partially Observable Causal Representation Learning
von: Xu, Danru, et al.
Veröffentlicht: (2024)
von: Xu, Danru, et al.
Veröffentlicht: (2024)
Multi-Type Preference Learning: Empowering Preference-Based Reinforcement Learning with Equal Preferences
von: Liu, Ziang, et al.
Veröffentlicht: (2024)
von: Liu, Ziang, et al.
Veröffentlicht: (2024)
Sparse-Reg: Improving Sample Complexity in Offline Reinforcement Learning using Sparsity
von: Arnob, Samin Yeasar, et al.
Veröffentlicht: (2025)
von: Arnob, Samin Yeasar, et al.
Veröffentlicht: (2025)
Local to Global: Learning Dynamics and Effect of Initialization for Transformers
von: Makkuva, Ashok Vardhan, et al.
Veröffentlicht: (2024)
von: Makkuva, Ashok Vardhan, et al.
Veröffentlicht: (2024)
Unlocking the Power of Rehearsal in Continual Learning: A Theoretical Perspective
von: Deng, Junze, et al.
Veröffentlicht: (2025)
von: Deng, Junze, et al.
Veröffentlicht: (2025)
On the Cost and Benefit of Chain of Thought: A Learning-Theoretic Perspective
von: Zhang, Yue, et al.
Veröffentlicht: (2026)
von: Zhang, Yue, et al.
Veröffentlicht: (2026)
Large-Margin Hyperdimensional Computing: A Learning-Theoretical Perspective
von: Zeulin, Nikita, et al.
Veröffentlicht: (2026)
von: Zeulin, Nikita, et al.
Veröffentlicht: (2026)
Predicting Plasticity in Deep Continual Learning: A Theoretical Perspective
von: Wang, Jiuqi, et al.
Veröffentlicht: (2026)
von: Wang, Jiuqi, et al.
Veröffentlicht: (2026)
TERMINATOR: Learning Optimal Exit Points for Early Stopping in Chain-of-Thought Reasoning
von: Nagle, Alliot, et al.
Veröffentlicht: (2026)
von: Nagle, Alliot, et al.
Veröffentlicht: (2026)
Ähnliche Einträge
-
Non-Asymptotic Analysis of Efficiency in Conformalized Regression
von: Yao, Yunzhen, et al.
Veröffentlicht: (2025) -
PILAF: Optimal Human Preference Sampling for Reward Modeling
von: Feng, Yunzhen, et al.
Veröffentlicht: (2025) -
zip2zip: Inference-Time Adaptive Tokenization via Online Compression
von: Geng, Saibo, et al.
Veröffentlicht: (2025) -
Block-Sample MAC-Bayes Generalization Bounds
von: Frey, Matthias, et al.
Veröffentlicht: (2026) -
Joint Consistency: A Unified Test-Time Aggregation Framework via Energy Minimization
von: Yao, Yunzhen, et al.
Veröffentlicht: (2026)