Salvato in:
| Autori principali: | Wang, Chenan, Shi, Daniel H., Chen, Haipeng |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2026
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2601.12212 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
Offline Reinforcement Learning with Generative Trajectory Policies
di: Feng, Xinsong, et al.
Pubblicazione: (2025)
di: Feng, Xinsong, et al.
Pubblicazione: (2025)
Sequential Stochastic Combinatorial Optimization Using Hierarchal Reinforcement Learning
di: Feng, Xinsong, et al.
Pubblicazione: (2025)
di: Feng, Xinsong, et al.
Pubblicazione: (2025)
Sample from What You See: Visuomotor Policy Learning via Diffusion Bridge with Observation-Embedded Stochastic Differential Equation
di: Liu, Zhaoyang, et al.
Pubblicazione: (2025)
di: Liu, Zhaoyang, et al.
Pubblicazione: (2025)
SPEC-RL: Accelerating On-Policy Reinforcement Learning with Speculative Rollouts
di: Liu, Bingshuai, et al.
Pubblicazione: (2025)
di: Liu, Bingshuai, et al.
Pubblicazione: (2025)
BubbleSpec: Turning Long-Tail Bubbles into Speculative Rollout Drafts for Synchronous Reinforcement Learning
di: Xu, Yuhang, et al.
Pubblicazione: (2026)
di: Xu, Yuhang, et al.
Pubblicazione: (2026)
TS-DP: Reinforcement Speculative Decoding For Temporal Adaptive Diffusion Policy Acceleration
di: Li, Ye, et al.
Pubblicazione: (2025)
di: Li, Ye, et al.
Pubblicazione: (2025)
Detection and Recovery Against Deep Neural Network Fault Injection Attacks Based on Contrastive Learning
di: Wang, Chenan, et al.
Pubblicazione: (2024)
di: Wang, Chenan, et al.
Pubblicazione: (2024)
PRISM: Parametrically Refactoring Inference for Speculative Sampling Draft Models
di: Wang, Xuliang, et al.
Pubblicazione: (2026)
di: Wang, Xuliang, et al.
Pubblicazione: (2026)
Drama: Mamba-Enabled Model-Based Reinforcement Learning Is Sample and Parameter Efficient
di: Wang, Wenlong, et al.
Pubblicazione: (2024)
di: Wang, Wenlong, et al.
Pubblicazione: (2024)
Learning Future Representation with Synthetic Observations for Sample-efficient Reinforcement Learning
di: Liu, Xin, et al.
Pubblicazione: (2024)
di: Liu, Xin, et al.
Pubblicazione: (2024)
On the Sample Efficiency of Abstractions and Potential-Based Reward Shaping in Reinforcement Learning
di: Canonaco, Giuseppe, et al.
Pubblicazione: (2024)
di: Canonaco, Giuseppe, et al.
Pubblicazione: (2024)
Model-Free Robust Reinforcement Learning with Sample Complexity Analysis
di: Wang, Yudan, et al.
Pubblicazione: (2024)
di: Wang, Yudan, et al.
Pubblicazione: (2024)
Recursive Speculative Decoding: Accelerating LLM Inference via Sampling Without Replacement
di: Jeon, Wonseok, et al.
Pubblicazione: (2024)
di: Jeon, Wonseok, et al.
Pubblicazione: (2024)
The Two-Stage Decision-Sampling Hypothesis: Understanding the Emergence of Self-Reflection in RL-Trained LLMs
di: Zhao, Zibo, et al.
Pubblicazione: (2026)
di: Zhao, Zibo, et al.
Pubblicazione: (2026)
Shared-unique Features and Task-aware Prioritized Sampling on Multi-task Reinforcement Learning
di: Lin, Po-Shao, et al.
Pubblicazione: (2024)
di: Lin, Po-Shao, et al.
Pubblicazione: (2024)
Speculative Safety-Aware Decoding
di: Wang, Xuekang, et al.
Pubblicazione: (2025)
di: Wang, Xuekang, et al.
Pubblicazione: (2025)
Mixture of Robust Experts (MoRE):A Robust Denoising Method towards multiple perturbations
di: Cheng, Hao, et al.
Pubblicazione: (2021)
di: Cheng, Hao, et al.
Pubblicazione: (2021)
Traversal Verification for Speculative Tree Decoding
di: Weng, Yepeng, et al.
Pubblicazione: (2025)
di: Weng, Yepeng, et al.
Pubblicazione: (2025)
On The Sample Complexity Bounds In Bilevel Reinforcement Learning
di: Gaur, Mudit, et al.
Pubblicazione: (2025)
di: Gaur, Mudit, et al.
Pubblicazione: (2025)
Experiential Reinforcement Learning
di: Shi, Taiwei, et al.
Pubblicazione: (2026)
di: Shi, Taiwei, et al.
Pubblicazione: (2026)
CADENT: Gated Hybrid Distillation for Sample-Efficient Transfer in Reinforcement Learning
di: Alinejad, Mahyar, et al.
Pubblicazione: (2026)
di: Alinejad, Mahyar, et al.
Pubblicazione: (2026)
CORAL: Learning Consistent Representations across Multi-step Training with Lighter Speculative Drafter
di: Weng, Yepeng, et al.
Pubblicazione: (2025)
di: Weng, Yepeng, et al.
Pubblicazione: (2025)
Sampling-Based Safe Reinforcement Learning
di: Vignola, Luca, et al.
Pubblicazione: (2026)
di: Vignola, Luca, et al.
Pubblicazione: (2026)
On Sample-Efficient Offline Reinforcement Learning: Data Diversity, Posterior Sampling, and Beyond
di: Nguyen-Tang, Thanh, et al.
Pubblicazione: (2024)
di: Nguyen-Tang, Thanh, et al.
Pubblicazione: (2024)
GCHR : Goal-Conditioned Hindsight Regularization for Sample-Efficient Reinforcement Learning
di: Lei, Xing, et al.
Pubblicazione: (2025)
di: Lei, Xing, et al.
Pubblicazione: (2025)
Sample Efficient Active Algorithms for Offline Reinforcement Learning
di: Roy, Soumyadeep, et al.
Pubblicazione: (2026)
di: Roy, Soumyadeep, et al.
Pubblicazione: (2026)
Sample Complexity Analysis for Constrained Bilevel Reinforcement Learning
di: Saxena, Naman, et al.
Pubblicazione: (2026)
di: Saxena, Naman, et al.
Pubblicazione: (2026)
Cactus: Accelerating Auto-Regressive Decoding with Constrained Acceptance Speculative Sampling
di: Hao, Yongchang, et al.
Pubblicazione: (2026)
di: Hao, Yongchang, et al.
Pubblicazione: (2026)
Sample and Computationally Efficient Continuous-Time Reinforcement Learning with General Function Approximation
di: Zhao, Runze, et al.
Pubblicazione: (2025)
di: Zhao, Runze, et al.
Pubblicazione: (2025)
Sample-Efficient Constrained Reinforcement Learning with General Parameterization
di: Mondal, Washim Uddin, et al.
Pubblicazione: (2024)
di: Mondal, Washim Uddin, et al.
Pubblicazione: (2024)
When Drafts Evolve: Speculative Decoding Meets Online Learning
di: Qian, Yu-Yang, et al.
Pubblicazione: (2026)
di: Qian, Yu-Yang, et al.
Pubblicazione: (2026)
DIP: Dynamic In-Context Planner For Diffusion Language Models
di: Li, Yang, et al.
Pubblicazione: (2026)
di: Li, Yang, et al.
Pubblicazione: (2026)
QSpec: Speculative Decoding with Complementary Quantization Schemes
di: Zhao, Juntao, et al.
Pubblicazione: (2024)
di: Zhao, Juntao, et al.
Pubblicazione: (2024)
Reinforcement Learning for Control with Probabilistic Stability Guarantee: A Finite-Sample Approach
di: Han, Minghao, et al.
Pubblicazione: (2026)
di: Han, Minghao, et al.
Pubblicazione: (2026)
Clover: Regressive Lightweight Speculative Decoding with Sequential Knowledge
di: Xiao, Bin, et al.
Pubblicazione: (2024)
di: Xiao, Bin, et al.
Pubblicazione: (2024)
A Theoretical Perspective for Speculative Decoding Algorithm
di: Yin, Ming, et al.
Pubblicazione: (2024)
di: Yin, Ming, et al.
Pubblicazione: (2024)
Equivariant Action Sampling for Reinforcement Learning and Planning
di: Zhao, Linfeng, et al.
Pubblicazione: (2024)
di: Zhao, Linfeng, et al.
Pubblicazione: (2024)
Diffusion-DICE: In-Sample Diffusion Guidance for Offline Reinforcement Learning
di: Mao, Liyuan, et al.
Pubblicazione: (2024)
di: Mao, Liyuan, et al.
Pubblicazione: (2024)
When is Offline Policy Selection Sample Efficient for Reinforcement Learning?
di: Liu, Vincent, et al.
Pubblicazione: (2023)
di: Liu, Vincent, et al.
Pubblicazione: (2023)
Improved Bayesian Regret Bounds for Thompson Sampling in Reinforcement Learning
di: Moradipari, Ahmadreza, et al.
Pubblicazione: (2023)
di: Moradipari, Ahmadreza, et al.
Pubblicazione: (2023)
Documenti analoghi
-
Offline Reinforcement Learning with Generative Trajectory Policies
di: Feng, Xinsong, et al.
Pubblicazione: (2025) -
Sequential Stochastic Combinatorial Optimization Using Hierarchal Reinforcement Learning
di: Feng, Xinsong, et al.
Pubblicazione: (2025) -
Sample from What You See: Visuomotor Policy Learning via Diffusion Bridge with Observation-Embedded Stochastic Differential Equation
di: Liu, Zhaoyang, et al.
Pubblicazione: (2025) -
SPEC-RL: Accelerating On-Policy Reinforcement Learning with Speculative Rollouts
di: Liu, Bingshuai, et al.
Pubblicazione: (2025) -
BubbleSpec: Turning Long-Tail Bubbles into Speculative Rollout Drafts for Synchronous Reinforcement Learning
di: Xu, Yuhang, et al.
Pubblicazione: (2026)