:: Library Catalog

Copertina

Salvato in:

Dettagli Bibliografici
Autori principali:	Wang, Chenan, Shi, Daniel H., Chen, Haipeng
Natura:	Preprint
Pubblicazione:	2026
Soggetti:	Machine Learning Artificial Intelligence
Accesso online:	https://arxiv.org/abs/2601.12212
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Documenti analoghi

Offline Reinforcement Learning with Generative Trajectory Policies
di: Feng, Xinsong, et al.
Pubblicazione: (2025)

Sequential Stochastic Combinatorial Optimization Using Hierarchal Reinforcement Learning
di: Feng, Xinsong, et al.
Pubblicazione: (2025)

Sample from What You See: Visuomotor Policy Learning via Diffusion Bridge with Observation-Embedded Stochastic Differential Equation
di: Liu, Zhaoyang, et al.
Pubblicazione: (2025)

SPEC-RL: Accelerating On-Policy Reinforcement Learning with Speculative Rollouts
di: Liu, Bingshuai, et al.
Pubblicazione: (2025)

BubbleSpec: Turning Long-Tail Bubbles into Speculative Rollout Drafts for Synchronous Reinforcement Learning
di: Xu, Yuhang, et al.
Pubblicazione: (2026)

TS-DP: Reinforcement Speculative Decoding For Temporal Adaptive Diffusion Policy Acceleration
di: Li, Ye, et al.
Pubblicazione: (2025)

Detection and Recovery Against Deep Neural Network Fault Injection Attacks Based on Contrastive Learning
di: Wang, Chenan, et al.
Pubblicazione: (2024)

PRISM: Parametrically Refactoring Inference for Speculative Sampling Draft Models
di: Wang, Xuliang, et al.
Pubblicazione: (2026)

Drama: Mamba-Enabled Model-Based Reinforcement Learning Is Sample and Parameter Efficient
di: Wang, Wenlong, et al.
Pubblicazione: (2024)

Learning Future Representation with Synthetic Observations for Sample-efficient Reinforcement Learning
di: Liu, Xin, et al.
Pubblicazione: (2024)

On the Sample Efficiency of Abstractions and Potential-Based Reward Shaping in Reinforcement Learning
di: Canonaco, Giuseppe, et al.
Pubblicazione: (2024)

Model-Free Robust Reinforcement Learning with Sample Complexity Analysis
di: Wang, Yudan, et al.
Pubblicazione: (2024)

Recursive Speculative Decoding: Accelerating LLM Inference via Sampling Without Replacement
di: Jeon, Wonseok, et al.
Pubblicazione: (2024)

The Two-Stage Decision-Sampling Hypothesis: Understanding the Emergence of Self-Reflection in RL-Trained LLMs
di: Zhao, Zibo, et al.
Pubblicazione: (2026)

Shared-unique Features and Task-aware Prioritized Sampling on Multi-task Reinforcement Learning
di: Lin, Po-Shao, et al.
Pubblicazione: (2024)

Speculative Safety-Aware Decoding
di: Wang, Xuekang, et al.
Pubblicazione: (2025)

Mixture of Robust Experts (MoRE):A Robust Denoising Method towards multiple perturbations
di: Cheng, Hao, et al.
Pubblicazione: (2021)

Traversal Verification for Speculative Tree Decoding
di: Weng, Yepeng, et al.
Pubblicazione: (2025)

On The Sample Complexity Bounds In Bilevel Reinforcement Learning
di: Gaur, Mudit, et al.
Pubblicazione: (2025)

Experiential Reinforcement Learning
di: Shi, Taiwei, et al.
Pubblicazione: (2026)

CADENT: Gated Hybrid Distillation for Sample-Efficient Transfer in Reinforcement Learning
di: Alinejad, Mahyar, et al.
Pubblicazione: (2026)

CORAL: Learning Consistent Representations across Multi-step Training with Lighter Speculative Drafter
di: Weng, Yepeng, et al.
Pubblicazione: (2025)

Sampling-Based Safe Reinforcement Learning
di: Vignola, Luca, et al.
Pubblicazione: (2026)

On Sample-Efficient Offline Reinforcement Learning: Data Diversity, Posterior Sampling, and Beyond
di: Nguyen-Tang, Thanh, et al.
Pubblicazione: (2024)

GCHR : Goal-Conditioned Hindsight Regularization for Sample-Efficient Reinforcement Learning
di: Lei, Xing, et al.
Pubblicazione: (2025)

Sample Efficient Active Algorithms for Offline Reinforcement Learning
di: Roy, Soumyadeep, et al.
Pubblicazione: (2026)

Sample Complexity Analysis for Constrained Bilevel Reinforcement Learning
di: Saxena, Naman, et al.
Pubblicazione: (2026)

Cactus: Accelerating Auto-Regressive Decoding with Constrained Acceptance Speculative Sampling
di: Hao, Yongchang, et al.
Pubblicazione: (2026)

Sample and Computationally Efficient Continuous-Time Reinforcement Learning with General Function Approximation
di: Zhao, Runze, et al.
Pubblicazione: (2025)

Sample-Efficient Constrained Reinforcement Learning with General Parameterization
di: Mondal, Washim Uddin, et al.
Pubblicazione: (2024)

When Drafts Evolve: Speculative Decoding Meets Online Learning
di: Qian, Yu-Yang, et al.
Pubblicazione: (2026)

DIP: Dynamic In-Context Planner For Diffusion Language Models
di: Li, Yang, et al.
Pubblicazione: (2026)

QSpec: Speculative Decoding with Complementary Quantization Schemes
di: Zhao, Juntao, et al.
Pubblicazione: (2024)

Reinforcement Learning for Control with Probabilistic Stability Guarantee: A Finite-Sample Approach
di: Han, Minghao, et al.
Pubblicazione: (2026)

Clover: Regressive Lightweight Speculative Decoding with Sequential Knowledge
di: Xiao, Bin, et al.
Pubblicazione: (2024)

A Theoretical Perspective for Speculative Decoding Algorithm
di: Yin, Ming, et al.
Pubblicazione: (2024)

Equivariant Action Sampling for Reinforcement Learning and Planning
di: Zhao, Linfeng, et al.
Pubblicazione: (2024)

Diffusion-DICE: In-Sample Diffusion Guidance for Offline Reinforcement Learning
di: Mao, Liyuan, et al.
Pubblicazione: (2024)

When is Offline Policy Selection Sample Efficient for Reinforcement Learning?
di: Liu, Vincent, et al.
Pubblicazione: (2023)

Improved Bayesian Regret Bounds for Thompson Sampling in Reinforcement Learning
di: Moradipari, Ahmadreza, et al.
Pubblicazione: (2023)