Enregistré dans:
| Auteurs principaux: | Orney, Ifdita Hasan, Hamid, Jubayer Ibn, Ramanujam, Shreya S, Wu, Shirley, Hu, Hengyuan, Goodman, Noah, Sadigh, Dorsa, Finn, Chelsea |
|---|---|
| Format: | Preprint |
| Publié: |
2026
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2604.17654 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
Polychromic Objectives for Reinforcement Learning
par: Hamid, Jubayer Ibn, et autres
Publié: (2025)
par: Hamid, Jubayer Ibn, et autres
Publié: (2025)
Invariance Co-training for Robot Visual Generalization
par: Yang, Jonathan, et autres
Publié: (2025)
par: Yang, Jonathan, et autres
Publié: (2025)
Imitation Bootstrapped Reinforcement Learning
par: Hu, Hengyuan, et autres
Publié: (2023)
par: Hu, Hengyuan, et autres
Publié: (2023)
Bidirectional Decoding: Improving Action Chunking via Guided Test-Time Sampling
par: Liu, Yuejiang, et autres
Publié: (2024)
par: Liu, Yuejiang, et autres
Publié: (2024)
Latent Diffusion Planning for Imitation Learning
par: Xie, Amber, et autres
Publié: (2025)
par: Xie, Amber, et autres
Publié: (2025)
What Matters for Batch Online Reinforcement Learning in Robotics?
par: Dong, Perry, et autres
Publié: (2025)
par: Dong, Perry, et autres
Publié: (2025)
EXPO: Stable Reinforcement Learning with Expressive Policies
par: Dong, Perry, et autres
Publié: (2025)
par: Dong, Perry, et autres
Publié: (2025)
FASTER: Value-Guided Sampling for Fast RL
par: Dong, Perry, et autres
Publié: (2026)
par: Dong, Perry, et autres
Publié: (2026)
Diffusion Models are Secretly Exchangeable: Parallelizing DDPMs via Autospeculation
par: Hu, Hengyuan, et autres
Publié: (2025)
par: Hu, Hengyuan, et autres
Publié: (2025)
RoboCade: Gamifying Robot Data Collection
par: Mirchandani, Suvir, et autres
Publié: (2025)
par: Mirchandani, Suvir, et autres
Publié: (2025)
Neural Garbage Collection: Learning to Forget while Learning to Reason
par: Li, Michael Y., et autres
Publié: (2026)
par: Li, Michael Y., et autres
Publié: (2026)
Tripod: Three Complementary Inductive Biases for Disentangled Representation Learning
par: Hsu, Kyle, et autres
Publié: (2024)
par: Hsu, Kyle, et autres
Publié: (2024)
Toward Grounded Commonsense Reasoning
par: Kwon, Minae, et autres
Publié: (2023)
par: Kwon, Minae, et autres
Publié: (2023)
EXPO-FT: Sample-Efficient Reinforcement Learning Finetuning for Vision-Language-Action Models
par: Dong, Perry, et autres
Publié: (2026)
par: Dong, Perry, et autres
Publié: (2026)
Value Flows
par: Dong, Perry, et autres
Publié: (2025)
par: Dong, Perry, et autres
Publié: (2025)
Efficient Data Collection for Robotic Manipulation via Compositional Generalization
par: Gao, Jensen, et autres
Publié: (2024)
par: Gao, Jensen, et autres
Publié: (2024)
Data Analogies Enable Efficient Cross-Embodiment Transfer
par: Yang, Jonathan, et autres
Publié: (2026)
par: Yang, Jonathan, et autres
Publié: (2026)
TQL: Scaling Q-Functions with Transformers by Preventing Attention Collapse
par: Dong, Perry, et autres
Publié: (2026)
par: Dong, Perry, et autres
Publié: (2026)
What's the Move? Hybrid Imitation Learning via Salient Points
par: Sundaresan, Priya, et autres
Publié: (2024)
par: Sundaresan, Priya, et autres
Publié: (2024)
Contrastive Preference Learning: Learning from Human Feedback without RL
par: Hejna, Joey, et autres
Publié: (2023)
par: Hejna, Joey, et autres
Publié: (2023)
Action-Free Reasoning for Policy Generalization
par: Clark, Jaden, et autres
Publié: (2025)
par: Clark, Jaden, et autres
Publié: (2025)
Training Language Models for Social Deduction with Multi-Agent Reinforcement Learning
par: Sarkar, Bidipta, et autres
Publié: (2025)
par: Sarkar, Bidipta, et autres
Publié: (2025)
Efficiently Generating Expressive Quadruped Behaviors via Language-Guided Preference Learning
par: Clark, Jaden, et autres
Publié: (2025)
par: Clark, Jaden, et autres
Publié: (2025)
Can LLM-Simulated Practice and Feedback Upskill Human Counselors? A Randomized Study with 90+ Novice Counselors
par: Louie, Ryan, et autres
Publié: (2025)
par: Louie, Ryan, et autres
Publié: (2025)
Batch Active Learning of Reward Functions from Human Preferences
par: Bıyık, Erdem, et autres
Publié: (2024)
par: Bıyık, Erdem, et autres
Publié: (2024)
Data Retrieval with Importance Weights for Few-Shot Imitation Learning
par: Xie, Amber, et autres
Publié: (2025)
par: Xie, Amber, et autres
Publié: (2025)
Large Language Model Reasoning Failures
par: Song, Peiyang, et autres
Publié: (2026)
par: Song, Peiyang, et autres
Publié: (2026)
Policy Learning with a Language Bottleneck
par: Srivastava, Megha, et autres
Publié: (2024)
par: Srivastava, Megha, et autres
Publié: (2024)
MotIF: Motion Instruction Fine-tuning
par: Hwang, Minyoung, et autres
Publié: (2024)
par: Hwang, Minyoung, et autres
Publié: (2024)
SteerVLA: Steering Vision-Language-Action Models in Long-Tail Driving Scenarios
par: Gao, Tian, et autres
Publié: (2026)
par: Gao, Tian, et autres
Publié: (2026)
ProVox: Personalization and Proactive Planning for Situated Human-Robot Collaboration
par: Grannen, Jennifer, et autres
Publié: (2025)
par: Grannen, Jennifer, et autres
Publié: (2025)
From Next-Token to Mathematics: The Learning Dynamics of Mathematical Reasoning in Language Models
par: Mishra, Shubhra, et autres
Publié: (2024)
par: Mishra, Shubhra, et autres
Publié: (2024)
How to Train Your Robots? The Impact of Demonstration Modality on Imitation Learning
par: Li, Haozhuo, et autres
Publié: (2025)
par: Li, Haozhuo, et autres
Publié: (2025)
Motion Tracks: A Unified Representation for Human-Robot Transfer in Few-Shot Imitation Learning
par: Ren, Juntao, et autres
Publié: (2025)
par: Ren, Juntao, et autres
Publié: (2025)
Altruistic Maneuver Planning for Cooperative Autonomous Vehicles Using Multi-agent Advantage Actor-Critic
par: Toghi, Behrad, et autres
Publié: (2021)
par: Toghi, Behrad, et autres
Publié: (2021)
FLAIR: Feeding via Long-horizon AcquIsition of Realistic dishes
par: Jenamani, Rajat Kumar, et autres
Publié: (2024)
par: Jenamani, Rajat Kumar, et autres
Publié: (2024)
CalBench: Evaluating Coordination-Privacy Trade-offs in Multi-Agent LLMs
par: Zou, Chelsea, et autres
Publié: (2026)
par: Zou, Chelsea, et autres
Publié: (2026)
GIANTS: Generative Insight Anticipation from Scientific Literature
par: He-Yueya, Joy, et autres
Publié: (2026)
par: He-Yueya, Joy, et autres
Publié: (2026)
RLAD: Training LLMs to Discover Abstractions for Solving Reasoning Problems
par: Qu, Yuxiao, et autres
Publié: (2025)
par: Qu, Yuxiao, et autres
Publié: (2025)
Is Child-Directed Speech Effective Training Data for Language Models?
par: Feng, Steven Y., et autres
Publié: (2024)
par: Feng, Steven Y., et autres
Publié: (2024)
Documents similaires
-
Polychromic Objectives for Reinforcement Learning
par: Hamid, Jubayer Ibn, et autres
Publié: (2025) -
Invariance Co-training for Robot Visual Generalization
par: Yang, Jonathan, et autres
Publié: (2025) -
Imitation Bootstrapped Reinforcement Learning
par: Hu, Hengyuan, et autres
Publié: (2023) -
Bidirectional Decoding: Improving Action Chunking via Guided Test-Time Sampling
par: Liu, Yuejiang, et autres
Publié: (2024) -
Latent Diffusion Planning for Imitation Learning
par: Xie, Amber, et autres
Publié: (2025)