:: Library Catalog

Image de couverture de livre

Enregistré dans:

Détails bibliographiques
Auteurs principaux:	Orney, Ifdita Hasan, Hamid, Jubayer Ibn, Ramanujam, Shreya S, Wu, Shirley, Hu, Hengyuan, Goodman, Noah, Sadigh, Dorsa, Finn, Chelsea
Format:	Preprint
Publié:	2026
Sujets:	Artificial Intelligence
Accès en ligne:	https://arxiv.org/abs/2604.17654
Tags:	Ajouter un tag Pas de tags, Soyez le premier à ajouter un tag!

Documents similaires

Polychromic Objectives for Reinforcement Learning
par: Hamid, Jubayer Ibn, et autres
Publié: (2025)

Invariance Co-training for Robot Visual Generalization
par: Yang, Jonathan, et autres
Publié: (2025)

Imitation Bootstrapped Reinforcement Learning
par: Hu, Hengyuan, et autres
Publié: (2023)

Bidirectional Decoding: Improving Action Chunking via Guided Test-Time Sampling
par: Liu, Yuejiang, et autres
Publié: (2024)

Latent Diffusion Planning for Imitation Learning
par: Xie, Amber, et autres
Publié: (2025)

What Matters for Batch Online Reinforcement Learning in Robotics?
par: Dong, Perry, et autres
Publié: (2025)

EXPO: Stable Reinforcement Learning with Expressive Policies
par: Dong, Perry, et autres
Publié: (2025)

FASTER: Value-Guided Sampling for Fast RL
par: Dong, Perry, et autres
Publié: (2026)

Diffusion Models are Secretly Exchangeable: Parallelizing DDPMs via Autospeculation
par: Hu, Hengyuan, et autres
Publié: (2025)

RoboCade: Gamifying Robot Data Collection
par: Mirchandani, Suvir, et autres
Publié: (2025)

Neural Garbage Collection: Learning to Forget while Learning to Reason
par: Li, Michael Y., et autres
Publié: (2026)

Tripod: Three Complementary Inductive Biases for Disentangled Representation Learning
par: Hsu, Kyle, et autres
Publié: (2024)

Toward Grounded Commonsense Reasoning
par: Kwon, Minae, et autres
Publié: (2023)

EXPO-FT: Sample-Efficient Reinforcement Learning Finetuning for Vision-Language-Action Models
par: Dong, Perry, et autres
Publié: (2026)

Value Flows
par: Dong, Perry, et autres
Publié: (2025)

Efficient Data Collection for Robotic Manipulation via Compositional Generalization
par: Gao, Jensen, et autres
Publié: (2024)

Data Analogies Enable Efficient Cross-Embodiment Transfer
par: Yang, Jonathan, et autres
Publié: (2026)

TQL: Scaling Q-Functions with Transformers by Preventing Attention Collapse
par: Dong, Perry, et autres
Publié: (2026)

What's the Move? Hybrid Imitation Learning via Salient Points
par: Sundaresan, Priya, et autres
Publié: (2024)

Contrastive Preference Learning: Learning from Human Feedback without RL
par: Hejna, Joey, et autres
Publié: (2023)

Action-Free Reasoning for Policy Generalization
par: Clark, Jaden, et autres
Publié: (2025)

Training Language Models for Social Deduction with Multi-Agent Reinforcement Learning
par: Sarkar, Bidipta, et autres
Publié: (2025)

Efficiently Generating Expressive Quadruped Behaviors via Language-Guided Preference Learning
par: Clark, Jaden, et autres
Publié: (2025)

Can LLM-Simulated Practice and Feedback Upskill Human Counselors? A Randomized Study with 90+ Novice Counselors
par: Louie, Ryan, et autres
Publié: (2025)

Batch Active Learning of Reward Functions from Human Preferences
par: Bıyık, Erdem, et autres
Publié: (2024)

Data Retrieval with Importance Weights for Few-Shot Imitation Learning
par: Xie, Amber, et autres
Publié: (2025)

Large Language Model Reasoning Failures
par: Song, Peiyang, et autres
Publié: (2026)

Policy Learning with a Language Bottleneck
par: Srivastava, Megha, et autres
Publié: (2024)

MotIF: Motion Instruction Fine-tuning
par: Hwang, Minyoung, et autres
Publié: (2024)

SteerVLA: Steering Vision-Language-Action Models in Long-Tail Driving Scenarios
par: Gao, Tian, et autres
Publié: (2026)

ProVox: Personalization and Proactive Planning for Situated Human-Robot Collaboration
par: Grannen, Jennifer, et autres
Publié: (2025)

From Next-Token to Mathematics: The Learning Dynamics of Mathematical Reasoning in Language Models
par: Mishra, Shubhra, et autres
Publié: (2024)

How to Train Your Robots? The Impact of Demonstration Modality on Imitation Learning
par: Li, Haozhuo, et autres
Publié: (2025)

Motion Tracks: A Unified Representation for Human-Robot Transfer in Few-Shot Imitation Learning
par: Ren, Juntao, et autres
Publié: (2025)

Altruistic Maneuver Planning for Cooperative Autonomous Vehicles Using Multi-agent Advantage Actor-Critic
par: Toghi, Behrad, et autres
Publié: (2021)

FLAIR: Feeding via Long-horizon AcquIsition of Realistic dishes
par: Jenamani, Rajat Kumar, et autres
Publié: (2024)

CalBench: Evaluating Coordination-Privacy Trade-offs in Multi-Agent LLMs
par: Zou, Chelsea, et autres
Publié: (2026)

GIANTS: Generative Insight Anticipation from Scientific Literature
par: He-Yueya, Joy, et autres
Publié: (2026)

RLAD: Training LLMs to Discover Abstractions for Solving Reasoning Problems
par: Qu, Yuxiao, et autres
Publié: (2025)

Is Child-Directed Speech Effective Training Data for Language Models?
par: Feng, Steven Y., et autres
Publié: (2024)