Enregistré dans:
| Auteurs principaux: | Ouyang, Siru, Yan, Jun, Hsu, I-Hung, Chen, Yanfei, Jiang, Ke, Wang, Zifeng, Han, Rujun, Le, Long T., Daruki, Samira, Tang, Xiangru, Tirumalashetty, Vishy, Lee, George, Rofouei, Mahsan, Lin, Hangfei, Han, Jiawei, Lee, Chen-Yu, Pfister, Tomas |
|---|---|
| Format: | Preprint |
| Publié: |
2025
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2509.25140 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
SAGE: Steerable Agentic Data Generation for Deep Search with Execution Feedback
par: Xu, Fangyuan, et autres
Publié: (2026)
par: Xu, Fangyuan, et autres
Publié: (2026)
SkillOS: Learning Skill Curation for Self-Evolving Agents
par: Ouyang, Siru, et autres
Publié: (2026)
par: Ouyang, Siru, et autres
Publié: (2026)
Supervised Reinforcement Learning: From Expert Trajectories to Step-wise Reasoning
par: Deng, Yihe, et autres
Publié: (2025)
par: Deng, Yihe, et autres
Publié: (2025)
Budget-Aware Tool-Use Enables Effective Agent Scaling
par: Liu, Tengxiao, et autres
Publié: (2025)
par: Liu, Tengxiao, et autres
Publié: (2025)
Reverse Thinking Makes LLMs Stronger Reasoners
par: Chen, Justin Chih-Yao, et autres
Publié: (2024)
par: Chen, Justin Chih-Yao, et autres
Publié: (2024)
Deep Researcher with Test-Time Diffusion
par: Han, Rujun, et autres
Publié: (2025)
par: Han, Rujun, et autres
Publié: (2025)
In Prospect and Retrospect: Reflective Memory Management for Long-term Personalized Dialogue Agents
par: Tan, Zhen, et autres
Publié: (2025)
par: Tan, Zhen, et autres
Publié: (2025)
FGBench: A Dataset and Benchmark for Molecular Property Reasoning at Functional Group-Level in Large Language Models
par: Liu, Xuan, et autres
Publié: (2025)
par: Liu, Xuan, et autres
Publié: (2025)
Chain-of-Table: Evolving Tables in the Reasoning Chain for Table Understanding
par: Wang, Zilong, et autres
Publié: (2024)
par: Wang, Zilong, et autres
Publié: (2024)
RubricEM: Meta-RL with Rubric-guided Policy Decomposition beyond Verifiable Rewards
par: Li, Gaotang, et autres
Publié: (2026)
par: Li, Gaotang, et autres
Publié: (2026)
RAST: Reasoning Activation in LLMs via Small-model Transfer
par: Ouyang, Siru, et autres
Publié: (2025)
par: Ouyang, Siru, et autres
Publié: (2025)
Structured Chemistry Reasoning with Large Language Models
par: Ouyang, Siru, et autres
Publié: (2023)
par: Ouyang, Siru, et autres
Publié: (2023)
Nexus : An Agentic Framework for Time Series Forecasting
par: Das, Sarkar Snigdha Sarathi, et autres
Publié: (2026)
par: Das, Sarkar Snigdha Sarathi, et autres
Publié: (2026)
Towards Compute-Optimal Many-Shot In-Context Learning
par: Golchin, Shahriar, et autres
Publié: (2025)
par: Golchin, Shahriar, et autres
Publié: (2025)
CaLM: Contrasting Large and Small Language Models to Verify Grounded Generation
par: Hsu, I-Hung, et autres
Publié: (2024)
par: Hsu, I-Hung, et autres
Publié: (2024)
COMPASS: Enhancing Agent Long-Horizon Reasoning with Evolving Context
par: Wan, Guangya, et autres
Publié: (2025)
par: Wan, Guangya, et autres
Publié: (2025)
Speculative Knowledge Distillation: Bridging the Teacher-Student Gap Through Interleaved Sampling
par: Xu, Wenda, et autres
Publié: (2024)
par: Xu, Wenda, et autres
Publié: (2024)
PolicyBank: Evolving Policy Understanding for LLM Agents
par: Choi, Jihye, et autres
Publié: (2026)
par: Choi, Jihye, et autres
Publié: (2026)
PlanGEN: A Multi-Agent Framework for Generating Planning and Reasoning Trajectories for Complex Problem Solving
par: Parmar, Mihir, et autres
Publié: (2025)
par: Parmar, Mihir, et autres
Publié: (2025)
Magnet: Multi-turn Tool-use Data Synthesis and Distillation via Graph Translation
par: Yin, Fan, et autres
Publié: (2025)
par: Yin, Fan, et autres
Publié: (2025)
Cell-o1: Training LLMs to Solve Single-Cell Reasoning Puzzles with Reinforcement Learning
par: Fang, Yin, et autres
Publié: (2025)
par: Fang, Yin, et autres
Publié: (2025)
Synergizing Unsupervised Episode Detection with LLMs for Large-Scale News Events
par: Kargupta, Priyanka, et autres
Publié: (2024)
par: Kargupta, Priyanka, et autres
Publié: (2024)
Over-Reasoning and Redundant Calculation of Large Language Models
par: Chiang, Cheng-Han, et autres
Publié: (2024)
par: Chiang, Cheng-Han, et autres
Publié: (2024)
When Silence Matters: The Impact of Irrelevant Audio on Text Reasoning in Large Audio-Language Models
par: Li, Chen-An, et autres
Publié: (2025)
par: Li, Chen-An, et autres
Publié: (2025)
TableRAG: Million-Token Table Understanding with Language Models
par: Chen, Si-An, et autres
Publié: (2024)
par: Chen, Si-An, et autres
Publié: (2024)
Unveiling Narrative Reasoning Limits of Large Language Models with Trope in Movie Synopses
par: Su, Hung-Ting, et autres
Publié: (2024)
par: Su, Hung-Ting, et autres
Publié: (2024)
Search-Adaptor: Embedding Customization for Information Retrieval
par: Yoon, Jinsung, et autres
Publié: (2023)
par: Yoon, Jinsung, et autres
Publié: (2023)
RareAgent: Self-Evolving Reasoning for Drug Repurposing in Rare Diseases
par: Qin, Lang, et autres
Publié: (2025)
par: Qin, Lang, et autres
Publié: (2025)
A Survey on Retrieval And Structuring Augmented Generation with Large Language Models
par: Jiang, Pengcheng, et autres
Publié: (2025)
par: Jiang, Pengcheng, et autres
Publié: (2025)
ChemAgent: Self-updating Library in Large Language Models Improves Chemical Reasoning
par: Tang, Xiangru, et autres
Publié: (2025)
par: Tang, Xiangru, et autres
Publié: (2025)
RFEval: Benchmarking Reasoning Faithfulness under Counterfactual Reasoning Intervention in Large Reasoning Models
par: Han, Yunseok, et autres
Publié: (2026)
par: Han, Yunseok, et autres
Publié: (2026)
FEVO: Financial Knowledge Expansion and Reasoning Evolution for Large Language Models
par: Pang, Bo, et autres
Publié: (2025)
par: Pang, Bo, et autres
Publié: (2025)
ProxyThinker: Test-Time Guidance through Small Visual Reasoners
par: Xiao, Zilin, et autres
Publié: (2025)
par: Xiao, Zilin, et autres
Publié: (2025)
TRACT: Regression-Aware Fine-tuning Meets Chain-of-Thought Reasoning for LLM-as-a-Judge
par: Chiang, Cheng-Han, et autres
Publié: (2025)
par: Chiang, Cheng-Han, et autres
Publié: (2025)
Temperature-Centric Investigation of Speculative Decoding with Knowledge Distillation
par: Ouyang, Siru, et autres
Publié: (2024)
par: Ouyang, Siru, et autres
Publié: (2024)
Stop Reasoning! When Multimodal LLM with Chain-of-Thought Reasoning Meets Adversarial Image
par: Wang, Zefeng, et autres
Publié: (2024)
par: Wang, Zefeng, et autres
Publié: (2024)
Investigating Video Reasoning Capability of Large Language Models with Tropes in Movies
par: Su, Hung-Ting, et autres
Publié: (2024)
par: Su, Hung-Ting, et autres
Publié: (2024)
BankMathBench: A Benchmark for Numerical Reasoning in Banking Scenarios
par: Lee, Yunseung, et autres
Publié: (2026)
par: Lee, Yunseung, et autres
Publié: (2026)
Investigating Data Contamination for Pre-training Language Models
par: Jiang, Minhao, et autres
Publié: (2024)
par: Jiang, Minhao, et autres
Publié: (2024)
Evaluating Reasoning LLMs for Suicide Screening with the Columbia-Suicide Severity Rating Scale
par: Patil, Avinash, et autres
Publié: (2025)
par: Patil, Avinash, et autres
Publié: (2025)
Documents similaires
-
SAGE: Steerable Agentic Data Generation for Deep Search with Execution Feedback
par: Xu, Fangyuan, et autres
Publié: (2026) -
SkillOS: Learning Skill Curation for Self-Evolving Agents
par: Ouyang, Siru, et autres
Publié: (2026) -
Supervised Reinforcement Learning: From Expert Trajectories to Step-wise Reasoning
par: Deng, Yihe, et autres
Publié: (2025) -
Budget-Aware Tool-Use Enables Effective Agent Scaling
par: Liu, Tengxiao, et autres
Publié: (2025) -
Reverse Thinking Makes LLMs Stronger Reasoners
par: Chen, Justin Chih-Yao, et autres
Publié: (2024)