:: Library Catalog

Image de couverture de livre

Enregistré dans:

Détails bibliographiques
Auteurs principaux:	Ouyang, Siru, Yan, Jun, Hsu, I-Hung, Chen, Yanfei, Jiang, Ke, Wang, Zifeng, Han, Rujun, Le, Long T., Daruki, Samira, Tang, Xiangru, Tirumalashetty, Vishy, Lee, George, Rofouei, Mahsan, Lin, Hangfei, Han, Jiawei, Lee, Chen-Yu, Pfister, Tomas
Format:	Preprint
Publié:	2025
Sujets:	Artificial Intelligence Computation and Language
Accès en ligne:	https://arxiv.org/abs/2509.25140
Tags:	Ajouter un tag Pas de tags, Soyez le premier à ajouter un tag!

Documents similaires

SAGE: Steerable Agentic Data Generation for Deep Search with Execution Feedback
par: Xu, Fangyuan, et autres
Publié: (2026)

SkillOS: Learning Skill Curation for Self-Evolving Agents
par: Ouyang, Siru, et autres
Publié: (2026)

Supervised Reinforcement Learning: From Expert Trajectories to Step-wise Reasoning
par: Deng, Yihe, et autres
Publié: (2025)

Budget-Aware Tool-Use Enables Effective Agent Scaling
par: Liu, Tengxiao, et autres
Publié: (2025)

Reverse Thinking Makes LLMs Stronger Reasoners
par: Chen, Justin Chih-Yao, et autres
Publié: (2024)

Deep Researcher with Test-Time Diffusion
par: Han, Rujun, et autres
Publié: (2025)

In Prospect and Retrospect: Reflective Memory Management for Long-term Personalized Dialogue Agents
par: Tan, Zhen, et autres
Publié: (2025)

FGBench: A Dataset and Benchmark for Molecular Property Reasoning at Functional Group-Level in Large Language Models
par: Liu, Xuan, et autres
Publié: (2025)

Chain-of-Table: Evolving Tables in the Reasoning Chain for Table Understanding
par: Wang, Zilong, et autres
Publié: (2024)

RubricEM: Meta-RL with Rubric-guided Policy Decomposition beyond Verifiable Rewards
par: Li, Gaotang, et autres
Publié: (2026)

RAST: Reasoning Activation in LLMs via Small-model Transfer
par: Ouyang, Siru, et autres
Publié: (2025)

Structured Chemistry Reasoning with Large Language Models
par: Ouyang, Siru, et autres
Publié: (2023)

Nexus : An Agentic Framework for Time Series Forecasting
par: Das, Sarkar Snigdha Sarathi, et autres
Publié: (2026)

Towards Compute-Optimal Many-Shot In-Context Learning
par: Golchin, Shahriar, et autres
Publié: (2025)

CaLM: Contrasting Large and Small Language Models to Verify Grounded Generation
par: Hsu, I-Hung, et autres
Publié: (2024)

COMPASS: Enhancing Agent Long-Horizon Reasoning with Evolving Context
par: Wan, Guangya, et autres
Publié: (2025)

Speculative Knowledge Distillation: Bridging the Teacher-Student Gap Through Interleaved Sampling
par: Xu, Wenda, et autres
Publié: (2024)

PolicyBank: Evolving Policy Understanding for LLM Agents
par: Choi, Jihye, et autres
Publié: (2026)

PlanGEN: A Multi-Agent Framework for Generating Planning and Reasoning Trajectories for Complex Problem Solving
par: Parmar, Mihir, et autres
Publié: (2025)

Magnet: Multi-turn Tool-use Data Synthesis and Distillation via Graph Translation
par: Yin, Fan, et autres
Publié: (2025)

Cell-o1: Training LLMs to Solve Single-Cell Reasoning Puzzles with Reinforcement Learning
par: Fang, Yin, et autres
Publié: (2025)

Synergizing Unsupervised Episode Detection with LLMs for Large-Scale News Events
par: Kargupta, Priyanka, et autres
Publié: (2024)

Over-Reasoning and Redundant Calculation of Large Language Models
par: Chiang, Cheng-Han, et autres
Publié: (2024)

When Silence Matters: The Impact of Irrelevant Audio on Text Reasoning in Large Audio-Language Models
par: Li, Chen-An, et autres
Publié: (2025)

TableRAG: Million-Token Table Understanding with Language Models
par: Chen, Si-An, et autres
Publié: (2024)

Unveiling Narrative Reasoning Limits of Large Language Models with Trope in Movie Synopses
par: Su, Hung-Ting, et autres
Publié: (2024)

Search-Adaptor: Embedding Customization for Information Retrieval
par: Yoon, Jinsung, et autres
Publié: (2023)

RareAgent: Self-Evolving Reasoning for Drug Repurposing in Rare Diseases
par: Qin, Lang, et autres
Publié: (2025)

A Survey on Retrieval And Structuring Augmented Generation with Large Language Models
par: Jiang, Pengcheng, et autres
Publié: (2025)

ChemAgent: Self-updating Library in Large Language Models Improves Chemical Reasoning
par: Tang, Xiangru, et autres
Publié: (2025)

RFEval: Benchmarking Reasoning Faithfulness under Counterfactual Reasoning Intervention in Large Reasoning Models
par: Han, Yunseok, et autres
Publié: (2026)

FEVO: Financial Knowledge Expansion and Reasoning Evolution for Large Language Models
par: Pang, Bo, et autres
Publié: (2025)

ProxyThinker: Test-Time Guidance through Small Visual Reasoners
par: Xiao, Zilin, et autres
Publié: (2025)

TRACT: Regression-Aware Fine-tuning Meets Chain-of-Thought Reasoning for LLM-as-a-Judge
par: Chiang, Cheng-Han, et autres
Publié: (2025)

Temperature-Centric Investigation of Speculative Decoding with Knowledge Distillation
par: Ouyang, Siru, et autres
Publié: (2024)

Stop Reasoning! When Multimodal LLM with Chain-of-Thought Reasoning Meets Adversarial Image
par: Wang, Zefeng, et autres
Publié: (2024)

Investigating Video Reasoning Capability of Large Language Models with Tropes in Movies
par: Su, Hung-Ting, et autres
Publié: (2024)

BankMathBench: A Benchmark for Numerical Reasoning in Banking Scenarios
par: Lee, Yunseung, et autres
Publié: (2026)

Investigating Data Contamination for Pre-training Language Models
par: Jiang, Minhao, et autres
Publié: (2024)

Evaluating Reasoning LLMs for Suicide Screening with the Columbia-Suicide Severity Rating Scale
par: Patil, Avinash, et autres
Publié: (2025)