:: Library Catalog

Copertina

Salvato in:

Dettagli Bibliografici
Autori principali:	Yin, Fan, Wang, Zifeng, Hsu, I-Hung, Yan, Jun, Jiang, Ke, Chen, Yanfei, Gu, Jindong, Le, Long T., Chang, Kai-Wei, Lee, Chen-Yu, Palangi, Hamid, Pfister, Tomas
Natura:	Preprint
Pubblicazione:	2025
Soggetti:	Computation and Language
Accesso online:	https://arxiv.org/abs/2503.07826
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Documenti analoghi

PlanGEN: A Multi-Agent Framework for Generating Planning and Reasoning Trajectories for Complex Problem Solving
di: Parmar, Mihir, et al.
Pubblicazione: (2025)

In Prospect and Retrospect: Reflective Memory Management for Long-term Personalized Dialogue Agents
di: Tan, Zhen, et al.
Pubblicazione: (2025)

CaLM: Contrasting Large and Small Language Models to Verify Grounded Generation
di: Hsu, I-Hung, et al.
Pubblicazione: (2024)

VeriGuard: Enhancing LLM Agent Safety via Verified Code Generation
di: Miculicich, Lesly, et al.
Pubblicazione: (2025)

Reverse Thinking Makes LLMs Stronger Reasoners
di: Chen, Justin Chih-Yao, et al.
Pubblicazione: (2024)

HEART: Emotionally-Driven Test-Time Scaling of Language Models
di: Pinto, Gabriela, et al.
Pubblicazione: (2025)

Budget-Aware Tool-Use Enables Effective Agent Scaling
di: Liu, Tengxiao, et al.
Pubblicazione: (2025)

ScholarPeer: A Context-Aware Multi-Agent Framework for Automated Peer Review
di: Goyal, Palash, et al.
Pubblicazione: (2026)

Supervised Reinforcement Learning: From Expert Trajectories to Step-wise Reasoning
di: Deng, Yihe, et al.
Pubblicazione: (2025)

SAGE: Steerable Agentic Data Generation for Deep Search with Execution Feedback
di: Xu, Fangyuan, et al.
Pubblicazione: (2026)

On the Role of Feedback in Test-Time Scaling of Agentic AI Workflows
di: Chakraborty, Souradip, et al.
Pubblicazione: (2025)

Heterogeneous Swarms: Jointly Optimizing Model Roles and Weights for Multi-LLM Systems
di: Feng, Shangbin, et al.
Pubblicazione: (2025)

Watch and Learn: Learning to Use Computers from Online Videos
di: Song, Chan Hee, et al.
Pubblicazione: (2025)

Model Swarms: Collaborative Search to Adapt LLM Experts via Swarm Intelligence
di: Feng, Shangbin, et al.
Pubblicazione: (2024)

Learning to Clarify: Multi-turn Conversations with Action-Based Contrastive Self-Training
di: Chen, Maximillian, et al.
Pubblicazione: (2024)

Speculative Knowledge Distillation: Bridging the Teacher-Student Gap Through Interleaved Sampling
di: Xu, Wenda, et al.
Pubblicazione: (2024)

Exploring Group and Symmetry Principles in Large Language Models
di: Imani, Shima, et al.
Pubblicazione: (2024)

ReasoningBank: Scaling Agent Self-Evolving with Reasoning Memory
di: Ouyang, Siru, et al.
Pubblicazione: (2025)

Search-Adaptor: Embedding Customization for Information Retrieval
di: Yoon, Jinsung, et al.
Pubblicazione: (2023)

Re-Invoke: Tool Invocation Rewriting for Zero-Shot Tool Retrieval
di: Chen, Yanfei, et al.
Pubblicazione: (2024)

LLM-Based Multi-Agent Blackboard System for Information Discovery in Data Science
di: Salemi, Alireza, et al.
Pubblicazione: (2025)

PLAN-TUNING: Post-Training Language Models to Learn Step-by-Step Planning for Complex Problem Solving
di: Parmar, Mihir, et al.
Pubblicazione: (2025)

TFRBench: A Reasoning Benchmark for Evaluating Forecasting Systems
di: Ahamed, Md Atik, et al.
Pubblicazione: (2026)

Synapse: Adaptive Arbitration of Complementary Expertise in Time Series Foundational Models
di: Das, Sarkar Snigdha Sarathi, et al.
Pubblicazione: (2025)

Distilling Tool Knowledge into Language Models via Back-Translated Traces
di: Huang, Xingyue, et al.
Pubblicazione: (2025)

RubricEM: Meta-RL with Rubric-guided Policy Decomposition beyond Verifiable Rewards
di: Li, Gaotang, et al.
Pubblicazione: (2026)

CodecLM: Aligning Language Models with Tailored Synthetic Data
di: Wang, Zifeng, et al.
Pubblicazione: (2024)

TUMIX: Multi-Agent Test-Time Scaling with Tool-Use Mixture
di: Chen, Yongchao, et al.
Pubblicazione: (2025)

TableRAG: Million-Token Table Understanding with Language Models
di: Chen, Si-An, et al.
Pubblicazione: (2024)

Chain of Agents: Large Language Models Collaborating on Long-Context Tasks
di: Zhang, Yusen, et al.
Pubblicazione: (2024)

PolicyBank: Evolving Policy Understanding for LLM Agents
di: Choi, Jihye, et al.
Pubblicazione: (2026)

Stop Reasoning! When Multimodal LLM with Chain-of-Thought Reasoning Meets Adversarial Image
di: Wang, Zefeng, et al.
Pubblicazione: (2024)

A$^2$RD: Agentic Autoregressive Diffusion for Long Video Consistency
di: Long, Do Xuan, et al.
Pubblicazione: (2026)

DocLens : A Tool-Augmented Multi-Agent Framework for Long Visual Document Understanding
di: Zhu, Dawei, et al.
Pubblicazione: (2025)

Multi-turn Natural Language to Graph Query Language Translation
di: Liang, Yuanyuan, et al.
Pubblicazione: (2025)

GRAFT: Graph-Tokenized LLMs for Tool Planning
di: Gao, Xinyi, et al.
Pubblicazione: (2026)

A Survey on Responsible Generative AI: What to Generate and What Not
di: Gu, Jindong
Pubblicazione: (2024)

Dataset Distillation by Automatic Training Trajectories
di: Liu, Dai, et al.
Pubblicazione: (2024)

Skill-SD: Skill-Conditioned Self-Distillation for Multi-turn LLM Agents
di: Wang, Hao, et al.
Pubblicazione: (2026)

Diversity of Thought Improves Reasoning Abilities of LLMs
di: Naik, Ranjita, et al.
Pubblicazione: (2023)