Salvato in:
| Autori principali: | Yin, Fan, Wang, Zifeng, Hsu, I-Hung, Yan, Jun, Jiang, Ke, Chen, Yanfei, Gu, Jindong, Le, Long T., Chang, Kai-Wei, Lee, Chen-Yu, Palangi, Hamid, Pfister, Tomas |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2025
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2503.07826 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
PlanGEN: A Multi-Agent Framework for Generating Planning and Reasoning Trajectories for Complex Problem Solving
di: Parmar, Mihir, et al.
Pubblicazione: (2025)
di: Parmar, Mihir, et al.
Pubblicazione: (2025)
In Prospect and Retrospect: Reflective Memory Management for Long-term Personalized Dialogue Agents
di: Tan, Zhen, et al.
Pubblicazione: (2025)
di: Tan, Zhen, et al.
Pubblicazione: (2025)
CaLM: Contrasting Large and Small Language Models to Verify Grounded Generation
di: Hsu, I-Hung, et al.
Pubblicazione: (2024)
di: Hsu, I-Hung, et al.
Pubblicazione: (2024)
VeriGuard: Enhancing LLM Agent Safety via Verified Code Generation
di: Miculicich, Lesly, et al.
Pubblicazione: (2025)
di: Miculicich, Lesly, et al.
Pubblicazione: (2025)
Reverse Thinking Makes LLMs Stronger Reasoners
di: Chen, Justin Chih-Yao, et al.
Pubblicazione: (2024)
di: Chen, Justin Chih-Yao, et al.
Pubblicazione: (2024)
HEART: Emotionally-Driven Test-Time Scaling of Language Models
di: Pinto, Gabriela, et al.
Pubblicazione: (2025)
di: Pinto, Gabriela, et al.
Pubblicazione: (2025)
Budget-Aware Tool-Use Enables Effective Agent Scaling
di: Liu, Tengxiao, et al.
Pubblicazione: (2025)
di: Liu, Tengxiao, et al.
Pubblicazione: (2025)
ScholarPeer: A Context-Aware Multi-Agent Framework for Automated Peer Review
di: Goyal, Palash, et al.
Pubblicazione: (2026)
di: Goyal, Palash, et al.
Pubblicazione: (2026)
Supervised Reinforcement Learning: From Expert Trajectories to Step-wise Reasoning
di: Deng, Yihe, et al.
Pubblicazione: (2025)
di: Deng, Yihe, et al.
Pubblicazione: (2025)
SAGE: Steerable Agentic Data Generation for Deep Search with Execution Feedback
di: Xu, Fangyuan, et al.
Pubblicazione: (2026)
di: Xu, Fangyuan, et al.
Pubblicazione: (2026)
On the Role of Feedback in Test-Time Scaling of Agentic AI Workflows
di: Chakraborty, Souradip, et al.
Pubblicazione: (2025)
di: Chakraborty, Souradip, et al.
Pubblicazione: (2025)
Heterogeneous Swarms: Jointly Optimizing Model Roles and Weights for Multi-LLM Systems
di: Feng, Shangbin, et al.
Pubblicazione: (2025)
di: Feng, Shangbin, et al.
Pubblicazione: (2025)
Watch and Learn: Learning to Use Computers from Online Videos
di: Song, Chan Hee, et al.
Pubblicazione: (2025)
di: Song, Chan Hee, et al.
Pubblicazione: (2025)
Model Swarms: Collaborative Search to Adapt LLM Experts via Swarm Intelligence
di: Feng, Shangbin, et al.
Pubblicazione: (2024)
di: Feng, Shangbin, et al.
Pubblicazione: (2024)
Learning to Clarify: Multi-turn Conversations with Action-Based Contrastive Self-Training
di: Chen, Maximillian, et al.
Pubblicazione: (2024)
di: Chen, Maximillian, et al.
Pubblicazione: (2024)
Speculative Knowledge Distillation: Bridging the Teacher-Student Gap Through Interleaved Sampling
di: Xu, Wenda, et al.
Pubblicazione: (2024)
di: Xu, Wenda, et al.
Pubblicazione: (2024)
Exploring Group and Symmetry Principles in Large Language Models
di: Imani, Shima, et al.
Pubblicazione: (2024)
di: Imani, Shima, et al.
Pubblicazione: (2024)
ReasoningBank: Scaling Agent Self-Evolving with Reasoning Memory
di: Ouyang, Siru, et al.
Pubblicazione: (2025)
di: Ouyang, Siru, et al.
Pubblicazione: (2025)
Search-Adaptor: Embedding Customization for Information Retrieval
di: Yoon, Jinsung, et al.
Pubblicazione: (2023)
di: Yoon, Jinsung, et al.
Pubblicazione: (2023)
Re-Invoke: Tool Invocation Rewriting for Zero-Shot Tool Retrieval
di: Chen, Yanfei, et al.
Pubblicazione: (2024)
di: Chen, Yanfei, et al.
Pubblicazione: (2024)
LLM-Based Multi-Agent Blackboard System for Information Discovery in Data Science
di: Salemi, Alireza, et al.
Pubblicazione: (2025)
di: Salemi, Alireza, et al.
Pubblicazione: (2025)
PLAN-TUNING: Post-Training Language Models to Learn Step-by-Step Planning for Complex Problem Solving
di: Parmar, Mihir, et al.
Pubblicazione: (2025)
di: Parmar, Mihir, et al.
Pubblicazione: (2025)
TFRBench: A Reasoning Benchmark for Evaluating Forecasting Systems
di: Ahamed, Md Atik, et al.
Pubblicazione: (2026)
di: Ahamed, Md Atik, et al.
Pubblicazione: (2026)
Synapse: Adaptive Arbitration of Complementary Expertise in Time Series Foundational Models
di: Das, Sarkar Snigdha Sarathi, et al.
Pubblicazione: (2025)
di: Das, Sarkar Snigdha Sarathi, et al.
Pubblicazione: (2025)
Distilling Tool Knowledge into Language Models via Back-Translated Traces
di: Huang, Xingyue, et al.
Pubblicazione: (2025)
di: Huang, Xingyue, et al.
Pubblicazione: (2025)
RubricEM: Meta-RL with Rubric-guided Policy Decomposition beyond Verifiable Rewards
di: Li, Gaotang, et al.
Pubblicazione: (2026)
di: Li, Gaotang, et al.
Pubblicazione: (2026)
CodecLM: Aligning Language Models with Tailored Synthetic Data
di: Wang, Zifeng, et al.
Pubblicazione: (2024)
di: Wang, Zifeng, et al.
Pubblicazione: (2024)
TUMIX: Multi-Agent Test-Time Scaling with Tool-Use Mixture
di: Chen, Yongchao, et al.
Pubblicazione: (2025)
di: Chen, Yongchao, et al.
Pubblicazione: (2025)
TableRAG: Million-Token Table Understanding with Language Models
di: Chen, Si-An, et al.
Pubblicazione: (2024)
di: Chen, Si-An, et al.
Pubblicazione: (2024)
Chain of Agents: Large Language Models Collaborating on Long-Context Tasks
di: Zhang, Yusen, et al.
Pubblicazione: (2024)
di: Zhang, Yusen, et al.
Pubblicazione: (2024)
PolicyBank: Evolving Policy Understanding for LLM Agents
di: Choi, Jihye, et al.
Pubblicazione: (2026)
di: Choi, Jihye, et al.
Pubblicazione: (2026)
Stop Reasoning! When Multimodal LLM with Chain-of-Thought Reasoning Meets Adversarial Image
di: Wang, Zefeng, et al.
Pubblicazione: (2024)
di: Wang, Zefeng, et al.
Pubblicazione: (2024)
A$^2$RD: Agentic Autoregressive Diffusion for Long Video Consistency
di: Long, Do Xuan, et al.
Pubblicazione: (2026)
di: Long, Do Xuan, et al.
Pubblicazione: (2026)
DocLens : A Tool-Augmented Multi-Agent Framework for Long Visual Document Understanding
di: Zhu, Dawei, et al.
Pubblicazione: (2025)
di: Zhu, Dawei, et al.
Pubblicazione: (2025)
Multi-turn Natural Language to Graph Query Language Translation
di: Liang, Yuanyuan, et al.
Pubblicazione: (2025)
di: Liang, Yuanyuan, et al.
Pubblicazione: (2025)
GRAFT: Graph-Tokenized LLMs for Tool Planning
di: Gao, Xinyi, et al.
Pubblicazione: (2026)
di: Gao, Xinyi, et al.
Pubblicazione: (2026)
A Survey on Responsible Generative AI: What to Generate and What Not
di: Gu, Jindong
Pubblicazione: (2024)
di: Gu, Jindong
Pubblicazione: (2024)
Dataset Distillation by Automatic Training Trajectories
di: Liu, Dai, et al.
Pubblicazione: (2024)
di: Liu, Dai, et al.
Pubblicazione: (2024)
Skill-SD: Skill-Conditioned Self-Distillation for Multi-turn LLM Agents
di: Wang, Hao, et al.
Pubblicazione: (2026)
di: Wang, Hao, et al.
Pubblicazione: (2026)
Diversity of Thought Improves Reasoning Abilities of LLMs
di: Naik, Ranjita, et al.
Pubblicazione: (2023)
di: Naik, Ranjita, et al.
Pubblicazione: (2023)
Documenti analoghi
-
PlanGEN: A Multi-Agent Framework for Generating Planning and Reasoning Trajectories for Complex Problem Solving
di: Parmar, Mihir, et al.
Pubblicazione: (2025) -
In Prospect and Retrospect: Reflective Memory Management for Long-term Personalized Dialogue Agents
di: Tan, Zhen, et al.
Pubblicazione: (2025) -
CaLM: Contrasting Large and Small Language Models to Verify Grounded Generation
di: Hsu, I-Hung, et al.
Pubblicazione: (2024) -
VeriGuard: Enhancing LLM Agent Safety via Verified Code Generation
di: Miculicich, Lesly, et al.
Pubblicazione: (2025) -
Reverse Thinking Makes LLMs Stronger Reasoners
di: Chen, Justin Chih-Yao, et al.
Pubblicazione: (2024)