Salvato in:
| Autori principali: | Gungordu, Oguzhan, Xiong, Siheng, Fekri, Faramarz |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2026
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2601.20539 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
Scaling Search-Augmented LLM Reasoning via Adaptive Information Control
di: Xiong, Siheng, et al.
Pubblicazione: (2026)
di: Xiong, Siheng, et al.
Pubblicazione: (2026)
Enhancing Long Chain-of-Thought Reasoning through Multi-Path Plan Aggregation
di: Xiong, Siheng, et al.
Pubblicazione: (2025)
di: Xiong, Siheng, et al.
Pubblicazione: (2025)
Deliberate Reasoning in Language Models as Structure-Aware Planning with an Accurate World Model
di: Xiong, Siheng, et al.
Pubblicazione: (2024)
di: Xiong, Siheng, et al.
Pubblicazione: (2024)
The Compressor-Retriever Architecture for Language Model OS
di: Yang, Yuan, et al.
Pubblicazione: (2024)
di: Yang, Yuan, et al.
Pubblicazione: (2024)
Large Language Models Can Learn Temporal Reasoning
di: Xiong, Siheng, et al.
Pubblicazione: (2024)
di: Xiong, Siheng, et al.
Pubblicazione: (2024)
Can LLMs Reason in the Wild with Programs?
di: Yang, Yuan, et al.
Pubblicazione: (2024)
di: Yang, Yuan, et al.
Pubblicazione: (2024)
Generalization of Compositional Tasks with Logical Specification via Implicit Planning
di: Xu, Duo, et al.
Pubblicazione: (2024)
di: Xu, Duo, et al.
Pubblicazione: (2024)
Temporal Inductive Logic Reasoning over Hypergraphs
di: Yang, Yuan, et al.
Pubblicazione: (2022)
di: Yang, Yuan, et al.
Pubblicazione: (2022)
TILP: Differentiable Learning of Temporal Logical Rules on Knowledge Graphs
di: Xiong, Siheng, et al.
Pubblicazione: (2024)
di: Xiong, Siheng, et al.
Pubblicazione: (2024)
TEILP: Time Prediction over Knowledge Graphs via Logical Reasoning
di: Xiong, Siheng, et al.
Pubblicazione: (2023)
di: Xiong, Siheng, et al.
Pubblicazione: (2023)
MobEvolve: An Agentic Self-Evolving Heuristic System for Interpretable Human Mobility Generation
di: He, Junlin, et al.
Pubblicazione: (2026)
di: He, Junlin, et al.
Pubblicazione: (2026)
LLM-A*: Large Language Model Enhanced Incremental Heuristic Search on Path Planning
di: Meng, Silin, et al.
Pubblicazione: (2024)
di: Meng, Silin, et al.
Pubblicazione: (2024)
Self-Alignment of Large Language Models via Monopolylogue-based Social Scene Simulation
di: Pang, Xianghe, et al.
Pubblicazione: (2024)
di: Pang, Xianghe, et al.
Pubblicazione: (2024)
Self-Evolved Reward Learning for LLMs
di: Huang, Chenghua, et al.
Pubblicazione: (2024)
di: Huang, Chenghua, et al.
Pubblicazione: (2024)
Conversation for Non-verifiable Learning: Self-Evolving LLMs through Meta-Evaluation
di: Sui, Yuan, et al.
Pubblicazione: (2026)
di: Sui, Yuan, et al.
Pubblicazione: (2026)
GLIDR: Graph-Like Inductive Logic Programming with Differentiable Reasoning
di: Johnson, Blair, et al.
Pubblicazione: (2025)
di: Johnson, Blair, et al.
Pubblicazione: (2025)
Learning Cyclic Causal Models from Incomplete Data
di: Sethuraman, Muralikrishnna G., et al.
Pubblicazione: (2024)
di: Sethuraman, Muralikrishnna G., et al.
Pubblicazione: (2024)
Robust Heuristic Algorithm Design with LLMs
di: Karimi, Pantea, et al.
Pubblicazione: (2025)
di: Karimi, Pantea, et al.
Pubblicazione: (2025)
EvolveR: Self-Evolving LLM Agents through an Experience-Driven Lifecycle
di: Wu, Rong, et al.
Pubblicazione: (2025)
di: Wu, Rong, et al.
Pubblicazione: (2025)
Learning Hidden Subgoals under Temporal Ordering Constraints in Reinforcement Learning
di: Xu, Duo, et al.
Pubblicazione: (2024)
di: Xu, Duo, et al.
Pubblicazione: (2024)
NOTAM-Evolve: A Knowledge-Guided Self-Evolving Optimization Framework with LLMs for NOTAM Interpretation
di: Liu, Maoqi, et al.
Pubblicazione: (2025)
di: Liu, Maoqi, et al.
Pubblicazione: (2025)
Lossy Semantic Communication for the Logical Deduction of the State of the World
di: Saz, Ahmet Faruk, et al.
Pubblicazione: (2024)
di: Saz, Ahmet Faruk, et al.
Pubblicazione: (2024)
How to Alleviate Catastrophic Forgetting in LLMs Finetuning? Hierarchical Layer-Wise and Element-Wise Regularization
di: Song, Shezheng, et al.
Pubblicazione: (2025)
di: Song, Shezheng, et al.
Pubblicazione: (2025)
Synthesizing Post-Training Data for LLMs through Multi-Agent Simulation
di: Tang, Shuo, et al.
Pubblicazione: (2024)
di: Tang, Shuo, et al.
Pubblicazione: (2024)
Guided Self-Evolving LLMs with Minimal Human Supervision
di: Yu, Wenhao, et al.
Pubblicazione: (2025)
di: Yu, Wenhao, et al.
Pubblicazione: (2025)
SEW: Self-Evolving Agentic Workflows for Automated Code Generation
di: Liu, Siwei, et al.
Pubblicazione: (2025)
di: Liu, Siwei, et al.
Pubblicazione: (2025)
Learning to Self-Evolve
di: Chen, Xiaoyin, et al.
Pubblicazione: (2026)
di: Chen, Xiaoyin, et al.
Pubblicazione: (2026)
Generative Floor Plan Design with LLMs via Reinforcement Learning with Verifiable Rewards
di: Lara, Luis, et al.
Pubblicazione: (2026)
di: Lara, Luis, et al.
Pubblicazione: (2026)
Large Language Models Can Self-Improve in Long-context Reasoning
di: Li, Siheng, et al.
Pubblicazione: (2024)
di: Li, Siheng, et al.
Pubblicazione: (2024)
Systematic Analysis of LLM Contributions to Planning: Solver, Verifier, Heuristic
di: Li, Haoming, et al.
Pubblicazione: (2024)
di: Li, Haoming, et al.
Pubblicazione: (2024)
Language Models as Continuous Self-Evolving Data Engineers
di: Wang, Peidong, et al.
Pubblicazione: (2024)
di: Wang, Peidong, et al.
Pubblicazione: (2024)
Thoughts-as-Planning: Latent World Models for Chain-of-Thoughts Optimization via Reinforcement Planning
di: Liu, Dong, et al.
Pubblicazione: (2026)
di: Liu, Dong, et al.
Pubblicazione: (2026)
Shared Path: Unraveling Memorization in Multilingual LLMs through Language Similarities
di: Luo, Xiaoyu, et al.
Pubblicazione: (2025)
di: Luo, Xiaoyu, et al.
Pubblicazione: (2025)
Frontier-Eng: Benchmarking Self-Evolving Agents on Real-World Engineering Tasks with Generative Optimization
di: Chi, Yizhe, et al.
Pubblicazione: (2026)
di: Chi, Yizhe, et al.
Pubblicazione: (2026)
Evolving and Executing Research Plans via Double-Loop Multi-Agent Collaboration
di: Zhang, Zhi, et al.
Pubblicazione: (2025)
di: Zhang, Zhi, et al.
Pubblicazione: (2025)
Mem$^2$Evolve: Towards Self-Evolving Agents via Co-Evolutionary Capability Expansion and Experience Distillation
di: Cheng, Zihao, et al.
Pubblicazione: (2026)
di: Cheng, Zihao, et al.
Pubblicazione: (2026)
LLM-Augmented Symbolic Reinforcement Learning with Landmark-Based Task Decomposition
di: Kheirandish, Alireza, et al.
Pubblicazione: (2024)
di: Kheirandish, Alireza, et al.
Pubblicazione: (2024)
Achieving Tokenizer Flexibility in Language Models through Heuristic Adaptation and Supertoken Learning
di: Sharthak, Shaurya, et al.
Pubblicazione: (2025)
di: Sharthak, Shaurya, et al.
Pubblicazione: (2025)
COMAP: Co-Evolving World Models and Agent Policies for LLM Agents
di: Liu, Youwei, et al.
Pubblicazione: (2026)
di: Liu, Youwei, et al.
Pubblicazione: (2026)
Emulating Clinician Cognition via Self-Evolving Deep Clinical Research
di: Ren, Ruiyang, et al.
Pubblicazione: (2026)
di: Ren, Ruiyang, et al.
Pubblicazione: (2026)
Documenti analoghi
-
Scaling Search-Augmented LLM Reasoning via Adaptive Information Control
di: Xiong, Siheng, et al.
Pubblicazione: (2026) -
Enhancing Long Chain-of-Thought Reasoning through Multi-Path Plan Aggregation
di: Xiong, Siheng, et al.
Pubblicazione: (2025) -
Deliberate Reasoning in Language Models as Structure-Aware Planning with an Accurate World Model
di: Xiong, Siheng, et al.
Pubblicazione: (2024) -
The Compressor-Retriever Architecture for Language Model OS
di: Yang, Yuan, et al.
Pubblicazione: (2024) -
Large Language Models Can Learn Temporal Reasoning
di: Xiong, Siheng, et al.
Pubblicazione: (2024)