Enregistré dans:
| Auteurs principaux: | Zhuravlev, Viktor N., Khairullin, Artur R., Dyagin, Ernest A., Sitkina, Alena N., Kulin, Nikita I. |
|---|---|
| Format: | Preprint |
| Publié: |
2025
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2508.18870 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
Automatic Prompt Optimization with Prompt Distillation
par: Dyagin, Ernest A., et autres
Publié: (2025)
par: Dyagin, Ernest A., et autres
Publié: (2025)
Enhancing LLM Problem Solving with REAP: Reflection, Explicit Problem Deconstruction, and Advanced Prompting
par: Lingo, Ryan, et autres
Publié: (2024)
par: Lingo, Ryan, et autres
Publié: (2024)
Reflect then Learn: Active Prompting for Information Extraction Guided by Introspective Confusion
par: Zhao, Dong, et autres
Publié: (2025)
par: Zhao, Dong, et autres
Publié: (2025)
Reasoning: From Reflection to Solution
par: Li, Zixi
Publié: (2025)
par: Li, Zixi
Publié: (2025)
ReflectDiffu:Reflect between Emotion-intent Contagion and Mimicry for Empathetic Response Generation via a RL-Diffusion Framework
par: Yuan, Jiahao, et autres
Publié: (2024)
par: Yuan, Jiahao, et autres
Publié: (2024)
Reflection-Window Decoding: Text Generation with Selective Refinement
par: Tang, Zeyu, et autres
Publié: (2025)
par: Tang, Zeyu, et autres
Publié: (2025)
Positive Experience Reflection for Agents in Interactive Text Environments
par: Lippmann, Philip, et autres
Publié: (2024)
par: Lippmann, Philip, et autres
Publié: (2024)
Reinforce LLM Reasoning through Multi-Agent Reflection
par: Yuan, Yurun, et autres
Publié: (2025)
par: Yuan, Yurun, et autres
Publié: (2025)
ThinkTuning: Instilling Cognitive Reflections without Distillation
par: RRV, Aswin, et autres
Publié: (2025)
par: RRV, Aswin, et autres
Publié: (2025)
SelfReflect: Can LLMs Communicate Their Internal Answer Distribution?
par: Kirchhof, Michael, et autres
Publié: (2025)
par: Kirchhof, Michael, et autres
Publié: (2025)
TTSR: Test-Time Self-Reflection for Continual Reasoning Improvement
par: He, Haoyang, et autres
Publié: (2026)
par: He, Haoyang, et autres
Publié: (2026)
From Emergence to Control: Probing and Modulating Self-Reflection in Language Models
par: Zhu, Xudong, et autres
Publié: (2025)
par: Zhu, Xudong, et autres
Publié: (2025)
SaySelf: Teaching LLMs to Express Confidence with Self-Reflective Rationales
par: Xu, Tianyang, et autres
Publié: (2024)
par: Xu, Tianyang, et autres
Publié: (2024)
Beyond Markovian: Reflective Exploration via Bayes-Adaptive RL for LLM Reasoning
par: Zhang, Shenao, et autres
Publié: (2025)
par: Zhang, Shenao, et autres
Publié: (2025)
SelectIT: Selective Instruction Tuning for LLMs via Uncertainty-Aware Self-Reflection
par: Liu, Liangxin, et autres
Publié: (2024)
par: Liu, Liangxin, et autres
Publié: (2024)
Selective Reflection-Tuning: Student-Selected Data Recycling for LLM Instruction-Tuning
par: Li, Ming, et autres
Publié: (2024)
par: Li, Ming, et autres
Publié: (2024)
Frictive Policy Optimization for LLMs: Epistemic Intervention, Risk-Sensitive Control, and Reflective Alignment
par: Pustejovsky, James, et autres
Publié: (2026)
par: Pustejovsky, James, et autres
Publié: (2026)
Efficient Reasoning for Large Reasoning Language Models via Certainty-Guided Reflection Suppression
par: Huang, Jiameng, et autres
Publié: (2025)
par: Huang, Jiameng, et autres
Publié: (2025)
Think Before You Prune: Self-Reflective Structured Pruning for Reasoning Language Models
par: Wang, Ziyan, et autres
Publié: (2025)
par: Wang, Ziyan, et autres
Publié: (2025)
Learning to Reason Over Time: Timeline Self-Reflection for Improved Temporal Reasoning in Language Models
par: Bazaga, Adrián, et autres
Publié: (2025)
par: Bazaga, Adrián, et autres
Publié: (2025)
ReflAct: World-Grounded Decision Making in LLM Agents via Goal-State Reflection
par: Kim, Jeonghye, et autres
Publié: (2025)
par: Kim, Jeonghye, et autres
Publié: (2025)
Direct Reasoning Optimization: Token-Level Reasoning Reflectivity Meets Rubric Gates for Unverifiable Tasks
par: Xu, Yifei, et autres
Publié: (2025)
par: Xu, Yifei, et autres
Publié: (2025)
Uncovering Biases with Reflective Large Language Models
par: Chang, Edward Y.
Publié: (2024)
par: Chang, Edward Y.
Publié: (2024)
Recursive Language Models Meet Uncertainty: The Surprising Effectiveness of Self-Reflective Program Search for Long Context
par: Alizadeh, Keivan, et autres
Publié: (2026)
par: Alizadeh, Keivan, et autres
Publié: (2026)
Hindsight is 20/20: Building Agent Memory that Retains, Recalls, and Reflects
par: Latimer, Chris, et autres
Publié: (2025)
par: Latimer, Chris, et autres
Publié: (2025)
Reflective Context Learning: Studying the Optimization Primitives of Context Space
par: Vassilyev, Nikita, et autres
Publié: (2026)
par: Vassilyev, Nikita, et autres
Publié: (2026)
POSIX: A Prompt Sensitivity Index For Large Language Models
par: Chatterjee, Anwoy, et autres
Publié: (2024)
par: Chatterjee, Anwoy, et autres
Publié: (2024)
Finding the Sweet Spot: Trading Quality, Cost, and Speed During Inference-Time LLM Reflection
par: Butler, Jack, et autres
Publié: (2025)
par: Butler, Jack, et autres
Publié: (2025)
Scalable Prompt Routing via Fine-Grained Latent Task Discovery
par: Zhang, Yunyi, et autres
Publié: (2026)
par: Zhang, Yunyi, et autres
Publié: (2026)
Teach Old SAEs New Domain Tricks with Boosting
par: Koriagin, Nikita, et autres
Publié: (2025)
par: Koriagin, Nikita, et autres
Publié: (2025)
Prompt Engineering a Prompt Engineer
par: Ye, Qinyuan, et autres
Publié: (2023)
par: Ye, Qinyuan, et autres
Publié: (2023)
Measuring Evaluation-Context Divergence in Open-Weight LLMs: A Paired-Prompt Protocol with Pilot Evidence of Alignment-Pipeline-Specific Heterogeneity
par: Burnat, Florian A. D., et autres
Publié: (2026)
par: Burnat, Florian A. D., et autres
Publié: (2026)
Learning from Supervision with Semantic and Episodic Memory: A Reflective Approach to Agent Adaptation
par: Hassell, Jackson, et autres
Publié: (2025)
par: Hassell, Jackson, et autres
Publié: (2025)
Vision-Language Models Can Self-Improve Reasoning via Reflection
par: Cheng, Kanzhi, et autres
Publié: (2024)
par: Cheng, Kanzhi, et autres
Publié: (2024)
SLaNC: Static LayerNorm Calibration
par: Salmani, Mahsa, et autres
Publié: (2024)
par: Salmani, Mahsa, et autres
Publié: (2024)
DynaPrompt: Dynamic Test-Time Prompt Tuning
par: Xiao, Zehao, et autres
Publié: (2025)
par: Xiao, Zehao, et autres
Publié: (2025)
PromptWizard: Task-Aware Prompt Optimization Framework
par: Agarwal, Eshaan, et autres
Publié: (2024)
par: Agarwal, Eshaan, et autres
Publié: (2024)
Language Models and Cycle Consistency for Self-Reflective Machine Translation
par: Wangni, Jianqiao
Publié: (2024)
par: Wangni, Jianqiao
Publié: (2024)
You Don't Need Prompt Engineering Anymore: The Prompting Inversion
par: Khan, Imran
Publié: (2025)
par: Khan, Imran
Publié: (2025)
Efficient Prompt Tuning by Multi-Space Projection and Prompt Fusion
par: Lan, Pengxiang, et autres
Publié: (2024)
par: Lan, Pengxiang, et autres
Publié: (2024)
Documents similaires
-
Automatic Prompt Optimization with Prompt Distillation
par: Dyagin, Ernest A., et autres
Publié: (2025) -
Enhancing LLM Problem Solving with REAP: Reflection, Explicit Problem Deconstruction, and Advanced Prompting
par: Lingo, Ryan, et autres
Publié: (2024) -
Reflect then Learn: Active Prompting for Information Extraction Guided by Introspective Confusion
par: Zhao, Dong, et autres
Publié: (2025) -
Reasoning: From Reflection to Solution
par: Li, Zixi
Publié: (2025) -
ReflectDiffu:Reflect between Emotion-intent Contagion and Mimicry for Empathetic Response Generation via a RL-Diffusion Framework
par: Yuan, Jiahao, et autres
Publié: (2024)