:: Library Catalog

Cover Image

Saved in:

Bibliographic Details
Main Authors:	Gong, Ruihan, Liu, Yue, Qu, Wenjie, Du, Mingzhe, He, Yufei, Ma, Yingwei, Chen, Yulin, Liu, Xiang, Wen, Yi, Li, Xinfeng, Wang, Ruidong, Zhu, Xinzhong, Hooi, Bryan, Zhang, Jiaheng
Format:	Preprint
Published:	2025
Subjects:	Computation and Language
Online Access:	https://arxiv.org/abs/2505.19756
Tags:	Add Tag No Tags, Be the first to tag this record!

Similar Items

GuardReasoner-VL: Safeguarding VLMs via Reinforced Reasoning
by: Liu, Yue, et al.
Published: (2025)

Safety in Large Reasoning Models: A Survey
by: Wang, Cheng, et al.
Published: (2025)

AliMark: Enhancing Robustness of Sentence-Level Watermarking Against Text Paraphrasing
by: Li, Yuexin, et al.
Published: (2026)

GuardReasoner-Omni: A Reasoning-based Multi-modal Guardrail for Text, Image, Video, and Audio
by: Zhu, Zhenhao, et al.
Published: (2026)

Efficient Inference for Large Reasoning Models: A Survey
by: Liu, Yue, et al.
Published: (2025)

ExtendAttack: Attacking Servers of LRMs via Extending Reasoning
by: Zhu, Zhenhao, et al.
Published: (2025)

Echoes within the Reasoning: Stealthy and Effective Watermarking via Chain of Thought
by: Lu, Jiacheng, et al.
Published: (2026)

Meta-Reasoner: Dynamic Guidance for Optimized Inference-time Reasoning in Large Language Models
by: Sui, Yuan, et al.
Published: (2025)

GuardReasoner: Towards Reasoning-based LLM Safeguards
by: Liu, Yue, et al.
Published: (2025)

FlipAttack: Jailbreak LLMs via Flipping
by: Liu, Yue, et al.
Published: (2024)

Can Indirect Prompt Injection Attacks Be Detected and Removed?
by: Chen, Yulin, et al.
Published: (2025)

The Molecular Structure of Thought: Mapping the Topology of Long Chain-of-Thought Reasoning
by: Chen, Qiguang, et al.
Published: (2026)

Deconstructing Long Chain-of-Thought: A Structured Reasoning Optimization Framework for Long CoT Distillation
by: Luo, Yijia, et al.
Published: (2025)

Autonomous Chain-of-Thought Distillation for Graph-Based Fraud Detection
by: Li, Yuan, et al.
Published: (2026)

KLong: Training LLM Agent for Extremely Long-horizon Tasks
by: Liu, Yue, et al.
Published: (2026)

FlowReasoner: Reinforcing Query-Level Meta-Agents
by: Gao, Hongcheng, et al.
Published: (2025)

WebAgentGuard: A Reasoning-Driven Guard Model for Detecting Prompt Injection Attacks in Web Agents
by: Chen, Yulin, et al.
Published: (2026)

Unveiling Confirmation Bias in Chain-of-Thought Reasoning
by: Wan, Yue, et al.
Published: (2025)

Evaluating the Paperclip Maximizer: Are RL-Based Language Models More Likely to Pursue Instrumental Goals?
by: He, Yufei, et al.
Published: (2025)

FiDeLiS: Faithful Reasoning in Large Language Model for Knowledge Graph Question Answering
by: Sui, Yuan, et al.
Published: (2024)

Geneshift: Impact of different scenario shift on Jailbreaking LLM
by: Wu, Tianyi, et al.
Published: (2025)

Markov Chain of Thought for Efficient Mathematical Reasoning
by: Yang, Wen, et al.
Published: (2024)

RCoT-Seg: Reinforced Chain-of-Thought for Video Reasoning and Segmentation
by: Wen, Junwei, et al.
Published: (2026)

TopicAttack: An Indirect Prompt Injection Attack via Topic Transition
by: Chen, Yulin, et al.
Published: (2025)

ETR: Entropy Trend Reward for Efficient Chain-of-Thought Reasoning
by: Xiong, Xuan, et al.
Published: (2026)

UniGraph2: Learning a Unified Embedding Space to Bind Multimodal Graphs
by: He, Yufei, et al.
Published: (2025)

Demystifying Long Chain-of-Thought Reasoning in LLMs
by: Yeo, Edward, et al.
Published: (2025)

UTMath: Math Evaluation with Unit Test via Reasoning-to-Coding Thoughts
by: Yang, Bo, et al.
Published: (2024)

From Long to Short: LLMs Excel at Trimming Own Reasoning Chains
by: Han, Wei, et al.
Published: (2025)

Chain of Preference Optimization: Improving Chain-of-Thought Reasoning in LLMs
by: Zhang, Xuan, et al.
Published: (2024)

Enabling Self-Improving Agents to Learn at Test Time With Human-In-The-Loop Guidance
by: He, Yufei, et al.
Published: (2025)

Can Knowledge Graphs Make Large Language Models More Trustworthy? An Empirical Study Over Open-ended Question Answering
by: Sui, Yuan, et al.
Published: (2024)

UniGraph: Learning a Unified Cross-Domain Foundation Model for Text-Attributed Graphs
by: He, Yufei, et al.
Published: (2024)

Value-Guided Search for Efficient Chain-of-Thought Reasoning
by: Wang, Kaiwen, et al.
Published: (2025)

Towards Realistic Personalization: Evaluating Long-Horizon Preference Following in Personalized User-LLM Interactions
by: Guo, Qianyun, et al.
Published: (2026)

Using Unconscious Thought to Improve Evaluations of Complex Accounting Estimates
by: Blake Holman, et al.
Published: (2026)

Can Large Language Models Detect Errors in Long Chain-of-Thought Reasoning?
by: He, Yancheng, et al.
Published: (2025)

Echoless Label-Based Pre-computation for Memory-Efficient Heterogeneous Graph Learning
by: Hu, Jun, et al.
Published: (2025)

EvoTest: Evolutionary Test-Time Learning for Self-Improving Agentic Systems
by: He, Yufei, et al.
Published: (2025)

KOR-Bench: Benchmarking Language Models on Knowledge-Orthogonal Reasoning Tasks
by: Ma, Kaijing, et al.
Published: (2024)