:: Library Catalog

Cover Image

Saved in:

Bibliographic Details
Main Authors:	Mo, Mingqiao, Tan, Yunlong, Zhang, Hao, Zhang, Heng, He, Yangfan
Format:	Preprint
Published:	2026
Subjects:	Computation and Language
Online Access:	https://arxiv.org/abs/2601.20679
Tags:	Add Tag No Tags, Be the first to tag this record!

Similar Items

Code Representation Learning At Scale
by: Zhang, Dejiao, et al.
Published: (2024)

Enhancing Code LLMs with Reinforcement Learning in Code Generation: A Survey
by: Wang, Junqiao, et al.
Published: (2024)

Learning Speech Representations with Variational Predictive Coding
by: Yeh, Sung-Lin, et al.
Published: (2025)

SWE-Pruner: Self-Adaptive Context Pruning for Coding Agents
by: Wang, Yuhang, et al.
Published: (2026)

ViC: Virtual Compiler Is All You Need For Assembly Code Search
by: Gao, Zeyu, et al.
Published: (2024)

IFEvalCode: Controlled Code Generation
by: Yang, Jian, et al.
Published: (2025)

MdEval: Massively Multilingual Code Debugging
by: Liu, Shukai, et al.
Published: (2024)

StepCodeReasoner: Aligning Code Reasoning with Stepwise Execution Traces via Reinforcement Learning
by: Wang, Hao, et al.
Published: (2026)

CodeCriticBench: A Holistic Code Critique Benchmark for Large Language Models
by: Zhang, Alexander, et al.
Published: (2025)

Improving Cross-lingual Representation for Semantic Retrieval with Code-switching
by: Maimaiti, Mieradilijiang, et al.
Published: (2024)

Executable Code Actions Elicit Better LLM Agents
by: Wang, Xingyao, et al.
Published: (2024)

Paper2Code: Automating Code Generation from Scientific Papers in Machine Learning
by: Seo, Minju, et al.
Published: (2025)

Generating Equivalent Representations of Code By A Self-Reflection Approach
by: Li, Jia, et al.
Published: (2024)

IRCoder: Intermediate Representations Make Language Models Robust Multilingual Code Generators
by: Paul, Indraneil, et al.
Published: (2024)

MHPP: Exploring the Capabilities and Limitations of Language Models Beyond Basic Code Generation
by: Dai, Jianbo, et al.
Published: (2024)

LLM4Decompile: Decompiling Binary Code with Large Language Models
by: Tan, Hanzhuo, et al.
Published: (2024)

ResearchCodeBench: Benchmarking LLMs on Implementing Novel Machine Learning Research Code
by: Hua, Tianyu, et al.
Published: (2025)

Scaling Agentic Verifier for Competitive Coding
by: Ma, Zeyao, et al.
Published: (2026)

CodeElo: Benchmarking Competition-level Code Generation of LLMs with Human-comparable Elo Ratings
by: Quan, Shanghaoran, et al.
Published: (2025)

R1-Code-Interpreter: LLMs Reason with Code via Supervised and Multi-stage Reinforcement Learning
by: Chen, Yongchao, et al.
Published: (2025)

NL-Debugging: Exploiting Natural Language as an Intermediate Representation for Code Debugging
by: Zhang, Weiming, et al.
Published: (2025)

Structured Code Representations Enable Data-Efficient Adaptation of Code Language Models
by: Agarwal, Mayank, et al.
Published: (2024)

To Code, or Not To Code? Exploring Impact of Code in Pre-training
by: Aryabumi, Viraat, et al.
Published: (2024)

Let the Code LLM Edit Itself When You Edit the Code
by: He, Zhenyu, et al.
Published: (2024)

Code Comparison Tuning for Code Large Language Models
by: Jiang, Yufan, et al.
Published: (2024)

Code-as-Symbolic-Planner: Foundation Model-Based Robot Planning via Symbolic Code Generation
by: Chen, Yongchao, et al.
Published: (2025)

Embarrassingly Simple Self-Distillation Improves Code Generation
by: Zhang, Ruixiang, et al.
Published: (2026)

Towards Exception Safety Code Generation with Intermediate Representation Agents Framework
by: Zhang, Xuanming, et al.
Published: (2024)

A Machine Learning Approach Towards SKILL Code Autocompletion
by: Dehaerne, Enrique, et al.
Published: (2023)

A Novel ICD Coding Method Based on Associated and Hierarchical Code Description Distillation
by: Zhang, Bin, et al.
Published: (2024)

CodeSteer: Symbolic-Augmented Language Models via Code/Text Guidance
by: Chen, Yongchao, et al.
Published: (2025)

CodeBoost: Boosting Code LLMs by Squeezing Knowledge from Code Snippets with RL
by: Wang, Sijie, et al.
Published: (2025)

CodeCipher: Learning to Obfuscate Source Code Against LLMs
by: Lin, Yalan, et al.
Published: (2024)

DynaCode: A Dynamic Complexity-Aware Code Benchmark for Evaluating Large Language Models in Code Generation
by: Hu, Wenhao, et al.
Published: (2025)

RoCoIns: Enhancing Robustness of Large Language Models through Code-Style Instructions
by: Zhang, Yuansen, et al.
Published: (2024)

CodeSimpleQA: Scaling Factuality in Code Large Language Models
by: Yang, Jian, et al.
Published: (2025)

AutoCodeBench: Large Language Models are Automatic Code Benchmark Generators
by: Chou, Jason, et al.
Published: (2025)

MaxCode: A Max-Reward Reinforcement Learning Framework for Automated Code Optimization
by: Ou, Jiefu, et al.
Published: (2026)

GeoMathCode: Understanding Interleaved Math-Code Reasoning for Geometry Problem Solving
by: Zhang, Yingji, et al.
Published: (2026)

Evaluating and Achieving Controllable Code Completion in Code LLM
by: Zhang, Jiajun, et al.
Published: (2026)