Enregistré dans:
| Auteurs principaux: | Yang, Runxin, Wan, Yuxuan, Li, Shuqing, Lyu, Michael R. |
|---|---|
| Format: | Preprint |
| Publié: |
2025
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2509.26161 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
EfficientUICoder: Efficient MLLM-based UI Code Generation via Input and Output Token Compression
par: Xiao, Jingyu, et autres
Publié: (2025)
par: Xiao, Jingyu, et autres
Publié: (2025)
Automatically Generating UI Code from Screenshot: A Divide-and-Conquer-Based Approach
par: Wan, Yuxuan, et autres
Publié: (2024)
par: Wan, Yuxuan, et autres
Publié: (2024)
DesignBench: A Comprehensive Benchmark for MLLM-based Front-end Code Generation
par: Xiao, Jingyu, et autres
Publié: (2025)
par: Xiao, Jingyu, et autres
Publié: (2025)
Interaction2Code: Benchmarking MLLM-based Interactive Webpage Code Generation from Interactive Prototyping
par: Xiao, Jingyu, et autres
Publié: (2024)
par: Xiao, Jingyu, et autres
Publié: (2024)
Automatically Generating Web Applications from Requirements Via Multi-Agent Test-Driven Development
par: Wan, Yuxuan, et autres
Publié: (2025)
par: Wan, Yuxuan, et autres
Publié: (2025)
TREAT: A Code LLMs Trustworthiness / Reliability Evaluation and Testing Framework
par: Gao, Shuzheng, et autres
Publié: (2025)
par: Gao, Shuzheng, et autres
Publié: (2025)
MRWeb: An Exploration of Generating Multi-Page Resource-Aware Web Code from UI Designs
par: Wan, Yuxuan, et autres
Publié: (2024)
par: Wan, Yuxuan, et autres
Publié: (2024)
Test-Driven Development for Code Generation
par: Mathews, Noble Saji, et autres
Publié: (2024)
par: Mathews, Noble Saji, et autres
Publié: (2024)
CodeCrash: Exposing LLM Fragility to Misleading Natural Language in Code Reasoning
par: Lam, Man Ho, et autres
Publié: (2025)
par: Lam, Man Ho, et autres
Publié: (2025)
Spec-Driven Development:From Code to Contract in the Age of AI Coding Assistants
par: Piskala, Deepak Babu
Publié: (2026)
par: Piskala, Deepak Babu
Publié: (2026)
From Laboratory to Real-World Applications: Benchmarking Agentic Code Reasoning at the Repository Level
par: Li, Jia, et autres
Publié: (2026)
par: Li, Jia, et autres
Publié: (2026)
FasterPy: An LLM-based Code Execution Efficiency Optimization Framework
par: Wu, Yue, et autres
Publié: (2025)
par: Wu, Yue, et autres
Publié: (2025)
SPENCER: Self-Adaptive Model Distillation for Efficient Code Retrieval
par: Gu, Wenchao, et autres
Publié: (2025)
par: Gu, Wenchao, et autres
Publié: (2025)
FastCode: Fast and Cost-Efficient Code Understanding and Reasoning
par: Li, Zhonghang, et autres
Publié: (2026)
par: Li, Zhonghang, et autres
Publié: (2026)
Top Pass: Improve Code Generation by Pass@k-Maximized Code Ranking
par: Lyu, Zhi-Cun, et autres
Publié: (2024)
par: Lyu, Zhi-Cun, et autres
Publié: (2024)
Enhancing LLM-Based Coding Tools through Native Integration of IDE-Derived Static Context
par: Li, Yichen, et autres
Publié: (2024)
par: Li, Yichen, et autres
Publié: (2024)
Uncovering LLM-Generated Code: A Zero-Shot Synthetic Code Detector via Code Rewriting
par: Ye, Tong, et autres
Publié: (2024)
par: Ye, Tong, et autres
Publié: (2024)
3D Software Synthesis Guided by Constraint-Expressive Intermediate Representation
par: Li, Shuqing, et autres
Publié: (2025)
par: Li, Shuqing, et autres
Publié: (2025)
Tests as Prompt: A Test-Driven-Development Benchmark for LLM Code Generation
par: Cui, Yi
Publié: (2025)
par: Cui, Yi
Publié: (2025)
AI-Generated Smells: An Analysis of Code and Architecture in LLM and Agent-Driven Development
par: Zhu, Yuecai, et autres
Publié: (2026)
par: Zhu, Yuecai, et autres
Publié: (2026)
An Empirical Study of Proactive Coding Assistants in Real-World Software Development
par: Li, Lehui, et autres
Publié: (2026)
par: Li, Lehui, et autres
Publié: (2026)
Does Your Neural Code Completion Model Use My Code? A Membership Inference Approach
par: Wan, Yao, et autres
Publié: (2024)
par: Wan, Yao, et autres
Publié: (2024)
Automatic Building Code Review: A Case Study
par: Wan, Hanlong, et autres
Publié: (2025)
par: Wan, Hanlong, et autres
Publié: (2025)
RAPGen: An Approach for Fixing Code Inefficiencies in Zero-Shot
par: Garg, Spandan, et autres
Publié: (2023)
par: Garg, Spandan, et autres
Publié: (2023)
ZS4C: Zero-Shot Synthesis of Compilable Code for Incomplete Code Snippets using LLMs
par: Kabir, Azmain, et autres
Publié: (2024)
par: Kabir, Azmain, et autres
Publié: (2024)
When Neural Code Completion Models Size up the Situation: Attaining Cheaper and Faster Completion through Dynamic Model Inference
par: Sun, Zhensu, et autres
Publié: (2024)
par: Sun, Zhensu, et autres
Publié: (2024)
Rigor, Reliability, and Reproducibility Matter: A Decade-Scale Survey of 572 Code Benchmarks
par: Cao, Jialun, et autres
Publié: (2025)
par: Cao, Jialun, et autres
Publié: (2025)
DeepCode: Open Agentic Coding
par: Li, Zongwei, et autres
Publié: (2025)
par: Li, Zongwei, et autres
Publié: (2025)
Search-Based LLMs for Code Optimization
par: Gao, Shuzheng, et autres
Publié: (2024)
par: Gao, Shuzheng, et autres
Publié: (2024)
RedCode: Risky Code Execution and Generation Benchmark for Code Agents
par: Guo, Chengquan, et autres
Publié: (2024)
par: Guo, Chengquan, et autres
Publié: (2024)
ProxyWar: Dynamic Assessment of LLM Code Generation in Game Arenas
par: Peng, Wenjun, et autres
Publié: (2026)
par: Peng, Wenjun, et autres
Publié: (2026)
EvoCodeBench: A Human-Performance Benchmark for Self-Evolving LLM-Driven Coding Systems
par: Zhang, Wentao, et autres
Publié: (2026)
par: Zhang, Wentao, et autres
Publié: (2026)
Prompt Driven Development with Claude Code: Building a Complete TUI Framework for the Ring Programming Language
par: Fayed, Mahmoud Samir, et autres
Publié: (2026)
par: Fayed, Mahmoud Samir, et autres
Publié: (2026)
A Benchmark for Localizing Code and Non-Code Issues in Software Projects
par: Zhang, Zejun, et autres
Publié: (2025)
par: Zhang, Zejun, et autres
Publié: (2025)
XRZoo: A Large-Scale and Versatile Dataset of Extended Reality (XR) Applications
par: Li, Shuqing, et autres
Publié: (2024)
par: Li, Shuqing, et autres
Publié: (2024)
Runtime Failure Hunting for Physics Engine Based Software Systems: How Far Can We Go?
par: Li, Shuqing, et autres
Publié: (2025)
par: Li, Shuqing, et autres
Publié: (2025)
FeatureBench: Benchmarking Agentic Coding for Complex Feature Development
par: Zhou, Qixing, et autres
Publié: (2026)
par: Zhou, Qixing, et autres
Publié: (2026)
Goedel-Code-Prover: Hierarchical Proof Search for Open State-of-the-Art Code Verification
par: Li, Zenan, et autres
Publié: (2026)
par: Li, Zenan, et autres
Publié: (2026)
Deep Learning for Code Intelligence: Survey, Benchmark and Toolkit
par: Wan, Yao, et autres
Publié: (2023)
par: Wan, Yao, et autres
Publié: (2023)
CodeAlignBench: Assessing Code Generation Models on Developer-Preferred Code Adjustments
par: Mehralian, Forough, et autres
Publié: (2025)
par: Mehralian, Forough, et autres
Publié: (2025)
Documents similaires
-
EfficientUICoder: Efficient MLLM-based UI Code Generation via Input and Output Token Compression
par: Xiao, Jingyu, et autres
Publié: (2025) -
Automatically Generating UI Code from Screenshot: A Divide-and-Conquer-Based Approach
par: Wan, Yuxuan, et autres
Publié: (2024) -
DesignBench: A Comprehensive Benchmark for MLLM-based Front-end Code Generation
par: Xiao, Jingyu, et autres
Publié: (2025) -
Interaction2Code: Benchmarking MLLM-based Interactive Webpage Code Generation from Interactive Prototyping
par: Xiao, Jingyu, et autres
Publié: (2024) -
Automatically Generating Web Applications from Requirements Via Multi-Agent Test-Driven Development
par: Wan, Yuxuan, et autres
Publié: (2025)