Salvato in:
| Autori principali: | Thakur, Shailja, Saxena, Vaibhav, Kulkarni, Rohan, Singh, Shivdeep, Selvam, Parameswaran, Patel, Hima, Kanayama, Hiroshi |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2025
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2512.00127 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
Scaling Granite Code Models to 128K Context
di: Stallone, Matt, et al.
Pubblicazione: (2024)
di: Stallone, Matt, et al.
Pubblicazione: (2024)
CLEVER: A Curated Benchmark for Formally Verified Code Generation
di: Thakur, Amitayush, et al.
Pubblicazione: (2025)
di: Thakur, Amitayush, et al.
Pubblicazione: (2025)
Certified Program Synthesis with a Multi-Modal Verifier
di: Feng, Yueyang, et al.
Pubblicazione: (2026)
di: Feng, Yueyang, et al.
Pubblicazione: (2026)
Taming the Hydra: Targeted Control-Flow Transformations for Dynamic Symbolic Execution
di: Saumya, Charitha, et al.
Pubblicazione: (2023)
di: Saumya, Charitha, et al.
Pubblicazione: (2023)
Reverse Chain: A Generic-Rule for LLMs to Master Multi-API Planning
di: Zhang, Yinger, et al.
Pubblicazione: (2023)
di: Zhang, Yinger, et al.
Pubblicazione: (2023)
Program Skeletons for Automated Program Translation
di: Wang, Bo, et al.
Pubblicazione: (2025)
di: Wang, Bo, et al.
Pubblicazione: (2025)
Beyond Code Pairs: Dialogue-Based Data Generation for LLM Code Translation
di: Chen, Le, et al.
Pubblicazione: (2025)
di: Chen, Le, et al.
Pubblicazione: (2025)
EnvTrace: Simulation-Based Semantic Evaluation of LLM Code via Execution Trace Alignment -- Demonstrated at Synchrotron Beamlines
di: van der Vleuten, Noah, et al.
Pubblicazione: (2025)
di: van der Vleuten, Noah, et al.
Pubblicazione: (2025)
Shepherd: A Runtime Substrate Empowering Meta-Agents with a Formalized Execution Trace
di: Yu, Simon, et al.
Pubblicazione: (2026)
di: Yu, Simon, et al.
Pubblicazione: (2026)
Evaluating the Ability of Large Language Models to Generate Verifiable Specifications in VeriFast
di: Fan, Wen, et al.
Pubblicazione: (2024)
di: Fan, Wen, et al.
Pubblicazione: (2024)
VERINA: Benchmarking Verifiable Code Generation
di: Ye, Zhe, et al.
Pubblicazione: (2025)
di: Ye, Zhe, et al.
Pubblicazione: (2025)
Formally Verifiable Generated ASN.1/ACN Encoders and Decoders: A Case Study
di: Bucev, Mario, et al.
Pubblicazione: (2024)
di: Bucev, Mario, et al.
Pubblicazione: (2024)
IterGen: Iterative Semantic-aware Structured LLM Generation with Backtracking
di: Ugare, Shubham, et al.
Pubblicazione: (2024)
di: Ugare, Shubham, et al.
Pubblicazione: (2024)
Verifying a Realistic Mutable Hash Table
di: Chassot, Samuel, et al.
Pubblicazione: (2021)
di: Chassot, Samuel, et al.
Pubblicazione: (2021)
Executing as You Generate: Hiding Execution Latency in LLM Code Generation
di: Sun, Zhensu, et al.
Pubblicazione: (2026)
di: Sun, Zhensu, et al.
Pubblicazione: (2026)
Literate Tracing
di: Sotoudeh, Matthew
Pubblicazione: (2025)
di: Sotoudeh, Matthew
Pubblicazione: (2025)
Verified invertible lexer using regular expressions and DFAs
di: Chassot, Samuel, et al.
Pubblicazione: (2024)
di: Chassot, Samuel, et al.
Pubblicazione: (2024)
Towards AI-Assisted Synthesis of Verified Dafny Methods
di: Misu, Md Rakib Hossain, et al.
Pubblicazione: (2024)
di: Misu, Md Rakib Hossain, et al.
Pubblicazione: (2024)
Dynamic Stability of LLM-Generated Code
di: Rajput, Prateek, et al.
Pubblicazione: (2025)
di: Rajput, Prateek, et al.
Pubblicazione: (2025)
SEVerA: Verified Synthesis of Self-Evolving Agents
di: Banerjee, Debangshu, et al.
Pubblicazione: (2026)
di: Banerjee, Debangshu, et al.
Pubblicazione: (2026)
Effective LLM-Driven Code Generation with Pythoness
di: Levin, Kyla H., et al.
Pubblicazione: (2025)
di: Levin, Kyla H., et al.
Pubblicazione: (2025)
Granite Code Models: A Family of Open Foundation Models for Code Intelligence
di: Mishra, Mayank, et al.
Pubblicazione: (2024)
di: Mishra, Mayank, et al.
Pubblicazione: (2024)
Smaller = Weaker? Benchmarking Robustness of Quantized LLMs in Code Generation
di: Fang, Sen, et al.
Pubblicazione: (2025)
di: Fang, Sen, et al.
Pubblicazione: (2025)
Hydra: Efficient, Correct Code Generation via Checkpoint-and-Rollback Support
di: Du, Alexander, et al.
Pubblicazione: (2026)
di: Du, Alexander, et al.
Pubblicazione: (2026)
Assessing GPT-4-Vision's Capabilities in UML-Based Code Generation
di: Antal, Gábor, et al.
Pubblicazione: (2024)
di: Antal, Gábor, et al.
Pubblicazione: (2024)
Self-Improving Code Generation via Semantic Entropy and Behavioral Consensus
di: Zhang, Huan, et al.
Pubblicazione: (2026)
di: Zhang, Huan, et al.
Pubblicazione: (2026)
PPM: Automated Generation of Diverse Programming Problems for Benchmarking Code Generation Models
di: Chen, Simin, et al.
Pubblicazione: (2024)
di: Chen, Simin, et al.
Pubblicazione: (2024)
Enhancing Automated Loop Invariant Generation for Complex Programs with Large Language Models
di: Liu, Ruibang, et al.
Pubblicazione: (2024)
di: Liu, Ruibang, et al.
Pubblicazione: (2024)
From Code Generation to Software Testing: AI Copilot with Context-Based RAG
di: Wang, Yuchen, et al.
Pubblicazione: (2025)
di: Wang, Yuchen, et al.
Pubblicazione: (2025)
AutoMCQ -- Automatically Generate Code Comprehension Questions using GenAI
di: Goodfellow, Martin, et al.
Pubblicazione: (2025)
di: Goodfellow, Martin, et al.
Pubblicazione: (2025)
Once4All: Skeleton-Guided SMT Solver Fuzzing with LLM-Synthesized Generators
di: Sun, Maolin, et al.
Pubblicazione: (2025)
di: Sun, Maolin, et al.
Pubblicazione: (2025)
Is Functional Correctness Enough to Evaluate Code Language Models? Exploring Diversity of Generated Codes
di: Chon, Heejae, et al.
Pubblicazione: (2024)
di: Chon, Heejae, et al.
Pubblicazione: (2024)
Learning to Guarantee Type Correctness in Code Generation through Type-Guided Program Synthesis
di: Huang, Zhechong, et al.
Pubblicazione: (2025)
di: Huang, Zhechong, et al.
Pubblicazione: (2025)
ACCeLLiuM: Supervised Fine-Tuning for Automated OpenACC Pragma Generation
di: Jhaveri, Samyak, et al.
Pubblicazione: (2025)
di: Jhaveri, Samyak, et al.
Pubblicazione: (2025)
CodeIF-Bench: Evaluating Instruction-Following Capabilities of Large Language Models in Interactive Code Generation
di: Wang, Peiding, et al.
Pubblicazione: (2025)
di: Wang, Peiding, et al.
Pubblicazione: (2025)
AI Coders Are Among Us: Rethinking Programming Language Grammar Towards Efficient Code Generation
di: Sun, Zhensu, et al.
Pubblicazione: (2024)
di: Sun, Zhensu, et al.
Pubblicazione: (2024)
Perish or Flourish? A Holistic Evaluation of Large Language Models for Code Generation in Functional Programming
di: Lang, Nguyet-Anh H., et al.
Pubblicazione: (2026)
di: Lang, Nguyet-Anh H., et al.
Pubblicazione: (2026)
A Preliminary Study of Multilingual Code Language Models for Code Generation Task Using Translated Benchmarks
di: Dandamudi, Rohit, et al.
Pubblicazione: (2024)
di: Dandamudi, Rohit, et al.
Pubblicazione: (2024)
Benchmarking Large Language Models for ABAP Code Generation: An Empirical Study on Iterative Improvement by Compiler Feedback
di: Wallraven, Stephan, et al.
Pubblicazione: (2026)
di: Wallraven, Stephan, et al.
Pubblicazione: (2026)
GitChameleon 2.0: Evaluating AI Code Generation Against Python Library Version Incompatibilities
di: Misra, Diganta, et al.
Pubblicazione: (2025)
di: Misra, Diganta, et al.
Pubblicazione: (2025)
Documenti analoghi
-
Scaling Granite Code Models to 128K Context
di: Stallone, Matt, et al.
Pubblicazione: (2024) -
CLEVER: A Curated Benchmark for Formally Verified Code Generation
di: Thakur, Amitayush, et al.
Pubblicazione: (2025) -
Certified Program Synthesis with a Multi-Modal Verifier
di: Feng, Yueyang, et al.
Pubblicazione: (2026) -
Taming the Hydra: Targeted Control-Flow Transformations for Dynamic Symbolic Execution
di: Saumya, Charitha, et al.
Pubblicazione: (2023) -
Reverse Chain: A Generic-Rule for LLMs to Master Multi-API Planning
di: Zhang, Yinger, et al.
Pubblicazione: (2023)