Gespeichert in:
| Hauptverfasser: | Zhang, Yedi, Cai, Yufan, Zuo, Xinyue, Luan, Xiaokun, Wang, Kailong, Hou, Zhe, Zhang, Yifan, Wei, Zhiyuan, Sun, Meng, Sun, Jun, Sun, Jing, Dong, Jin Song |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2024
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2412.06512 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
PAT-Agent: Autoformalization for Model Checking
von: Zuo, Xinyue, et al.
Veröffentlicht: (2025)
von: Zuo, Xinyue, et al.
Veröffentlicht: (2025)
Towards Large Language Model Aided Program Refinement
von: Cai, Yufan, et al.
Veröffentlicht: (2024)
von: Cai, Yufan, et al.
Veröffentlicht: (2024)
Beyond Correctness: Exposing LLM-generated Logical Flaws in Reasoning via Multi-step Automated Theorem Proving
von: Zheng, Xinyi, et al.
Veröffentlicht: (2025)
von: Zheng, Xinyi, et al.
Veröffentlicht: (2025)
Protecting Deep Learning Model Copyrights with Adversarial Example-Free Reuse Detection
von: Luan, Xiaokun, et al.
Veröffentlicht: (2024)
von: Luan, Xiaokun, et al.
Veröffentlicht: (2024)
Event-B Agent: Towards LLM Agent for Formal Model Synthesis and Repair
von: Wang, Hongshu, et al.
Veröffentlicht: (2026)
von: Wang, Hongshu, et al.
Veröffentlicht: (2026)
Automata-Based Steering of Large Language Models for Diverse Structured Generation
von: Luan, Xiaokun, et al.
Veröffentlicht: (2025)
von: Luan, Xiaokun, et al.
Veröffentlicht: (2025)
ClawWorm: Self-Propagating Attacks Across LLM Agent Ecosystems
von: Zhang, Yihao, et al.
Veröffentlicht: (2026)
von: Zhang, Yihao, et al.
Veröffentlicht: (2026)
LLM-enabled Applications Require System-Level Threat Monitoring
von: Zhang, Yedi, et al.
Veröffentlicht: (2026)
von: Zhang, Yedi, et al.
Veröffentlicht: (2026)
RACC: Representation-Aware Coverage Criteria for LLM Safety Testing
von: Wei, Zeming, et al.
Veröffentlicht: (2026)
von: Wei, Zeming, et al.
Veröffentlicht: (2026)
Towards Trustworthy Legal AI through LLM Agents and Formal Reasoning
von: Chen, Linze, et al.
Veröffentlicht: (2025)
von: Chen, Linze, et al.
Veröffentlicht: (2025)
MaCTG: Multi-Agent Collaborative Thought Graph for Automatic Programming
von: Zhao, Zixiao, et al.
Veröffentlicht: (2024)
von: Zhao, Zixiao, et al.
Veröffentlicht: (2024)
Self-Organizing Multi-Agent Systems for Continuous Software Development
von: Lyu, Wenhan, et al.
Veröffentlicht: (2026)
von: Lyu, Wenhan, et al.
Veröffentlicht: (2026)
Reinforcement Learning with Negative Tests as Completeness Signal for Formal Specification Synthesis
von: Huang, Zhechong, et al.
Veröffentlicht: (2026)
von: Huang, Zhechong, et al.
Veröffentlicht: (2026)
Large Language Models are overconfident and amplify human bias
von: Sun, Fengfei, et al.
Veröffentlicht: (2025)
von: Sun, Fengfei, et al.
Veröffentlicht: (2025)
Requirements Development and Formalization for Reliable Code Generation: A Multi-Agent Vision
von: Lu, Xu, et al.
Veröffentlicht: (2025)
von: Lu, Xu, et al.
Veröffentlicht: (2025)
A Test Suite for Efficient Robustness Evaluation of Face Recognition Systems
von: Zhang, Ruihan, et al.
Veröffentlicht: (2025)
von: Zhang, Ruihan, et al.
Veröffentlicht: (2025)
SceneGenAgent: Precise Industrial Scene Generation with Coding Agent
von: Xia, Xiao, et al.
Veröffentlicht: (2024)
von: Xia, Xiao, et al.
Veröffentlicht: (2024)
REDriver: Runtime Enforcement for Autonomous Vehicles
von: Sun, Yang, et al.
Veröffentlicht: (2024)
von: Sun, Yang, et al.
Veröffentlicht: (2024)
Iterative Experience Refinement of Software-Developing Agents
von: Qian, Chen, et al.
Veröffentlicht: (2024)
von: Qian, Chen, et al.
Veröffentlicht: (2024)
LLM App Store Analysis: A Vision and Roadmap
von: Zhao, Yanjie, et al.
Veröffentlicht: (2024)
von: Zhao, Yanjie, et al.
Veröffentlicht: (2024)
A Roadmap for Software Testing in Open Collaborative Development Environments
von: Wang, Qing, et al.
Veröffentlicht: (2024)
von: Wang, Qing, et al.
Veröffentlicht: (2024)
Trustworthy AI Software Engineers
von: Aleti, Aldeida, et al.
Veröffentlicht: (2026)
von: Aleti, Aldeida, et al.
Veröffentlicht: (2026)
Co-Saving: Resource Aware Multi-Agent Collaboration for Software Development
von: Qiu, Rennai, et al.
Veröffentlicht: (2025)
von: Qiu, Rennai, et al.
Veröffentlicht: (2025)
A Vulnerability Code Intent Summary Dataset
von: Huang, Yifan, et al.
Veröffentlicht: (2025)
von: Huang, Yifan, et al.
Veröffentlicht: (2025)
Formalizing UML State Machines for Automated Verification -- A Survey
von: André, Étienne, et al.
Veröffentlicht: (2024)
von: André, Étienne, et al.
Veröffentlicht: (2024)
MuMuTestUp: Mutation-based Multi-Agent Test Case Update
von: Tian, Dawei, et al.
Veröffentlicht: (2026)
von: Tian, Dawei, et al.
Veröffentlicht: (2026)
The Cream Rises to the Top: Efficient Reranking Method for Verilog Code Generation
von: Yang, Guang, et al.
Veröffentlicht: (2025)
von: Yang, Guang, et al.
Veröffentlicht: (2025)
ACAV: A Framework for Automatic Causality Analysis in Autonomous Vehicle Accident Recordings
von: Sun, Huijia, et al.
Veröffentlicht: (2024)
von: Sun, Huijia, et al.
Veröffentlicht: (2024)
Formal Architecture Descriptors as Navigation Primitives for AI Coding Agents
von: Jin, Ruoqi
Veröffentlicht: (2026)
von: Jin, Ruoqi
Veröffentlicht: (2026)
Experiential Co-Learning of Software-Developing Agents
von: Qian, Chen, et al.
Veröffentlicht: (2023)
von: Qian, Chen, et al.
Veröffentlicht: (2023)
The 4/$δ$ Bound: Designing Predictable LLM-Verifier Systems for Formal Method Guarantee
von: Dantas, PIerre, et al.
Veröffentlicht: (2025)
von: Dantas, PIerre, et al.
Veröffentlicht: (2025)
Shepherd: A Runtime Substrate Empowering Meta-Agents with a Formalized Execution Trace
von: Yu, Simon, et al.
Veröffentlicht: (2026)
von: Yu, Simon, et al.
Veröffentlicht: (2026)
Predicting Developer Acceptance of AI-Generated Code Suggestions
von: Jiang, Jing, et al.
Veröffentlicht: (2026)
von: Jiang, Jing, et al.
Veröffentlicht: (2026)
ChatDev: Communicative Agents for Software Development
von: Qian, Chen, et al.
Veröffentlicht: (2023)
von: Qian, Chen, et al.
Veröffentlicht: (2023)
Co-Evolution of Types and Dependencies: Towards Repository-Level Type Inference for Python Code
von: Sun, Shuo, et al.
Veröffentlicht: (2025)
von: Sun, Shuo, et al.
Veröffentlicht: (2025)
Knowledge-Based Multi-Agent Framework for Automated Software Architecture Design
von: Zhang, Yiran, et al.
Veröffentlicht: (2025)
von: Zhang, Yiran, et al.
Veröffentlicht: (2025)
ROMAN: Reward-Orchestrated Multi-Head Attention Network for Autonomous Driving System Testing
von: Chi, Jianlei, et al.
Veröffentlicht: (2026)
von: Chi, Jianlei, et al.
Veröffentlicht: (2026)
Accountability of Robust and Reliable AI-Enabled Systems: A Preliminary Study and Roadmap
von: Scaramuzza, Filippo, et al.
Veröffentlicht: (2025)
von: Scaramuzza, Filippo, et al.
Veröffentlicht: (2025)
Generative AI for Self-Adaptive Systems: State of the Art and Research Roadmap
von: Li, Jialong, et al.
Veröffentlicht: (2025)
von: Li, Jialong, et al.
Veröffentlicht: (2025)
Debug2Fix: Can Interactive Debugging Help Coding Agents Fix More Bugs?
von: Garg, Spandan, et al.
Veröffentlicht: (2026)
von: Garg, Spandan, et al.
Veröffentlicht: (2026)
Ähnliche Einträge
-
PAT-Agent: Autoformalization for Model Checking
von: Zuo, Xinyue, et al.
Veröffentlicht: (2025) -
Towards Large Language Model Aided Program Refinement
von: Cai, Yufan, et al.
Veröffentlicht: (2024) -
Beyond Correctness: Exposing LLM-generated Logical Flaws in Reasoning via Multi-step Automated Theorem Proving
von: Zheng, Xinyi, et al.
Veröffentlicht: (2025) -
Protecting Deep Learning Model Copyrights with Adversarial Example-Free Reuse Detection
von: Luan, Xiaokun, et al.
Veröffentlicht: (2024) -
Event-B Agent: Towards LLM Agent for Formal Model Synthesis and Repair
von: Wang, Hongshu, et al.
Veröffentlicht: (2026)