Gespeichert in:
| Hauptverfasser: | Munley, Christian, Jarmusch, Aaron, Chandrasekaran, Sunita |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2023
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2310.04963 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
LLM4VV: Exploring LLM-as-a-Judge for Validation and Verification Testsuites
von: Sollenberger, Zachariah, et al.
Veröffentlicht: (2024)
von: Sollenberger, Zachariah, et al.
Veröffentlicht: (2024)
Microbenchmark-Driven Analytical Performance Modeling Across Modern GPU Architectures
von: Jarmusch, Aaron, et al.
Veröffentlicht: (2026)
von: Jarmusch, Aaron, et al.
Veröffentlicht: (2026)
Microbenchmarking NVIDIA's Blackwell Architecture: An in-depth Architectural Analysis
von: Jarmusch, Aaron, et al.
Veröffentlicht: (2025)
von: Jarmusch, Aaron, et al.
Veröffentlicht: (2025)
Dissecting the NVIDIA Blackwell Architecture with Microbenchmarks
von: Jarmusch, Aaron, et al.
Veröffentlicht: (2025)
von: Jarmusch, Aaron, et al.
Veröffentlicht: (2025)
Execution-Centric Characterization of FP8 Matrix Cores, Asynchronous Execution, and Structured Sparsity on AMD MI300A
von: Jarmusch, Aaron, et al.
Veröffentlicht: (2026)
von: Jarmusch, Aaron, et al.
Veröffentlicht: (2026)
LLM4VV: Evaluating Cutting-Edge LLMs for Generation and Evaluation of Directive-Based Parallel Programming Model Compiler Tests
von: Sollenberger, Zachariah, et al.
Veröffentlicht: (2025)
von: Sollenberger, Zachariah, et al.
Veröffentlicht: (2025)
This human study did not involve human subjects: Validating LLM simulations as behavioral evidence
von: Hullman, Jessica, et al.
Veröffentlicht: (2026)
von: Hullman, Jessica, et al.
Veröffentlicht: (2026)
The Erasure Illusion: Stress-Testing the Generalization of LLM Forgetting Evaluation
von: Jia, Hengrui, et al.
Veröffentlicht: (2025)
von: Jia, Hengrui, et al.
Veröffentlicht: (2025)
SACTOR: LLM-Driven Correct and Idiomatic C to Rust Translation with Static Analysis and FFI-Based Verification
von: Zhou, Tianyang, et al.
Veröffentlicht: (2025)
von: Zhou, Tianyang, et al.
Veröffentlicht: (2025)
CI/CD Efforts for Validation, Verification and Benchmarking OpenMP Implementations
von: Jarmusch, Aaron, et al.
Veröffentlicht: (2024)
von: Jarmusch, Aaron, et al.
Veröffentlicht: (2024)
LinearizeLLM: An Agent-Based Framework for LLM-Driven Exact Linear Reformulation of Nonlinear Optimization Problems
von: Kandora, Paul-Niklas Ken, et al.
Veröffentlicht: (2025)
von: Kandora, Paul-Niklas Ken, et al.
Veröffentlicht: (2025)
WiCER: Wiki-memory Compile, Evaluate, Refine Iterative Knowledge Compilation for LLM Wiki Systems
von: Huerta, Juan M.
Veröffentlicht: (2026)
von: Huerta, Juan M.
Veröffentlicht: (2026)
Who Validates the Validators? Aligning LLM-Assisted Evaluation of LLM Outputs with Human Preferences
von: Shankar, Shreya, et al.
Veröffentlicht: (2024)
von: Shankar, Shreya, et al.
Veröffentlicht: (2024)
LLM Translation of Compiler Intermediate Representation
von: Ramirez, Andrea Valenzuela, et al.
Veröffentlicht: (2026)
von: Ramirez, Andrea Valenzuela, et al.
Veröffentlicht: (2026)
An LLM-Tool Compiler for Fused Parallel Function Calling
von: Singh, Simranjit, et al.
Veröffentlicht: (2024)
von: Singh, Simranjit, et al.
Veröffentlicht: (2024)
Syntax- and Compilation-Preserving Evasion of LLM Vulnerability Detectors
von: Sun, Luze, et al.
Veröffentlicht: (2026)
von: Sun, Luze, et al.
Veröffentlicht: (2026)
Securing LLM-Generated Embedded Firmware through AI Agent-Driven Validation and Patching
von: Abtahi, Seyed Moein, et al.
Veröffentlicht: (2025)
von: Abtahi, Seyed Moein, et al.
Veröffentlicht: (2025)
LightCode: Compiling LLM Inference for Photonic-Electronic Systems
von: Tomich, Ryan, et al.
Veröffentlicht: (2025)
von: Tomich, Ryan, et al.
Veröffentlicht: (2025)
HPCTransCompile: An AI Compiler Generated Dataset for High-Performance CUDA Transpilation and LLM Preliminary Exploration
von: Lv, Jiaqi, et al.
Veröffentlicht: (2025)
von: Lv, Jiaqi, et al.
Veröffentlicht: (2025)
Auditable Decision Models with Learned Abstention and Real-Time Steering
von: Chandrasekaran, Sankaranarayanan Palamadai
Veröffentlicht: (2026)
von: Chandrasekaran, Sankaranarayanan Palamadai
Veröffentlicht: (2026)
SkCC: Portable and Secure Skill Compilation for Cross-Framework LLM Agents
von: Ouyang, Yipeng, et al.
Veröffentlicht: (2026)
von: Ouyang, Yipeng, et al.
Veröffentlicht: (2026)
ReaComp: Compiling LLM Reasoning into Symbolic Solvers for Efficient Program Synthesis
von: Naik, Atharva, et al.
Veröffentlicht: (2026)
von: Naik, Atharva, et al.
Veröffentlicht: (2026)
Tests as Prompt: A Test-Driven-Development Benchmark for LLM Code Generation
von: Cui, Yi
Veröffentlicht: (2025)
von: Cui, Yi
Veröffentlicht: (2025)
AI-Generated Smells: An Analysis of Code and Architecture in LLM and Agent-Driven Development
von: Zhu, Yuecai, et al.
Veröffentlicht: (2026)
von: Zhu, Yuecai, et al.
Veröffentlicht: (2026)
From Parameters to Performance: A Data-Driven Study on LLM Structure and Development
von: Wang, Suqing, et al.
Veröffentlicht: (2025)
von: Wang, Suqing, et al.
Veröffentlicht: (2025)
Compiled AI: Deterministic Code Generation for LLM-Based Workflow Automation
von: Trooskens, Geert, et al.
Veröffentlicht: (2026)
von: Trooskens, Geert, et al.
Veröffentlicht: (2026)
LLM as a code generator in Agile Model Driven Development
von: Sadik, Ahmed R., et al.
Veröffentlicht: (2024)
von: Sadik, Ahmed R., et al.
Veröffentlicht: (2024)
LLM-AR: LLM-powered Automated Reasoning Framework
von: Chen, Rick, et al.
Veröffentlicht: (2025)
von: Chen, Rick, et al.
Veröffentlicht: (2025)
Reasoning-Driven Multimodal LLM for Domain Generalization
von: Xu, Zhipeng, et al.
Veröffentlicht: (2026)
von: Xu, Zhipeng, et al.
Veröffentlicht: (2026)
LLM Driven Processes to Foster Explainable AI
von: Pehlke, Marcel, et al.
Veröffentlicht: (2025)
von: Pehlke, Marcel, et al.
Veröffentlicht: (2025)
Evaluation-Driven Development and Operations of LLM Agents: A Process Model and Reference Architecture
von: Xia, Boming, et al.
Veröffentlicht: (2024)
von: Xia, Boming, et al.
Veröffentlicht: (2024)
SagaLLM: Context Management, Validation, and Transaction Guarantees for Multi-Agent LLM Planning
von: Chang, Edward Y., et al.
Veröffentlicht: (2025)
von: Chang, Edward Y., et al.
Veröffentlicht: (2025)
Player-Driven Emergence in LLM-Driven Game Narrative
von: Peng, Xiangyu, et al.
Veröffentlicht: (2024)
von: Peng, Xiangyu, et al.
Veröffentlicht: (2024)
Validating LLM-Generated Programs with Metamorphic Prompt Testing
von: Wang, Xiaoyin, et al.
Veröffentlicht: (2024)
von: Wang, Xiaoyin, et al.
Veröffentlicht: (2024)
Improving LLM Reasoning with Multi-Agent Tree-of-Thought Validator Agent
von: Haji, Fatemeh, et al.
Veröffentlicht: (2024)
von: Haji, Fatemeh, et al.
Veröffentlicht: (2024)
Still Manual? Automated Linter Configuration via DSL-Based LLM Compilation of Coding Standards
von: Zhang, Zejun, et al.
Veröffentlicht: (2026)
von: Zhang, Zejun, et al.
Veröffentlicht: (2026)
Validated Intent Compilation for Constrained Routing in LEO Mega-Constellations
von: Li, Yuanhang
Veröffentlicht: (2026)
von: Li, Yuanhang
Veröffentlicht: (2026)
iGRPO: Self-Feedback-Driven LLM Reasoning
von: Hatamizadeh, Ali, et al.
Veröffentlicht: (2026)
von: Hatamizadeh, Ali, et al.
Veröffentlicht: (2026)
Increasing AI Explainability by LLM Driven Standard Processes
von: Jansen, Marc, et al.
Veröffentlicht: (2025)
von: Jansen, Marc, et al.
Veröffentlicht: (2025)
LLM Agent Swarm for Hypothesis-Driven Drug Discovery
von: Song, Kevin, et al.
Veröffentlicht: (2025)
von: Song, Kevin, et al.
Veröffentlicht: (2025)
Ähnliche Einträge
-
LLM4VV: Exploring LLM-as-a-Judge for Validation and Verification Testsuites
von: Sollenberger, Zachariah, et al.
Veröffentlicht: (2024) -
Microbenchmark-Driven Analytical Performance Modeling Across Modern GPU Architectures
von: Jarmusch, Aaron, et al.
Veröffentlicht: (2026) -
Microbenchmarking NVIDIA's Blackwell Architecture: An in-depth Architectural Analysis
von: Jarmusch, Aaron, et al.
Veröffentlicht: (2025) -
Dissecting the NVIDIA Blackwell Architecture with Microbenchmarks
von: Jarmusch, Aaron, et al.
Veröffentlicht: (2025) -
Execution-Centric Characterization of FP8 Matrix Cores, Asynchronous Execution, and Structured Sparsity on AMD MI300A
von: Jarmusch, Aaron, et al.
Veröffentlicht: (2026)