Enregistré dans:
| Auteurs principaux: | Gao, Linyun, Wen, Qiang, Machida, Fumio |
|---|---|
| Format: | Preprint |
| Publié: |
2025
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2507.06907 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
Tail-aware N-version Machine Learning Models for Reliable API Recommendation
par: Matsuda, Aoi, et autres
Publié: (2026)
par: Matsuda, Aoi, et autres
Publié: (2026)
Adaptive Detection of Software Aging under Workload Shift
par: Silva, Rafael Jose Moura, et autres
Publié: (2025)
par: Silva, Rafael Jose Moura, et autres
Publié: (2025)
Semantic Voting: Execution-Grounded Consensus for LLM Code Generation
par: Jiang, Shan, et autres
Publié: (2026)
par: Jiang, Shan, et autres
Publié: (2026)
Exploring Robustness of Image Recognition Models on Hardware Accelerators
par: Louloudakis, Nikolaos, et autres
Publié: (2023)
par: Louloudakis, Nikolaos, et autres
Publié: (2023)
On STPA for Distributed Development of Safe Autonomous Driving: An Interview Study
par: Nouri, Ali, et autres
Publié: (2024)
par: Nouri, Ali, et autres
Publié: (2024)
Towards Refining Developer Questions using LLM-Based Named Entity Recognition for Developer Chatroom Conversations
par: Fathollahzadeh, Pouya, et autres
Publié: (2025)
par: Fathollahzadeh, Pouya, et autres
Publié: (2025)
Robust Learning of Diverse Code Edits
par: Aggarwal, Tushar, et autres
Publié: (2025)
par: Aggarwal, Tushar, et autres
Publié: (2025)
Influence-Guided Concolic Testing of Transformer Robustness
par: Hong, Chih-Duo, et autres
Publié: (2025)
par: Hong, Chih-Duo, et autres
Publié: (2025)
Understanding Robustness of Model Editing in Code LLMs
par: Chhetri, Vinaik, et autres
Publié: (2025)
par: Chhetri, Vinaik, et autres
Publié: (2025)
VNN: Verification-Friendly Neural Networks with Hard Robustness Guarantees
par: Baninajjar, Anahita, et autres
Publié: (2023)
par: Baninajjar, Anahita, et autres
Publié: (2023)
Scalable and Precise Patch Robustness Certification for Deep Learning Models with Top-k Predictions
par: Zhou, Qilin, et autres
Publié: (2025)
par: Zhou, Qilin, et autres
Publié: (2025)
Learning-Based Testing for Deep Learning: Enhancing Model Robustness with Adversarial Input Prioritization
par: Rahman, Sheikh Md Mushfiqur, et autres
Publié: (2025)
par: Rahman, Sheikh Md Mushfiqur, et autres
Publié: (2025)
Themis: Training Robust Multilingual Code Reward Models for Flexible Multi-Criteria Scoring
par: Paul, Indraneil, et autres
Publié: (2026)
par: Paul, Indraneil, et autres
Publié: (2026)
Traversal-as-Policy: Log-Distilled Gated Behavior Trees as Externalized, Verifiable Policies for Safe, Robust, and Efficient Agents
par: Li, Peiran, et autres
Publié: (2026)
par: Li, Peiran, et autres
Publié: (2026)
How Robust are LLM-Generated Library Imports? An Empirical Study using Stack Overflow
par: Latendresse, Jasmine, et autres
Publié: (2025)
par: Latendresse, Jasmine, et autres
Publié: (2025)
Evaluation and Improvement of Fault Detection for Large Language Models
par: Hu, Qiang, et autres
Publié: (2024)
par: Hu, Qiang, et autres
Publié: (2024)
Inferring Data Preconditions from Deep Learning Models for Trustworthy Prediction in Deployment
par: Ahmed, Shibbir, et autres
Publié: (2024)
par: Ahmed, Shibbir, et autres
Publié: (2024)
ADReFT: Adaptive Decision Repair for Safe Autonomous Driving via Reinforcement Fine-Tuning
par: Cheng, Mingfei, et autres
Publié: (2025)
par: Cheng, Mingfei, et autres
Publié: (2025)
Hammer: Robust Function-Calling for On-Device Language Models via Function Masking
par: Lin, Qiqiang, et autres
Publié: (2024)
par: Lin, Qiqiang, et autres
Publié: (2024)
Requirement falsification for cyber-physical systems using generative models
par: Peltomäki, Jarkko, et autres
Publié: (2023)
par: Peltomäki, Jarkko, et autres
Publié: (2023)
Push Your Agent: Measuring and Enforcing Quantitative Goal Persistence in Long-Horizon LLM Agents
par: Cai, Yuandao, et autres
Publié: (2026)
par: Cai, Yuandao, et autres
Publié: (2026)
PyPulse: A Python Library for Biosignal Imputation
par: Gao, Kevin, et autres
Publié: (2024)
par: Gao, Kevin, et autres
Publié: (2024)
DocuMint: Docstring Generation for Python using Small Language Models
par: Poudel, Bibek, et autres
Publié: (2024)
par: Poudel, Bibek, et autres
Publié: (2024)
ENCORE: Ensemble Learning using Convolution Neural Machine Translation for Automatic Program Repair
par: Lutellier, Thibaud, et autres
Publié: (2019)
par: Lutellier, Thibaud, et autres
Publié: (2019)
Code-Aware Prompting: A study of Coverage Guided Test Generation in Regression Setting using LLM
par: Ryan, Gabriel, et autres
Publié: (2024)
par: Ryan, Gabriel, et autres
Publié: (2024)
Try with Simpler -- An Evaluation of Improved Principal Component Analysis in Log-based Anomaly Detection
par: Yang, Lin, et autres
Publié: (2023)
par: Yang, Lin, et autres
Publié: (2023)
Missing-Aware Multimodal Fusion for Unified Microservice Incident Management
par: Qian, Wenzhuo, et autres
Publié: (2026)
par: Qian, Wenzhuo, et autres
Publié: (2026)
Keep the Conversation Going: Fixing 162 out of 337 bugs for $0.42 each using ChatGPT
par: Xia, Chunqiu Steven, et autres
Publié: (2023)
par: Xia, Chunqiu Steven, et autres
Publié: (2023)
How do Machine Learning Projects use Continuous Integration Practices? An Empirical Study on GitHub Actions
par: Bernardo, João Helis, et autres
Publié: (2024)
par: Bernardo, João Helis, et autres
Publié: (2024)
FGDM: Reasoning Aware Multi-Agentic Framework for Software Bug Detection using Chain of Thought and Tree of Thought Prompting
par: Padmanabhuni, Srita, et autres
Publié: (2026)
par: Padmanabhuni, Srita, et autres
Publié: (2026)
DSHGT: Dual-Supervisors Heterogeneous Graph Transformer -- A pioneer study of using heterogeneous graph learning for detecting software vulnerabilities
par: Zhang, Tiehua, et autres
Publié: (2023)
par: Zhang, Tiehua, et autres
Publié: (2023)
How Safe Are AI-Generated Patches? A Large-scale Study on Security Risks in LLM and Agentic Automated Program Repair on SWE-bench
par: Sajadi, Amirali, et autres
Publié: (2025)
par: Sajadi, Amirali, et autres
Publié: (2025)
R2E-Gym: Procedural Environments and Hybrid Verifiers for Scaling Open-Weights SWE Agents
par: Jain, Naman, et autres
Publié: (2025)
par: Jain, Naman, et autres
Publié: (2025)
Operational Robustness of LLMs on Code Generation
par: Paul, Debalina Ghosh, et autres
Publié: (2026)
par: Paul, Debalina Ghosh, et autres
Publié: (2026)
Machine Learning Robustness: A Primer
par: Braiek, Houssem Ben, et autres
Publié: (2024)
par: Braiek, Houssem Ben, et autres
Publié: (2024)
QiMeng-PRepair: Precise Code Repair via Edit-Aware Reward Optimization
par: Ke, Changxin, et autres
Publié: (2026)
par: Ke, Changxin, et autres
Publié: (2026)
QiMeng-MuPa: Mutual-Supervised Learning for Sequential-to-Parallel Code Translation
par: Ke, Changxin, et autres
Publié: (2025)
par: Ke, Changxin, et autres
Publié: (2025)
Deep Learning and Machine Learning: Advancing Big Data Analytics and Management with Design Patterns
par: Chen, Keyu, et autres
Publié: (2024)
par: Chen, Keyu, et autres
Publié: (2024)
How Robustly do LLMs Understand Execution Semantics?
par: Spiess, Claudio, et autres
Publié: (2026)
par: Spiess, Claudio, et autres
Publié: (2026)
Towards Robust Agentic CUDA Kernel Benchmarking, Verification, and Optimization
par: Lange, Robert Tjarko, et autres
Publié: (2025)
par: Lange, Robert Tjarko, et autres
Publié: (2025)
Documents similaires
-
Tail-aware N-version Machine Learning Models for Reliable API Recommendation
par: Matsuda, Aoi, et autres
Publié: (2026) -
Adaptive Detection of Software Aging under Workload Shift
par: Silva, Rafael Jose Moura, et autres
Publié: (2025) -
Semantic Voting: Execution-Grounded Consensus for LLM Code Generation
par: Jiang, Shan, et autres
Publié: (2026) -
Exploring Robustness of Image Recognition Models on Hardware Accelerators
par: Louloudakis, Nikolaos, et autres
Publié: (2023) -
On STPA for Distributed Development of Safe Autonomous Driving: An Interview Study
par: Nouri, Ali, et autres
Publié: (2024)