:: Library Catalog

Image de couverture de livre

Enregistré dans:

Détails bibliographiques
Auteurs principaux:	Gao, Linyun, Wen, Qiang, Machida, Fumio
Format:	Preprint
Publié:	2025
Sujets:	Machine Learning Software Engineering
Accès en ligne:	https://arxiv.org/abs/2507.06907
Tags:	Ajouter un tag Pas de tags, Soyez le premier à ajouter un tag!

Documents similaires

Tail-aware N-version Machine Learning Models for Reliable API Recommendation
par: Matsuda, Aoi, et autres
Publié: (2026)

Adaptive Detection of Software Aging under Workload Shift
par: Silva, Rafael Jose Moura, et autres
Publié: (2025)

Semantic Voting: Execution-Grounded Consensus for LLM Code Generation
par: Jiang, Shan, et autres
Publié: (2026)

Exploring Robustness of Image Recognition Models on Hardware Accelerators
par: Louloudakis, Nikolaos, et autres
Publié: (2023)

On STPA for Distributed Development of Safe Autonomous Driving: An Interview Study
par: Nouri, Ali, et autres
Publié: (2024)

Towards Refining Developer Questions using LLM-Based Named Entity Recognition for Developer Chatroom Conversations
par: Fathollahzadeh, Pouya, et autres
Publié: (2025)

Robust Learning of Diverse Code Edits
par: Aggarwal, Tushar, et autres
Publié: (2025)

Influence-Guided Concolic Testing of Transformer Robustness
par: Hong, Chih-Duo, et autres
Publié: (2025)

Understanding Robustness of Model Editing in Code LLMs
par: Chhetri, Vinaik, et autres
Publié: (2025)

VNN: Verification-Friendly Neural Networks with Hard Robustness Guarantees
par: Baninajjar, Anahita, et autres
Publié: (2023)

Scalable and Precise Patch Robustness Certification for Deep Learning Models with Top-k Predictions
par: Zhou, Qilin, et autres
Publié: (2025)

Learning-Based Testing for Deep Learning: Enhancing Model Robustness with Adversarial Input Prioritization
par: Rahman, Sheikh Md Mushfiqur, et autres
Publié: (2025)

Themis: Training Robust Multilingual Code Reward Models for Flexible Multi-Criteria Scoring
par: Paul, Indraneil, et autres
Publié: (2026)

Traversal-as-Policy: Log-Distilled Gated Behavior Trees as Externalized, Verifiable Policies for Safe, Robust, and Efficient Agents
par: Li, Peiran, et autres
Publié: (2026)

How Robust are LLM-Generated Library Imports? An Empirical Study using Stack Overflow
par: Latendresse, Jasmine, et autres
Publié: (2025)

Evaluation and Improvement of Fault Detection for Large Language Models
par: Hu, Qiang, et autres
Publié: (2024)

Inferring Data Preconditions from Deep Learning Models for Trustworthy Prediction in Deployment
par: Ahmed, Shibbir, et autres
Publié: (2024)

ADReFT: Adaptive Decision Repair for Safe Autonomous Driving via Reinforcement Fine-Tuning
par: Cheng, Mingfei, et autres
Publié: (2025)

Hammer: Robust Function-Calling for On-Device Language Models via Function Masking
par: Lin, Qiqiang, et autres
Publié: (2024)

Requirement falsification for cyber-physical systems using generative models
par: Peltomäki, Jarkko, et autres
Publié: (2023)

Push Your Agent: Measuring and Enforcing Quantitative Goal Persistence in Long-Horizon LLM Agents
par: Cai, Yuandao, et autres
Publié: (2026)

PyPulse: A Python Library for Biosignal Imputation
par: Gao, Kevin, et autres
Publié: (2024)

DocuMint: Docstring Generation for Python using Small Language Models
par: Poudel, Bibek, et autres
Publié: (2024)

ENCORE: Ensemble Learning using Convolution Neural Machine Translation for Automatic Program Repair
par: Lutellier, Thibaud, et autres
Publié: (2019)

Code-Aware Prompting: A study of Coverage Guided Test Generation in Regression Setting using LLM
par: Ryan, Gabriel, et autres
Publié: (2024)

Try with Simpler -- An Evaluation of Improved Principal Component Analysis in Log-based Anomaly Detection
par: Yang, Lin, et autres
Publié: (2023)

Missing-Aware Multimodal Fusion for Unified Microservice Incident Management
par: Qian, Wenzhuo, et autres
Publié: (2026)

Keep the Conversation Going: Fixing 162 out of 337 bugs for $0.42 each using ChatGPT
par: Xia, Chunqiu Steven, et autres
Publié: (2023)

How do Machine Learning Projects use Continuous Integration Practices? An Empirical Study on GitHub Actions
par: Bernardo, João Helis, et autres
Publié: (2024)

FGDM: Reasoning Aware Multi-Agentic Framework for Software Bug Detection using Chain of Thought and Tree of Thought Prompting
par: Padmanabhuni, Srita, et autres
Publié: (2026)

DSHGT: Dual-Supervisors Heterogeneous Graph Transformer -- A pioneer study of using heterogeneous graph learning for detecting software vulnerabilities
par: Zhang, Tiehua, et autres
Publié: (2023)

How Safe Are AI-Generated Patches? A Large-scale Study on Security Risks in LLM and Agentic Automated Program Repair on SWE-bench
par: Sajadi, Amirali, et autres
Publié: (2025)

R2E-Gym: Procedural Environments and Hybrid Verifiers for Scaling Open-Weights SWE Agents
par: Jain, Naman, et autres
Publié: (2025)

Operational Robustness of LLMs on Code Generation
par: Paul, Debalina Ghosh, et autres
Publié: (2026)

Machine Learning Robustness: A Primer
par: Braiek, Houssem Ben, et autres
Publié: (2024)

QiMeng-PRepair: Precise Code Repair via Edit-Aware Reward Optimization
par: Ke, Changxin, et autres
Publié: (2026)

QiMeng-MuPa: Mutual-Supervised Learning for Sequential-to-Parallel Code Translation
par: Ke, Changxin, et autres
Publié: (2025)

Deep Learning and Machine Learning: Advancing Big Data Analytics and Management with Design Patterns
par: Chen, Keyu, et autres
Publié: (2024)

How Robustly do LLMs Understand Execution Semantics?
par: Spiess, Claudio, et autres
Publié: (2026)

Towards Robust Agentic CUDA Kernel Benchmarking, Verification, and Optimization
par: Lange, Robert Tjarko, et autres
Publié: (2025)