:: Library Catalog

Copertina

Salvato in:

Dettagli Bibliografici
Autori principali:	Sazonova, Varvara, Shmelkin, Dmitri, Kikot, Stanislav, Motolygin, Vasily
Natura:	Preprint
Pubblicazione:	2026
Soggetti:	Artificial Intelligence
Accesso online:	https://arxiv.org/abs/2602.20770
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Documenti analoghi

On The Expressive Power of Knowledge Graph Embedding Methods
di: Gao, Jiexing, et al.
Pubblicazione: (2024)

Secure Tool Manifest and Digital Signing Solution for Verifiable MCP and LLM Pipelines
di: Jamshidi, Saeid, et al.
Pubblicazione: (2026)

Scaling Generative Verifiers For Natural Language Mathematical Proof Verification And Selection
di: Mahdavi, Sadegh, et al.
Pubblicazione: (2025)

LLatrieval: LLM-Verified Retrieval for Verifiable Generation
di: Li, Xiaonan, et al.
Pubblicazione: (2023)

Verifier-Backed Hard Problem Generation for Mathematical Reasoning
di: Lai, Yuhang, et al.
Pubblicazione: (2026)

GeoBenchX: Benchmarking LLMs in Agent Solving Multistep Geospatial Tasks
di: Krechetova, Varvara, et al.
Pubblicazione: (2025)

Visions of Destruction: Exploring a Potential of Generative AI in Interactive Art
di: Sola, Mar Canet, et al.
Pubblicazione: (2024)

Grade Score: Quantifying LLM Performance in Option Selection
di: Iourovitski, Dmitri
Pubblicazione: (2024)

APIGen: Automated Pipeline for Generating Verifiable and Diverse Function-Calling Datasets
di: Liu, Zuxin, et al.
Pubblicazione: (2024)

A Framework for Cryptographic Verifiability of End-to-End AI Pipelines
di: Balan, Kar, et al.
Pubblicazione: (2025)

SkillGenBench: Benchmarking Skill Generation Pipelines for LLM Agents
di: Zhou, Yifan, et al.
Pubblicazione: (2026)

HERMES: Towards Efficient and Verifiable Mathematical Reasoning in LLMs
di: Ospanov, Azim, et al.
Pubblicazione: (2025)

Verifying LLM-Generated Code in the Context of Software Verification with Ada/SPARK
di: Cramer, Marcos, et al.
Pubblicazione: (2025)

Solve-Detect-Verify: Inference-Time Scaling with Flexible Generative Verifier
di: Zhong, Jianyuan, et al.
Pubblicazione: (2025)

Do We Need Frontier Models to Verify Mathematical Proofs?
di: Naik, Aaditya, et al.
Pubblicazione: (2026)

PRISM: Generation-Time Detection and Mitigation of Secret Leakage in Multi-Agent LLM Pipelines
di: Tapwal, Riya, et al.
Pubblicazione: (2026)

DeepPavlov at SemEval-2024 Task 8: Leveraging Transfer Learning for Detecting Boundaries of Machine-Generated Texts
di: Voznyuk, Anastasia, et al.
Pubblicazione: (2024)

RV-Syn: Rational and Verifiable Mathematical Reasoning Data Synthesis based on Structured Function Library
di: Wang, Jiapeng, et al.
Pubblicazione: (2025)

GLOVE: Global Verifier for LLM Memory-Environment Realignment
di: Yin, Xingkun, et al.
Pubblicazione: (2026)

DeepSeekMath-V2: Towards Self-Verifiable Mathematical Reasoning
di: Shao, Zhihong, et al.
Pubblicazione: (2025)

Situational Agency: The Framework for Designing Behavior in Agent-based art
di: Huang, Ary-Yue, et al.
Pubblicazione: (2025)

Why Open Small AI Models Matter for Interactive Art
di: Sola, Mar Canet, et al.
Pubblicazione: (2025)

Faver: Boosting LLM-based RTL Generation with Function Abstracted Verifiable Middleware
di: Mu, Jianan, et al.
Pubblicazione: (2025)

MedRule-KG: A Knowledge-Graph--Steered Scaffold for Mathematical Reasoning with a Lightweight Verifier
di: Su, Crystal
Pubblicazione: (2025)

VERIFY-RL: Verifiable Recursive Decomposition for Reinforcement Learning in Mathematical Reasoning
di: Qasim, Kaleem Ullah, et al.
Pubblicazione: (2026)

From Stochastic Answers to Verifiable Reasoning: Interpretable Decision-Making with LLM-Generated Code
di: Mahesh, Anirudh Jaidev, et al.
Pubblicazione: (2026)

VerifyLLM: LLM-Based Pre-Execution Task Plan Verification for Robots
di: Grigorev, Danil S., et al.
Pubblicazione: (2025)

Saturation-Driven Dataset Generation for LLM Mathematical Reasoning in the TPTP Ecosystem
di: Quesnel, Valentin, et al.
Pubblicazione: (2025)

BEAVER: An Efficient Deterministic LLM Verifier
di: Suresh, Tarun, et al.
Pubblicazione: (2025)

Why Retrying Fails: Context Contamination in LLM Agent Pipelines
di: Yang, Zhanfu
Pubblicazione: (2026)

Planning in the Dark: LLM-Symbolic Planning Pipeline without Experts
di: Huang, Sukai, et al.
Pubblicazione: (2024)

Automatic Configuration of LLM Post-Training Pipelines
di: Chwa, Channe, et al.
Pubblicazione: (2026)

STACK: Adversarial Attacks on LLM Safeguard Pipelines
di: McKenzie, Ian R., et al.
Pubblicazione: (2025)

Towards Automated Solution Recipe Generation for Industrial Asset Management with LLM
di: Zhou, Nianjun, et al.
Pubblicazione: (2024)

Evaluating Novelty in AI-Generated Research Plans Using Multi-Workflow LLM Pipelines
di: Saraogi, Devesh, et al.
Pubblicazione: (2025)

Grounded Continuation: A Linear-Time Runtime Verifier for LLM Conversations
di: He, Qisong, et al.
Pubblicazione: (2026)

AEMA: Verifiable Evaluation Framework for Trustworthy and Controlled Agentic LLM Systems
di: Lee, YenTing, et al.
Pubblicazione: (2026)

A Two-Stage LLM Framework for Accessible and Verified XAI Explanations
di: Mermigkis, Georgios, et al.
Pubblicazione: (2026)

Asynchronous Verified Semantic Caching for Tiered LLM Architectures
di: Singh, Asmit Kumar, et al.
Pubblicazione: (2026)

Assessing and Verifying Task Utility in LLM-Powered Applications
di: Arabzadeh, Negar, et al.
Pubblicazione: (2024)