:: Library Catalog

Buchumschlag

Gespeichert in:

Bibliographische Detailangaben
1. Verfasser:	Li, Hongmin
Format:	Preprint
Veröffentlicht:	2026
Schlagworte:	Machine Learning
Online-Zugang:	https://arxiv.org/abs/2605.11599
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Ähnliche Einträge

FastUMAP: Scalable Dimensionality Reduction via Bipartite Landmark Sampling
von: Li, Hongmin
Veröffentlicht: (2026)

A Controlled Counterexample to Strong Proxy-Based Explanations of OOD Performance: in a Fixed Pretraining-and-Probing Setup
von: Li, Hongmin
Veröffentlicht: (2026)

Separating Shortcut Transition from Cross-Family OOD Failure in a Minimal Model
von: Li, Hongmin
Veröffentlicht: (2026)

ISAAC: Auditing Causal Reasoning in Deep Models for Drug-Target Interaction
von: Tarantino, Barbara, et al.
Veröffentlicht: (2026)

Automated Network Protocol Testing with LLM Agents
von: Wei, Yunze, et al.
Veröffentlicht: (2025)

Adaptive Test-Time Compute Allocation for Reasoning LLMs via Constrained Policy Optimization
von: Zhai, Zhiyuan, et al.
Veröffentlicht: (2026)

Predictive Auditing of Hidden Tokens in LLM APIs via Reasoning Length Estimation
von: Wang, Ziyao, et al.
Veröffentlicht: (2025)

A Paired Testing Protocol for Batch-Conditioned Refusal Robustness in LLM Serving
von: Kadadekar, Sahil
Veröffentlicht: (2026)

$\nabla$-Reasoner: LLM Reasoning via Test-Time Gradient Descent in Latent Space
von: Wang, Peihao, et al.
Veröffentlicht: (2026)

Vital Trace: Protocol-Constrained Patient-State Reasoning for Longitudinal Clinical Trajectories
von: Qu, Zhan, et al.
Veröffentlicht: (2026)

PromptAudit: Auditing Prompt Sensitivity in LLM-Based Vulnerability Detection
von: Camarato, Steffen J., et al.
Veröffentlicht: (2026)

An Auditing Test To Detect Behavioral Shift in Language Models
von: Richter, Leo, et al.
Veröffentlicht: (2024)

BAR Conjecture: the Feasibility of Inference Budget-Constrained LLM Services with Authenticity and Reasoning
von: Zhou, Jinan, et al.
Veröffentlicht: (2025)

LSEC: Large-scale spectral ensemble clustering
von: Li, Hongmin, et al.
Veröffentlicht: (2021)

Stress-Testing Alignment Audits With Prompt-Level Strategic Deception
von: Daniels, Oliver, et al.
Veröffentlicht: (2026)

Who Gets Which Message? Auditing Demographic Bias in LLM-Generated Targeted Text
von: Islam, Tunazzina
Veröffentlicht: (2026)

Beyond Test-Time Memory: State-Space Optimal Control for LLM Reasoning
von: Wang, Peihao, et al.
Veröffentlicht: (2026)

FastTTS: Accelerating Test-Time Scaling for Edge LLM Reasoning
von: Chen, Hao Mark, et al.
Veröffentlicht: (2025)

Auditing Reasoning-Trace Memorization Claims after Unlearning with Head-Conditioned Canaries
von: Li, Yanhang, et al.
Veröffentlicht: (2026)

DASH: Deterministic Attention Scheduling for High-throughput Reproducible LLM Training
von: Qiang, Xinwei, et al.
Veröffentlicht: (2026)

Bypassing the Rationale: Causal Auditing of Implicit Reasoning in Language Models
von: Sathyanarayanan, Anish, et al.
Veröffentlicht: (2026)

Code Comprehension then Auditing for Unsupervised LLM Evaluation
von: Patel, Bhrij, et al.
Veröffentlicht: (2024)

MCP Safety Audit: LLMs with the Model Context Protocol Allow Major Security Exploits
von: Radosevich, Brandon, et al.
Veröffentlicht: (2025)

Reliability Auditing for Downstream LLM tasks in Psychiatry: LLM-Generated Hospitalization Risk Scores
von: Panda, Shevya, et al.
Veröffentlicht: (2026)

TRACES: Proactive Safety Auditing for Multi-Turn LLM Agents via Trajectory-State Modeling
von: Li, Jiaqian, et al.
Veröffentlicht: (2026)

CreditAudit: 2$^\text{nd}$ Dimension for LLM Evaluation and Selection
von: Song, Yiliang, et al.
Veröffentlicht: (2026)

Do Multilingual VLMs Reason Equally? A Cross-Lingual Visual Reasoning Audit for Indian Languages
von: R, Swastik
Veröffentlicht: (2026)

Guided Reasoning in LLM-Driven Penetration Testing Using Structured Attack Trees
von: Nakano, Katsuaki, et al.
Veröffentlicht: (2025)

Auditing Information Disclosure During LLM-Scale Gradient Descent Using Gradient Uniqueness
von: Abdelghafar, Sleem, et al.
Veröffentlicht: (2025)

COMPASS: Benchmarking Constrained Optimization in LLM Agents
von: Qin, Tian, et al.
Veröffentlicht: (2025)

Efficient LLM Jailbreak via Adaptive Dense-to-sparse Constrained Optimization
von: Hu, Kai, et al.
Veröffentlicht: (2024)

Representation Without Reward: A JEPA Audit for LLM Fine-Tuning
von: Sengupta, Biswa
Veröffentlicht: (2026)

Can LLM Safety Be Ensured by Constraining Parameter Regions?
von: Li, Zongmin, et al.
Veröffentlicht: (2026)

Online Reasoning Calibration: Test-Time Training Enables Generalizable Conformal LLM Reasoning
von: Zhou, Cai, et al.
Veröffentlicht: (2026)

DARTS: Targeting Prognostic Covariates in Budget-Constrained Sequential Experiments
von: Husar, Kateryna, et al.
Veröffentlicht: (2026)

Constrained Meta Reinforcement Learning with Provable Test-Time Safety
von: Ni, Tingting, et al.
Veröffentlicht: (2026)

Auditing for Human Expertise
von: Alur, Rohan, et al.
Veröffentlicht: (2023)

From Static Benchmarks to Dynamic Protocol: Agent-Centric Text Anomaly Detection for Evaluating LLM Reasoning
von: Yoa, Seungdong, et al.
Veröffentlicht: (2026)

Projected Coupled Diffusion for Test-Time Constrained Joint Generation
von: Luan, Hao, et al.
Veröffentlicht: (2025)

Constrained Best Arm Identification with Tests for Feasibility
von: Cai, Ting, et al.
Veröffentlicht: (2025)