Gespeichert in:
| 1. Verfasser: | Li, Hongmin |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2026
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2605.11599 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
FastUMAP: Scalable Dimensionality Reduction via Bipartite Landmark Sampling
von: Li, Hongmin
Veröffentlicht: (2026)
von: Li, Hongmin
Veröffentlicht: (2026)
A Controlled Counterexample to Strong Proxy-Based Explanations of OOD Performance: in a Fixed Pretraining-and-Probing Setup
von: Li, Hongmin
Veröffentlicht: (2026)
von: Li, Hongmin
Veröffentlicht: (2026)
Separating Shortcut Transition from Cross-Family OOD Failure in a Minimal Model
von: Li, Hongmin
Veröffentlicht: (2026)
von: Li, Hongmin
Veröffentlicht: (2026)
ISAAC: Auditing Causal Reasoning in Deep Models for Drug-Target Interaction
von: Tarantino, Barbara, et al.
Veröffentlicht: (2026)
von: Tarantino, Barbara, et al.
Veröffentlicht: (2026)
Automated Network Protocol Testing with LLM Agents
von: Wei, Yunze, et al.
Veröffentlicht: (2025)
von: Wei, Yunze, et al.
Veröffentlicht: (2025)
Adaptive Test-Time Compute Allocation for Reasoning LLMs via Constrained Policy Optimization
von: Zhai, Zhiyuan, et al.
Veröffentlicht: (2026)
von: Zhai, Zhiyuan, et al.
Veröffentlicht: (2026)
Predictive Auditing of Hidden Tokens in LLM APIs via Reasoning Length Estimation
von: Wang, Ziyao, et al.
Veröffentlicht: (2025)
von: Wang, Ziyao, et al.
Veröffentlicht: (2025)
A Paired Testing Protocol for Batch-Conditioned Refusal Robustness in LLM Serving
von: Kadadekar, Sahil
Veröffentlicht: (2026)
von: Kadadekar, Sahil
Veröffentlicht: (2026)
$\nabla$-Reasoner: LLM Reasoning via Test-Time Gradient Descent in Latent Space
von: Wang, Peihao, et al.
Veröffentlicht: (2026)
von: Wang, Peihao, et al.
Veröffentlicht: (2026)
Vital Trace: Protocol-Constrained Patient-State Reasoning for Longitudinal Clinical Trajectories
von: Qu, Zhan, et al.
Veröffentlicht: (2026)
von: Qu, Zhan, et al.
Veröffentlicht: (2026)
PromptAudit: Auditing Prompt Sensitivity in LLM-Based Vulnerability Detection
von: Camarato, Steffen J., et al.
Veröffentlicht: (2026)
von: Camarato, Steffen J., et al.
Veröffentlicht: (2026)
An Auditing Test To Detect Behavioral Shift in Language Models
von: Richter, Leo, et al.
Veröffentlicht: (2024)
von: Richter, Leo, et al.
Veröffentlicht: (2024)
BAR Conjecture: the Feasibility of Inference Budget-Constrained LLM Services with Authenticity and Reasoning
von: Zhou, Jinan, et al.
Veröffentlicht: (2025)
von: Zhou, Jinan, et al.
Veröffentlicht: (2025)
LSEC: Large-scale spectral ensemble clustering
von: Li, Hongmin, et al.
Veröffentlicht: (2021)
von: Li, Hongmin, et al.
Veröffentlicht: (2021)
Stress-Testing Alignment Audits With Prompt-Level Strategic Deception
von: Daniels, Oliver, et al.
Veröffentlicht: (2026)
von: Daniels, Oliver, et al.
Veröffentlicht: (2026)
Who Gets Which Message? Auditing Demographic Bias in LLM-Generated Targeted Text
von: Islam, Tunazzina
Veröffentlicht: (2026)
von: Islam, Tunazzina
Veröffentlicht: (2026)
Beyond Test-Time Memory: State-Space Optimal Control for LLM Reasoning
von: Wang, Peihao, et al.
Veröffentlicht: (2026)
von: Wang, Peihao, et al.
Veröffentlicht: (2026)
FastTTS: Accelerating Test-Time Scaling for Edge LLM Reasoning
von: Chen, Hao Mark, et al.
Veröffentlicht: (2025)
von: Chen, Hao Mark, et al.
Veröffentlicht: (2025)
Auditing Reasoning-Trace Memorization Claims after Unlearning with Head-Conditioned Canaries
von: Li, Yanhang, et al.
Veröffentlicht: (2026)
von: Li, Yanhang, et al.
Veröffentlicht: (2026)
DASH: Deterministic Attention Scheduling for High-throughput Reproducible LLM Training
von: Qiang, Xinwei, et al.
Veröffentlicht: (2026)
von: Qiang, Xinwei, et al.
Veröffentlicht: (2026)
Bypassing the Rationale: Causal Auditing of Implicit Reasoning in Language Models
von: Sathyanarayanan, Anish, et al.
Veröffentlicht: (2026)
von: Sathyanarayanan, Anish, et al.
Veröffentlicht: (2026)
Code Comprehension then Auditing for Unsupervised LLM Evaluation
von: Patel, Bhrij, et al.
Veröffentlicht: (2024)
von: Patel, Bhrij, et al.
Veröffentlicht: (2024)
MCP Safety Audit: LLMs with the Model Context Protocol Allow Major Security Exploits
von: Radosevich, Brandon, et al.
Veröffentlicht: (2025)
von: Radosevich, Brandon, et al.
Veröffentlicht: (2025)
Reliability Auditing for Downstream LLM tasks in Psychiatry: LLM-Generated Hospitalization Risk Scores
von: Panda, Shevya, et al.
Veröffentlicht: (2026)
von: Panda, Shevya, et al.
Veröffentlicht: (2026)
TRACES: Proactive Safety Auditing for Multi-Turn LLM Agents via Trajectory-State Modeling
von: Li, Jiaqian, et al.
Veröffentlicht: (2026)
von: Li, Jiaqian, et al.
Veröffentlicht: (2026)
CreditAudit: 2$^\text{nd}$ Dimension for LLM Evaluation and Selection
von: Song, Yiliang, et al.
Veröffentlicht: (2026)
von: Song, Yiliang, et al.
Veröffentlicht: (2026)
Do Multilingual VLMs Reason Equally? A Cross-Lingual Visual Reasoning Audit for Indian Languages
von: R, Swastik
Veröffentlicht: (2026)
von: R, Swastik
Veröffentlicht: (2026)
Guided Reasoning in LLM-Driven Penetration Testing Using Structured Attack Trees
von: Nakano, Katsuaki, et al.
Veröffentlicht: (2025)
von: Nakano, Katsuaki, et al.
Veröffentlicht: (2025)
Auditing Information Disclosure During LLM-Scale Gradient Descent Using Gradient Uniqueness
von: Abdelghafar, Sleem, et al.
Veröffentlicht: (2025)
von: Abdelghafar, Sleem, et al.
Veröffentlicht: (2025)
COMPASS: Benchmarking Constrained Optimization in LLM Agents
von: Qin, Tian, et al.
Veröffentlicht: (2025)
von: Qin, Tian, et al.
Veröffentlicht: (2025)
Efficient LLM Jailbreak via Adaptive Dense-to-sparse Constrained Optimization
von: Hu, Kai, et al.
Veröffentlicht: (2024)
von: Hu, Kai, et al.
Veröffentlicht: (2024)
Representation Without Reward: A JEPA Audit for LLM Fine-Tuning
von: Sengupta, Biswa
Veröffentlicht: (2026)
von: Sengupta, Biswa
Veröffentlicht: (2026)
Can LLM Safety Be Ensured by Constraining Parameter Regions?
von: Li, Zongmin, et al.
Veröffentlicht: (2026)
von: Li, Zongmin, et al.
Veröffentlicht: (2026)
Online Reasoning Calibration: Test-Time Training Enables Generalizable Conformal LLM Reasoning
von: Zhou, Cai, et al.
Veröffentlicht: (2026)
von: Zhou, Cai, et al.
Veröffentlicht: (2026)
DARTS: Targeting Prognostic Covariates in Budget-Constrained Sequential Experiments
von: Husar, Kateryna, et al.
Veröffentlicht: (2026)
von: Husar, Kateryna, et al.
Veröffentlicht: (2026)
Constrained Meta Reinforcement Learning with Provable Test-Time Safety
von: Ni, Tingting, et al.
Veröffentlicht: (2026)
von: Ni, Tingting, et al.
Veröffentlicht: (2026)
Auditing for Human Expertise
von: Alur, Rohan, et al.
Veröffentlicht: (2023)
von: Alur, Rohan, et al.
Veröffentlicht: (2023)
From Static Benchmarks to Dynamic Protocol: Agent-Centric Text Anomaly Detection for Evaluating LLM Reasoning
von: Yoa, Seungdong, et al.
Veröffentlicht: (2026)
von: Yoa, Seungdong, et al.
Veröffentlicht: (2026)
Projected Coupled Diffusion for Test-Time Constrained Joint Generation
von: Luan, Hao, et al.
Veröffentlicht: (2025)
von: Luan, Hao, et al.
Veröffentlicht: (2025)
Constrained Best Arm Identification with Tests for Feasibility
von: Cai, Ting, et al.
Veröffentlicht: (2025)
von: Cai, Ting, et al.
Veröffentlicht: (2025)
Ähnliche Einträge
-
FastUMAP: Scalable Dimensionality Reduction via Bipartite Landmark Sampling
von: Li, Hongmin
Veröffentlicht: (2026) -
A Controlled Counterexample to Strong Proxy-Based Explanations of OOD Performance: in a Fixed Pretraining-and-Probing Setup
von: Li, Hongmin
Veröffentlicht: (2026) -
Separating Shortcut Transition from Cross-Family OOD Failure in a Minimal Model
von: Li, Hongmin
Veröffentlicht: (2026) -
ISAAC: Auditing Causal Reasoning in Deep Models for Drug-Target Interaction
von: Tarantino, Barbara, et al.
Veröffentlicht: (2026) -
Automated Network Protocol Testing with LLM Agents
von: Wei, Yunze, et al.
Veröffentlicht: (2025)