Gespeichert in:
| 1. Verfasser: | Ding, Kaihua |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2025
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2509.22751 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
Learning Quantifiable Visual Explanations Without Ground-Truth
von: Singh, Amritpal, et al.
Veröffentlicht: (2026)
von: Singh, Amritpal, et al.
Veröffentlicht: (2026)
Evaluating Model Explanations without Ground Truth
von: Rawal, Kaivalya, et al.
Veröffentlicht: (2025)
von: Rawal, Kaivalya, et al.
Veröffentlicht: (2025)
Fairness Evaluation for Uplift Modeling in the Absence of Ground Truth
von: Kadioglu, Serdar, et al.
Veröffentlicht: (2024)
von: Kadioglu, Serdar, et al.
Veröffentlicht: (2024)
Confidence Calibration under Ambiguous Ground Truth
von: Tao, Linwei, et al.
Veröffentlicht: (2026)
von: Tao, Linwei, et al.
Veröffentlicht: (2026)
Iterative Causal Segmentation: Filling the Gap between Market Segmentation and Marketing Strategy
von: Ding, Kaihua, et al.
Veröffentlicht: (2024)
von: Ding, Kaihua, et al.
Veröffentlicht: (2024)
From Ground Truth to Measurement: A Statistical Framework for Human Labeling
von: Chew, Robert, et al.
Veröffentlicht: (2026)
von: Chew, Robert, et al.
Veröffentlicht: (2026)
xaitimesynth: A Python Package for Evaluating Attribution Methods for Time Series with Synthetic Ground Truth
von: Baer, Gregor
Veröffentlicht: (2026)
von: Baer, Gregor
Veröffentlicht: (2026)
Synthetic Data and the Shifting Ground of Truth
von: Offenhuber, Dietmar
Veröffentlicht: (2025)
von: Offenhuber, Dietmar
Veröffentlicht: (2025)
Position: AI Evaluations Should be Grounded on a Theory of Capability
von: Jo, Nathanael, et al.
Veröffentlicht: (2025)
von: Jo, Nathanael, et al.
Veröffentlicht: (2025)
Variance-Dependent Regret Lower Bounds for Contextual Bandits
von: He, Jiafan, et al.
Veröffentlicht: (2025)
von: He, Jiafan, et al.
Veröffentlicht: (2025)
Designing AI-Resilient Assessments Using Interconnected Problems: A Theoretically Grounded and Empirically Validated Framework
von: Ding, Kaihua
Veröffentlicht: (2025)
von: Ding, Kaihua
Veröffentlicht: (2025)
Quantifying Variance in Evaluation Benchmarks
von: Madaan, Lovish, et al.
Veröffentlicht: (2024)
von: Madaan, Lovish, et al.
Veröffentlicht: (2024)
Variance-Dependent Regret Bounds for Non-stationary Linear Bandits
von: Wang, Zhiyong, et al.
Veröffentlicht: (2024)
von: Wang, Zhiyong, et al.
Veröffentlicht: (2024)
Feature-Centric Unsupervised Node Representation Learning Without Homophily Assumption
von: Kim, Sunwoo, et al.
Veröffentlicht: (2025)
von: Kim, Sunwoo, et al.
Veröffentlicht: (2025)
The Scaling Law of Evaluation Failure: Why Simple Averaging Collapses Under Data Sparsity and Item Difficulty Gaps, and How Item Response Theory Recovers Ground Truth Across Domains
von: Kang, Jung Min
Veröffentlicht: (2026)
von: Kang, Jung Min
Veröffentlicht: (2026)
Ranking Large Language Models without Ground Truth
von: Dhurandhar, Amit, et al.
Veröffentlicht: (2024)
von: Dhurandhar, Amit, et al.
Veröffentlicht: (2024)
Ground-Truth Subgraphs for Better Training and Evaluation of Knowledge Graph Augmented LLMs
von: Cattaneo, Alberto, et al.
Veröffentlicht: (2025)
von: Cattaneo, Alberto, et al.
Veröffentlicht: (2025)
Grounded Object Centric Learning
von: Kori, Avinash, et al.
Veröffentlicht: (2023)
von: Kori, Avinash, et al.
Veröffentlicht: (2023)
A Confidence-Variance Theory for Pseudo-Label Selection in Semi-Supervised Learning
von: Liu, Jinshi, et al.
Veröffentlicht: (2026)
von: Liu, Jinshi, et al.
Veröffentlicht: (2026)
Conflict-Aware Pseudo Labeling via Optimal Transport for Entity Alignment
von: Ding, Qijie, et al.
Veröffentlicht: (2022)
von: Ding, Qijie, et al.
Veröffentlicht: (2022)
GT-Space: Enhancing Heterogeneous Collaborative Perception with Ground Truth Feature Space
von: Wang, Wentao, et al.
Veröffentlicht: (2026)
von: Wang, Wentao, et al.
Veröffentlicht: (2026)
A Framework for Fair Evaluation of Variance-Aware Bandit Algorithms
von: Wolf, Elise
Veröffentlicht: (2025)
von: Wolf, Elise
Veröffentlicht: (2025)
Minimax Optimal Variance-Aware Regret Bounds for Multinomial Logistic MDPs
von: Boudart, Pierre, et al.
Veröffentlicht: (2026)
von: Boudart, Pierre, et al.
Veröffentlicht: (2026)
Decision-Centric Design for LLM Systems
von: Sun, Wei
Veröffentlicht: (2026)
von: Sun, Wei
Veröffentlicht: (2026)
DataMaster: Data-Centric Autonomous AI Research
von: Du, Yaxin, et al.
Veröffentlicht: (2026)
von: Du, Yaxin, et al.
Veröffentlicht: (2026)
Towards Unified Attribution in Explainable AI, Data-Centric AI, and Mechanistic Interpretability
von: Zhang, Shichang, et al.
Veröffentlicht: (2025)
von: Zhang, Shichang, et al.
Veröffentlicht: (2025)
Low Variance Off-policy Evaluation with State-based Importance Sampling
von: Bossens, David M., et al.
Veröffentlicht: (2022)
von: Bossens, David M., et al.
Veröffentlicht: (2022)
Mastering Chinese Chess AI (Xiangqi) Without Search
von: Chen, Yu, et al.
Veröffentlicht: (2024)
von: Chen, Yu, et al.
Veröffentlicht: (2024)
Can Generative AI Support Patients' & Caregivers' Informational Needs? Towards Task-Centric Evaluation Of AI Systems
von: Rajagopal, Shreya, et al.
Veröffentlicht: (2024)
von: Rajagopal, Shreya, et al.
Veröffentlicht: (2024)
Emergent Visual Grounding in Large Multimodal Models Without Grounding Supervision
von: Cao, Shengcao, et al.
Veröffentlicht: (2024)
von: Cao, Shengcao, et al.
Veröffentlicht: (2024)
DSAI: Unbiased and Interpretable Latent Feature Extraction for Data-Centric AI
von: Cho, Hyowon, et al.
Veröffentlicht: (2024)
von: Cho, Hyowon, et al.
Veröffentlicht: (2024)
Reducing Credit Assignment Variance via Counterfactual Reasoning Paths
von: Ding, Fei, et al.
Veröffentlicht: (2026)
von: Ding, Fei, et al.
Veröffentlicht: (2026)
A Survey on Data-Centric AI: Tabular Learning from Reinforcement Learning and Generative AI Perspective
von: Ying, Wangyang, et al.
Veröffentlicht: (2025)
von: Ying, Wangyang, et al.
Veröffentlicht: (2025)
TruthRL: Incentivizing Truthful LLMs via Reinforcement Learning
von: Wei, Zhepei, et al.
Veröffentlicht: (2025)
von: Wei, Zhepei, et al.
Veröffentlicht: (2025)
Toward an Evaluation Science for Generative AI Systems
von: Weidinger, Laura, et al.
Veröffentlicht: (2025)
von: Weidinger, Laura, et al.
Veröffentlicht: (2025)
BEVDiffuser: Plug-and-Play Diffusion Model for BEV Denoising with Ground-Truth Guidance
von: Ye, Xin, et al.
Veröffentlicht: (2025)
von: Ye, Xin, et al.
Veröffentlicht: (2025)
Data-Centric Foundation Models in Computational Healthcare: A Survey
von: Zhang, Yunkun, et al.
Veröffentlicht: (2024)
von: Zhang, Yunkun, et al.
Veröffentlicht: (2024)
Measuring What AI Systems Might Do: Towards A Measurement Science in AI
von: Voudouris, Konstantinos, et al.
Veröffentlicht: (2026)
von: Voudouris, Konstantinos, et al.
Veröffentlicht: (2026)
TruthFlow: Truthful LLM Generation via Representation Flow Correction
von: Wang, Hanyu, et al.
Veröffentlicht: (2025)
von: Wang, Hanyu, et al.
Veröffentlicht: (2025)
Incentivizing Truthfulness and Collaborative Fairness in Bayesian Learning
von: Sim, Rachael Hwee Ling, et al.
Veröffentlicht: (2026)
von: Sim, Rachael Hwee Ling, et al.
Veröffentlicht: (2026)
Ähnliche Einträge
-
Learning Quantifiable Visual Explanations Without Ground-Truth
von: Singh, Amritpal, et al.
Veröffentlicht: (2026) -
Evaluating Model Explanations without Ground Truth
von: Rawal, Kaivalya, et al.
Veröffentlicht: (2025) -
Fairness Evaluation for Uplift Modeling in the Absence of Ground Truth
von: Kadioglu, Serdar, et al.
Veröffentlicht: (2024) -
Confidence Calibration under Ambiguous Ground Truth
von: Tao, Linwei, et al.
Veröffentlicht: (2026) -
Iterative Causal Segmentation: Filling the Gap between Market Segmentation and Marketing Strategy
von: Ding, Kaihua, et al.
Veröffentlicht: (2024)