Enregistré dans:
| Auteurs principaux: | Kim, Kyung Rok, Wang, Yansong, Li, Xiaocheng, Chen, Guanting |
|---|---|
| Format: | Preprint |
| Publié: |
2025
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2506.11271 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
Understanding the Impact of Sampling Quality in Direct Preference Optimization
par: Kim, Kyung Rok, et autres
Publié: (2025)
par: Kim, Kyung Rok, et autres
Publié: (2025)
Risk Profiling and Modulation for LLMs
par: Wang, Yikai, et autres
Publié: (2025)
par: Wang, Yikai, et autres
Publié: (2025)
Calibrating conditional risk
par: Vasilyev, Andrey, et autres
Publié: (2026)
par: Vasilyev, Andrey, et autres
Publié: (2026)
Learning to Make Adherence-Aware Advice
par: Chen, Guanting, et autres
Publié: (2023)
par: Chen, Guanting, et autres
Publié: (2023)
OMGPT: A Sequence Modeling Framework for Data-driven Operational Decision Making
par: Wang, Hanzhao, et autres
Publié: (2025)
par: Wang, Hanzhao, et autres
Publié: (2025)
Towards Better Understanding of In-Context Learning Ability from In-Context Uncertainty Quantification
par: Liu, Shang, et autres
Publié: (2024)
par: Liu, Shang, et autres
Publié: (2024)
Reward Modeling with Ordinal Feedback: Wisdom of the Crowd
par: Liu, Shang, et autres
Publié: (2024)
par: Liu, Shang, et autres
Publié: (2024)
Uncertainty Estimation and Quantification for LLMs: A Simple Supervised Approach
par: Liu, Linyu, et autres
Publié: (2024)
par: Liu, Linyu, et autres
Publié: (2024)
Understanding the Training and Generalization of Pretrained Transformer for Sequential Decision Making
par: Wang, Hanzhao, et autres
Publié: (2024)
par: Wang, Hanzhao, et autres
Publié: (2024)
In-Context Curiosity: Distilling Exploration for Decision-Pretrained Transformers on Bandit Tasks
par: Yang, Huitao, et autres
Publié: (2025)
par: Yang, Huitao, et autres
Publié: (2025)
Understanding Uncertainty Sampling via Equivalent Loss
par: Liu, Shang, et autres
Publié: (2023)
par: Liu, Shang, et autres
Publié: (2023)
DeepTaster: Adversarial Perturbation-Based Fingerprinting to Identify Proprietary Dataset Use in Deep Neural Networks
par: Park, Seonhye, et autres
Publié: (2022)
par: Park, Seonhye, et autres
Publié: (2022)
Exploration-free Algorithms for Multi-group Mean Estimation
par: Wei, Ziyi, et autres
Publié: (2025)
par: Wei, Ziyi, et autres
Publié: (2025)
Next-Generation Reservoir Computing for Dynamical Inference
par: Cestnik, Rok, et autres
Publié: (2025)
par: Cestnik, Rok, et autres
Publié: (2025)
Semi-Supervised Graph Representation Learning with Human-centric Explanation for Predicting Fatty Liver Disease
par: Kim, So Yeon, et autres
Publié: (2024)
par: Kim, So Yeon, et autres
Publié: (2024)
When No-Rejection Learning is Consistent for Regression with Rejection
par: Li, Xiaocheng, et autres
Publié: (2023)
par: Li, Xiaocheng, et autres
Publié: (2023)
Gradient-Based Join Ordering
par: Schwabe, Tim, et autres
Publié: (2025)
par: Schwabe, Tim, et autres
Publié: (2025)
CF-KAN: Kolmogorov-Arnold Network-based Collaborative Filtering to Mitigate Catastrophic Forgetting in Recommender Systems
par: Park, Jin-Duk, et autres
Publié: (2024)
par: Park, Jin-Duk, et autres
Publié: (2024)
What Matters in Data for DPO?
par: Pan, Yu, et autres
Publié: (2025)
par: Pan, Yu, et autres
Publié: (2025)
Sketched Sum-Product Networks for Joins
par: Tsan, Brian, et autres
Publié: (2025)
par: Tsan, Brian, et autres
Publié: (2025)
Implementing Semantic Join Operators Efficiently
par: Trummer, Immanuel
Publié: (2025)
par: Trummer, Immanuel
Publié: (2025)
Improving the stability of the covariance-controlled adaptive Langevin thermostat for large-scale Bayesian sampling
par: Wei, Jiani, et autres
Publié: (2025)
par: Wei, Jiani, et autres
Publié: (2025)
Analyzing Fairness of Neural Network Prediction via Counterfactual Dataset Generation
par: Kim, Brian Hyeongseok, et autres
Publié: (2026)
par: Kim, Brian Hyeongseok, et autres
Publié: (2026)
Semantic-Aware Gaussian Process Calibration with Structured Layerwise Kernels for Deep Neural Networks
par: Lee, Kyung-hwan, et autres
Publié: (2025)
par: Lee, Kyung-hwan, et autres
Publié: (2025)
A Scalable and Transferable Time Series Prediction Framework for Demand Forecasting
par: Park, Young-Jin, et autres
Publié: (2024)
par: Park, Young-Jin, et autres
Publié: (2024)
Distillation of Discrete Diffusion by Exact Conditional Distribution Matching
par: Gao, Yansong, et autres
Publié: (2025)
par: Gao, Yansong, et autres
Publié: (2025)
An Information-Geometric Distance on the Space of Tasks
par: Gao, Yansong, et autres
Publié: (2020)
par: Gao, Yansong, et autres
Publié: (2020)
Optimizing Context-Enhanced Relational Joins
par: Sanca, Viktor, et autres
Publié: (2023)
par: Sanca, Viktor, et autres
Publié: (2023)
Attn-JGNN: Attention Enhanced Join-Graph Neural Networks
par: Zhang, Jixin
Publié: (2025)
par: Zhang, Jixin
Publié: (2025)
Gaussian-Based and Outside-the-Box Runtime Monitoring Join Forces
par: Hashemi, Vahid, et autres
Publié: (2024)
par: Hashemi, Vahid, et autres
Publié: (2024)
Spatio-temporal Prediction of Fine-Grained Origin-Destination Matrices with Applications in Ridesharing
par: Yang, Run, et autres
Publié: (2025)
par: Yang, Run, et autres
Publié: (2025)
Graph Structure Based Data Augmentation Method
par: Kim, Kyung Geun, et autres
Publié: (2022)
par: Kim, Kyung Geun, et autres
Publié: (2022)
Intellectual Property Protection for Deep Learning Model and Dataset Intelligence
par: Jiang, Yongqi, et autres
Publié: (2024)
par: Jiang, Yongqi, et autres
Publié: (2024)
A Collaborative Ensemble Framework for CTR Prediction
par: Liu, Xiaolong, et autres
Publié: (2024)
par: Liu, Xiaolong, et autres
Publié: (2024)
Collaborative Learning-Enhanced Lightweight Models for Predicting Arterial Blood Pressure Waveform in a Large-scale Perioperative Dataset
par: Li, Wentao, et autres
Publié: (2025)
par: Li, Wentao, et autres
Publié: (2025)
Frictional Q-Learning
par: Kim, Hyunwoo, et autres
Publié: (2025)
par: Kim, Hyunwoo, et autres
Publié: (2025)
How Humans Help LLMs: Assessing and Incentivizing Human Preference Annotators
par: Liu, Shang, et autres
Publié: (2025)
par: Liu, Shang, et autres
Publié: (2025)
DotaMath: Decomposition of Thought with Code Assistance and Self-correction for Mathematical Reasoning
par: Li, Chengpeng, et autres
Publié: (2024)
par: Li, Chengpeng, et autres
Publié: (2024)
Adaptive Residual Transformation for Enhanced Feature-Based OOD Detection in SAR Imagery
par: Lee, Kyung-hwan, et autres
Publié: (2024)
par: Lee, Kyung-hwan, et autres
Publié: (2024)
Pareto Inverse Reinforcement Learning for Diverse Expert Policy Generation
par: Kim, Woo Kyung, et autres
Publié: (2024)
par: Kim, Woo Kyung, et autres
Publié: (2024)
Documents similaires
-
Understanding the Impact of Sampling Quality in Direct Preference Optimization
par: Kim, Kyung Rok, et autres
Publié: (2025) -
Risk Profiling and Modulation for LLMs
par: Wang, Yikai, et autres
Publié: (2025) -
Calibrating conditional risk
par: Vasilyev, Andrey, et autres
Publié: (2026) -
Learning to Make Adherence-Aware Advice
par: Chen, Guanting, et autres
Publié: (2023) -
OMGPT: A Sequence Modeling Framework for Data-driven Operational Decision Making
par: Wang, Hanzhao, et autres
Publié: (2025)