Gespeichert in:
| Hauptverfasser: | Koç, Okan, Soen, Alexander, Chiang, Chao-Kai, Sugiyama, Masashi |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2025
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2503.08155 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
LLM Routing with Dueling Feedback
von: Chiang, Chao-Kai, et al.
Veröffentlicht: (2025)
von: Chiang, Chao-Kai, et al.
Veröffentlicht: (2025)
A Connection Between Learning to Reject and Bhattacharyya Divergences
von: Soen, Alexander
Veröffentlicht: (2025)
von: Soen, Alexander
Veröffentlicht: (2025)
VEC-SBM: Optimal Community Detection with Vectorial Edges Covariates
von: Braun, Guillaume, et al.
Veröffentlicht: (2024)
von: Braun, Guillaume, et al.
Veröffentlicht: (2024)
Trade-Offs of Diagonal Fisher Information Matrix Estimators
von: Soen, Alexander, et al.
Veröffentlicht: (2024)
von: Soen, Alexander, et al.
Veröffentlicht: (2024)
Offline Reinforcement Learning with Domain-Unlabeled Data
von: Nishimori, Soichiro, et al.
Veröffentlicht: (2024)
von: Nishimori, Soichiro, et al.
Veröffentlicht: (2024)
A Fast Algorithm for the Real-Valued Combinatorial Pure Exploration of Multi-Armed Bandit
von: Nakamura, Shintaro, et al.
Veröffentlicht: (2023)
von: Nakamura, Shintaro, et al.
Veröffentlicht: (2023)
pyBregMan: A Python library for Bregman Manifolds
von: Nielsen, Frank, et al.
Veröffentlicht: (2024)
von: Nielsen, Frank, et al.
Veröffentlicht: (2024)
Generalized Linear Bandits: Almost Optimal Regret with One-Pass Update
von: Zhang, Yu-Jie, et al.
Veröffentlicht: (2025)
von: Zhang, Yu-Jie, et al.
Veröffentlicht: (2025)
Embracing Biased Transition Matrices for Complementary-Label Learning with Many Classes
von: Mai, Tan-Ha, et al.
Veröffentlicht: (2026)
von: Mai, Tan-Ha, et al.
Veröffentlicht: (2026)
Optimal Transport-Based Domain Adaptation for Rotated Linear Regression
von: Britos, Brian, et al.
Veröffentlicht: (2025)
von: Britos, Brian, et al.
Veröffentlicht: (2025)
Multi-Player Approaches for Dueling Bandits
von: Raveh, Or, et al.
Veröffentlicht: (2024)
von: Raveh, Or, et al.
Veröffentlicht: (2024)
Riemannian Langevin Dynamics: Strong Convergence of Geometric Euler-Maruyama Scheme
von: Zhan, Zhiyuan, et al.
Veröffentlicht: (2026)
von: Zhan, Zhiyuan, et al.
Veröffentlicht: (2026)
Enriching Disentanglement: From Logical Definitions to Quantitative Metrics
von: Zhang, Yivan, et al.
Veröffentlicht: (2023)
von: Zhang, Yivan, et al.
Veröffentlicht: (2023)
Collaborative Multi-source Domain Adaptation Through Optimal Transport
von: Ghannou, Omar, et al.
Veröffentlicht: (2024)
von: Ghannou, Omar, et al.
Veröffentlicht: (2024)
Optimal Transport for Domain Adaptation through Gaussian Mixture Models
von: Montesuma, Eduardo Fernandes, et al.
Veröffentlicht: (2024)
von: Montesuma, Eduardo Fernandes, et al.
Veröffentlicht: (2024)
Density-Ratio Losses for Post-Hoc Learning to Defer
von: Soen, Alexander, et al.
Veröffentlicht: (2026)
von: Soen, Alexander, et al.
Veröffentlicht: (2026)
Rejection via Learning Density Ratios
von: Soen, Alexander, et al.
Veröffentlicht: (2024)
von: Soen, Alexander, et al.
Veröffentlicht: (2024)
Deep Joint Distribution Optimal Transport for Universal Domain Adaptation on Time Series
von: Mussard, Romain, et al.
Veröffentlicht: (2025)
von: Mussard, Romain, et al.
Veröffentlicht: (2025)
Theoretical Performance Guarantees for Partial Domain Adaptation via Partial Optimal Transport
von: Naram, Jayadev, et al.
Veröffentlicht: (2025)
von: Naram, Jayadev, et al.
Veröffentlicht: (2025)
Statistical Inference for Feature Selection after Optimal Transport-based Domain Adaptation
von: Loi, Nguyen Thang, et al.
Veröffentlicht: (2024)
von: Loi, Nguyen Thang, et al.
Veröffentlicht: (2024)
VI-CuRL: Stabilizing Verifier-Independent RL Reasoning via Confidence-Guided Variance Reduction
von: Cai, Xin-Qiang, et al.
Veröffentlicht: (2026)
von: Cai, Xin-Qiang, et al.
Veröffentlicht: (2026)
Practical estimation of the optimal classification error with soft labels and calibration
von: Ushio, Ryota, et al.
Veröffentlicht: (2025)
von: Ushio, Ryota, et al.
Veröffentlicht: (2025)
The Survival Bandit Problem
von: Riou, Charles, et al.
Veröffentlicht: (2022)
von: Riou, Charles, et al.
Veröffentlicht: (2022)
Thompson Exploration with Best Challenger Rule in Best Arm Identification
von: Lee, Jongyeong, et al.
Veröffentlicht: (2023)
von: Lee, Jongyeong, et al.
Veröffentlicht: (2023)
On the Overlooked Pitfalls of Weight Decay and How to Mitigate Them: A Gradient-Norm Perspective
von: Xie, Zeke, et al.
Veröffentlicht: (2020)
von: Xie, Zeke, et al.
Veröffentlicht: (2020)
A Category-theoretical Meta-analysis of Definitions of Disentanglement
von: Zhang, Yivan, et al.
Veröffentlicht: (2023)
von: Zhang, Yivan, et al.
Veröffentlicht: (2023)
Deep Optimal Transport for Domain Adaptation on SPD Manifolds
von: Ju, Ce, et al.
Veröffentlicht: (2022)
von: Ju, Ce, et al.
Veröffentlicht: (2022)
Linking Across Data Granularity: Fitting Multivariate Hawkes Processes to Partially Interval-Censored Data
von: Calderon, Pio, et al.
Veröffentlicht: (2021)
von: Calderon, Pio, et al.
Veröffentlicht: (2021)
Reinforcement Learning with Options and State Representation
von: Ghriss, Ayoub, et al.
Veröffentlicht: (2024)
von: Ghriss, Ayoub, et al.
Veröffentlicht: (2024)
On the Hardness of Unsupervised Domain Adaptation: Optimal Learners and Information-Theoretic Perspective
von: Dong, Zhiyi, et al.
Veröffentlicht: (2025)
von: Dong, Zhiyi, et al.
Veröffentlicht: (2025)
Bi-level Unbalanced Optimal Transport for Partial Domain Adaptation
von: Chen, Zi-Ying, et al.
Veröffentlicht: (2025)
von: Chen, Zi-Ying, et al.
Veröffentlicht: (2025)
Offline Reinforcement Learning from Datasets with Structured Non-Stationarity
von: Ackermann, Johannes, et al.
Veröffentlicht: (2024)
von: Ackermann, Johannes, et al.
Veröffentlicht: (2024)
Non-stationary Online Learning for Curved Losses: Improved Dynamic Regret via Mixability
von: Zhang, Yu-Jie, et al.
Veröffentlicht: (2025)
von: Zhang, Yu-Jie, et al.
Veröffentlicht: (2025)
Lighter, Better, Faster Multi-Source Domain Adaptation with Gaussian Mixture Models and Optimal Transport
von: Montesuma, Eduardo Fernandes, et al.
Veröffentlicht: (2024)
von: Montesuma, Eduardo Fernandes, et al.
Veröffentlicht: (2024)
Parallel Simulation for Log-concave Sampling and Score-based Diffusion Models
von: Zhou, Huanjian, et al.
Veröffentlicht: (2024)
von: Zhou, Huanjian, et al.
Veröffentlicht: (2024)
Weak-to-Strong Diffusion with Reflection
von: Bai, Lichen, et al.
Veröffentlicht: (2025)
von: Bai, Lichen, et al.
Veröffentlicht: (2025)
Off-Policy Corrected Reward Modeling for Reinforcement Learning from Human Feedback
von: Ackermann, Johannes, et al.
Veröffentlicht: (2025)
von: Ackermann, Johannes, et al.
Veröffentlicht: (2025)
Towards Scalable Oversight via Partitioned Human Supervision
von: Yin, Ren, et al.
Veröffentlicht: (2025)
von: Yin, Ren, et al.
Veröffentlicht: (2025)
Rethinking the Flow-Based Gradual Domain Adaption: A Semi-Dual Optimal Transport Perspective
von: Chen, Zhichao, et al.
Veröffentlicht: (2026)
von: Chen, Zhichao, et al.
Veröffentlicht: (2026)
HEEGNet: Hyperbolic Embeddings for EEG
von: Li, Shanglin, et al.
Veröffentlicht: (2026)
von: Li, Shanglin, et al.
Veröffentlicht: (2026)
Ähnliche Einträge
-
LLM Routing with Dueling Feedback
von: Chiang, Chao-Kai, et al.
Veröffentlicht: (2025) -
A Connection Between Learning to Reject and Bhattacharyya Divergences
von: Soen, Alexander
Veröffentlicht: (2025) -
VEC-SBM: Optimal Community Detection with Vectorial Edges Covariates
von: Braun, Guillaume, et al.
Veröffentlicht: (2024) -
Trade-Offs of Diagonal Fisher Information Matrix Estimators
von: Soen, Alexander, et al.
Veröffentlicht: (2024) -
Offline Reinforcement Learning with Domain-Unlabeled Data
von: Nishimori, Soichiro, et al.
Veröffentlicht: (2024)