Enregistré dans:
| Auteur principal: | Matsuno, Ryuta |
|---|---|
| Format: | Preprint |
| Publié: |
2025
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2508.10257 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
Agile Online Model Selection: Resolving Adaptation Lag via Safeguarded Large Learning Rates
par: Takemura, Kei, et autres
Publié: (2026)
par: Takemura, Kei, et autres
Publié: (2026)
Backward Compatibility in Attributive Explanation and Enhanced Model Training Method
par: Matsuno, Ryuta
Publié: (2024)
par: Matsuno, Ryuta
Publié: (2024)
Improved Impossible Tuning and Lipschitz-Adaptive Universal Online Learning with Gradient Variations
par: Takemura, Kei, et autres
Publié: (2025)
par: Takemura, Kei, et autres
Publié: (2025)
Few-shot Adaptation to Distribution Shifts By Mixing Source and Target Embeddings
par: Xue, Yihao, et autres
Publié: (2023)
par: Xue, Yihao, et autres
Publié: (2023)
Sample-Mean Anchored Thompson Sampling for Offline-to-Online Learning with Distribution Shift
par: Li, Bochao, et autres
Publié: (2026)
par: Li, Bochao, et autres
Publié: (2026)
Provably Efficient Offline-to-Online Value Adaptation with General Function Approximation
par: Li, Shangzhe, et autres
Publié: (2026)
par: Li, Shangzhe, et autres
Publié: (2026)
Online Feature Updates Improve Online (Generalized) Label Shift Adaptation
par: Wu, Ruihan, et autres
Publié: (2024)
par: Wu, Ruihan, et autres
Publié: (2024)
ROAD: Adaptive Data Mixing for Offline-to-Online Reinforcement Learning via Bi-Level Optimization
par: Yang, Letian, et autres
Publié: (2026)
par: Yang, Letian, et autres
Publié: (2026)
Robust Multi-Source Domain Adaptation under Label Shift
par: Xu, Congbin, et autres
Publié: (2025)
par: Xu, Congbin, et autres
Publié: (2025)
Semantic Caching for Low-Cost LLM Serving: From Offline Learning to Online Adaptation
par: Liu, Xutong, et autres
Publié: (2025)
par: Liu, Xutong, et autres
Publié: (2025)
Mitigating Distribution Shift in Model-based Offline RL via Shifts-aware Reward Learning
par: Luo, Wang, et autres
Publié: (2024)
par: Luo, Wang, et autres
Publié: (2024)
Online Conformal Inference with Retrospective Adjustment for Faster Adaptation to Distribution Shift
par: Jun, Jungbin, et autres
Publié: (2025)
par: Jun, Jungbin, et autres
Publié: (2025)
Debiased Offline Representation Learning for Fast Online Adaptation in Non-stationary Dynamics
par: Zhang, Xinyu, et autres
Publié: (2024)
par: Zhang, Xinyu, et autres
Publié: (2024)
A Non-Monolithic Policy Approach of Offline-to-Online Reinforcement Learning
par: Kim, JaeYoon, et autres
Publié: (2024)
par: Kim, JaeYoon, et autres
Publié: (2024)
Latent Covariate Shift: Unlocking Partial Identifiability for Multi-Source Domain Adaptation
par: Liu, Yuhang, et autres
Publié: (2022)
par: Liu, Yuhang, et autres
Publié: (2022)
From Static Constraints to Dynamic Adaptation: Sample-Level Constraint Relaxation for Offline-to-Online Reinforcement Learning
par: Zu, Lipeng, et autres
Publié: (2025)
par: Zu, Lipeng, et autres
Publié: (2025)
Cross-Domain Offline Policy Adaptation via Selective Transition Correction
par: Yan, Mengbei, et autres
Publié: (2026)
par: Yan, Mengbei, et autres
Publié: (2026)
Offline Multi-agent Reinforcement Learning via Sequential Score Decomposition
par: Qiao, Dan, et autres
Publié: (2025)
par: Qiao, Dan, et autres
Publié: (2025)
Online Pre-Training for Offline-to-Online Reinforcement Learning
par: Shin, Yongjae, et autres
Publié: (2025)
par: Shin, Yongjae, et autres
Publié: (2025)
SAMG: Offline-to-Online Reinforcement Learning via State-Action-Conditional Offline Model Guidance
par: Zhang, Liyu, et autres
Publié: (2024)
par: Zhang, Liyu, et autres
Publié: (2024)
Towards Robust Offline-to-Online Reinforcement Learning via Uncertainty and Smoothness
par: Wen, Xiaoyu, et autres
Publié: (2023)
par: Wen, Xiaoyu, et autres
Publié: (2023)
Protected Test-Time Adaptation via Online Entropy Matching: A Betting Approach
par: Bar, Yarin, et autres
Publié: (2024)
par: Bar, Yarin, et autres
Publié: (2024)
LEAD: Learning Decomposition for Source-free Universal Domain Adaptation
par: Qu, Sanqing, et autres
Publié: (2024)
par: Qu, Sanqing, et autres
Publié: (2024)
Online Estimation via Offline Estimation: An Information-Theoretic Framework
par: Foster, Dylan J., et autres
Publié: (2024)
par: Foster, Dylan J., et autres
Publié: (2024)
Value-Incentivized Preference Optimization: A Unified Approach to Online and Offline RLHF
par: Cen, Shicong, et autres
Publié: (2024)
par: Cen, Shicong, et autres
Publié: (2024)
Making Offline RL Online: Collaborative World Models for Offline Visual Reinforcement Learning
par: Wang, Qi, et autres
Publié: (2023)
par: Wang, Qi, et autres
Publié: (2023)
Contextual Online Pricing with (Biased) Offline Data
par: Zhang, Yixuan, et autres
Publié: (2025)
par: Zhang, Yixuan, et autres
Publié: (2025)
Online Policy Learning from Offline Preferences
par: Zhang, Guoxi, et autres
Publié: (2024)
par: Zhang, Guoxi, et autres
Publié: (2024)
Information-Directed Offline-to-Online Reinforcement Learning
par: Chen, Keru
Publié: (2026)
par: Chen, Keru
Publié: (2026)
Offline Local Search for Online Stochastic Bandits
par: Benadè, Gerdus, et autres
Publié: (2026)
par: Benadè, Gerdus, et autres
Publié: (2026)
Causal Discovery with Mixed Latent Confounding via Precision Decomposition
par: Asiaee, Amir, et autres
Publié: (2025)
par: Asiaee, Amir, et autres
Publié: (2025)
Online Multi-Source Domain Adaptation through Gaussian Mixtures and Dataset Dictionary Learning
par: Montesuma, Eduardo Fernandes, et autres
Publié: (2024)
par: Montesuma, Eduardo Fernandes, et autres
Publié: (2024)
Skills Regularized Task Decomposition for Multi-task Offline Reinforcement Learning
par: Yoo, Minjong, et autres
Publié: (2024)
par: Yoo, Minjong, et autres
Publié: (2024)
Action-Free Offline-to-Online RL via Discretised State Policies
par: Neggatu, Natinael Solomon, et autres
Publié: (2026)
par: Neggatu, Natinael Solomon, et autres
Publié: (2026)
Online Distribution Shift Detection via Recency Prediction
par: Luo, Rachel, et autres
Publié: (2022)
par: Luo, Rachel, et autres
Publié: (2022)
Adapting to Online Distribution Shifts in Deep Learning: A Black-Box Approach
par: Baby, Dheeraj, et autres
Publié: (2025)
par: Baby, Dheeraj, et autres
Publié: (2025)
Theory-inspired Label Shift Adaptation via Aligned Distribution Mixture
par: Fan, Ruidong, et autres
Publié: (2024)
par: Fan, Ruidong, et autres
Publié: (2024)
Simulating Biases for Interpretable Fairness in Offline and Online Classifiers
par: Inácio, Ricardo, et autres
Publié: (2025)
par: Inácio, Ricardo, et autres
Publié: (2025)
Bayesian Design Principles for Offline-to-Online Reinforcement Learning
par: Hu, Hao, et autres
Publié: (2024)
par: Hu, Hao, et autres
Publié: (2024)
Provable Domain Adaptation for Offline Reinforcement Learning with Limited Samples
par: Chen, Weiqin, et autres
Publié: (2024)
par: Chen, Weiqin, et autres
Publié: (2024)
Documents similaires
-
Agile Online Model Selection: Resolving Adaptation Lag via Safeguarded Large Learning Rates
par: Takemura, Kei, et autres
Publié: (2026) -
Backward Compatibility in Attributive Explanation and Enhanced Model Training Method
par: Matsuno, Ryuta
Publié: (2024) -
Improved Impossible Tuning and Lipschitz-Adaptive Universal Online Learning with Gradient Variations
par: Takemura, Kei, et autres
Publié: (2025) -
Few-shot Adaptation to Distribution Shifts By Mixing Source and Target Embeddings
par: Xue, Yihao, et autres
Publié: (2023) -
Sample-Mean Anchored Thompson Sampling for Offline-to-Online Learning with Distribution Shift
par: Li, Bochao, et autres
Publié: (2026)