Salvato in:
| Autori principali: | Feng, Qing, Ma, Tianyi, Zhu, Ruihao |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2024
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2406.06802 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
On the Peril of (Even a Little) Nonstationarity in Satisficing Regret Minimization
di: Zhang, Yixuan, et al.
Pubblicazione: (2026)
di: Zhang, Yixuan, et al.
Pubblicazione: (2026)
$(ε, u)$-Adaptive Regret Minimization in Heavy-Tailed Bandits
di: Genalti, Gianmarco, et al.
Pubblicazione: (2023)
di: Genalti, Gianmarco, et al.
Pubblicazione: (2023)
Regret Distribution in Stochastic Bandits: Optimal Trade-off between Expectation and Tail Risk
di: Simchi-Levi, David, et al.
Pubblicazione: (2023)
di: Simchi-Levi, David, et al.
Pubblicazione: (2023)
Neural Risk-sensitive Satisficing in Contextual Bandits
di: Ito, Shogo, et al.
Pubblicazione: (2025)
di: Ito, Shogo, et al.
Pubblicazione: (2025)
Identifying All ε-Best Arms in (Misspecified) Linear Bandits
di: Li, Zhekai, et al.
Pubblicazione: (2025)
di: Li, Zhekai, et al.
Pubblicazione: (2025)
Catoni-Style Change Point Detection for Regret Minimization in Non-Stationary Heavy-Tailed Bandits
di: Genalti, Gianmarco, et al.
Pubblicazione: (2025)
di: Genalti, Gianmarco, et al.
Pubblicazione: (2025)
Bayesian Regret Minimization in Offline Bandits
di: Petrik, Marek, et al.
Pubblicazione: (2023)
di: Petrik, Marek, et al.
Pubblicazione: (2023)
Multi-User mmWave Beam and Rate Adaptation via Combinatorial Satisficing Bandits
di: Özyıldırım, Emre, et al.
Pubblicazione: (2026)
di: Özyıldırım, Emre, et al.
Pubblicazione: (2026)
Efficient Swap Regret Minimization in Combinatorial Bandits
di: Kontogiannis, Andreas, et al.
Pubblicazione: (2026)
di: Kontogiannis, Andreas, et al.
Pubblicazione: (2026)
No-Regret is not enough! Bandits with General Constraints through Adaptive Regret Minimization
di: Bernasconi, Martino, et al.
Pubblicazione: (2024)
di: Bernasconi, Martino, et al.
Pubblicazione: (2024)
Bandits with Stochastic Experts: Constant Regret, Empirical Experts and Episodes
di: Sharma, Nihal, et al.
Pubblicazione: (2021)
di: Sharma, Nihal, et al.
Pubblicazione: (2021)
Regret Tail Characterization of Optimal Bandit Algorithms with Generic Rewards
di: Panda, Subhodip, et al.
Pubblicazione: (2026)
di: Panda, Subhodip, et al.
Pubblicazione: (2026)
Improved Regret Bounds for Linear Bandits with Heavy-Tailed Rewards
di: Tajdini, Artin, et al.
Pubblicazione: (2025)
di: Tajdini, Artin, et al.
Pubblicazione: (2025)
Efficient and Interpretable Bandit Algorithms
di: Mukherjee, Subhojyoti, et al.
Pubblicazione: (2023)
di: Mukherjee, Subhojyoti, et al.
Pubblicazione: (2023)
Robust Satisficing Gaussian Process Bandits Under Adversarial Attacks
di: Saday, Artun, et al.
Pubblicazione: (2025)
di: Saday, Artun, et al.
Pubblicazione: (2025)
Data-Driven Upper Confidence Bounds with Near-Optimal Regret for Heavy-Tailed Bandits
di: Tamás, Ambrus, et al.
Pubblicazione: (2024)
di: Tamás, Ambrus, et al.
Pubblicazione: (2024)
Risk-Aware Linear Bandits: Theory and Applications in Smart Order Routing
di: Ji, Jingwei, et al.
Pubblicazione: (2022)
di: Ji, Jingwei, et al.
Pubblicazione: (2022)
Tail Distribution of Regret in Optimistic Reinforcement Learning
di: Khodadadian, Sajad, et al.
Pubblicazione: (2025)
di: Khodadadian, Sajad, et al.
Pubblicazione: (2025)
Order-Optimal Regret in Distributed Kernel Bandits using Uniform Sampling with Shared Randomness
di: Pavlovic, Nikola, et al.
Pubblicazione: (2024)
di: Pavlovic, Nikola, et al.
Pubblicazione: (2024)
On the Benefits of Free Exploration for Regret Minimization in Multi-Armed Bandits
di: Hou, Yunlong, et al.
Pubblicazione: (2026)
di: Hou, Yunlong, et al.
Pubblicazione: (2026)
Prior Diffusiveness and Regret in the Linear-Gaussian Bandit
di: Zhu, Yifan, et al.
Pubblicazione: (2026)
di: Zhu, Yifan, et al.
Pubblicazione: (2026)
Chained Information-Theoretic bounds and Tight Regret Rate for Linear Bandit Problems
di: Gouverneur, Amaury, et al.
Pubblicazione: (2024)
di: Gouverneur, Amaury, et al.
Pubblicazione: (2024)
Multi-Armed Bandits With Machine Learning-Generated Surrogate Rewards
di: Ji, Wenlong, et al.
Pubblicazione: (2025)
di: Ji, Wenlong, et al.
Pubblicazione: (2025)
Unified Framework of Distributional Regret in Multi-Armed Bandits and Reinforcement Learning
di: Lee, Harin, et al.
Pubblicazione: (2026)
di: Lee, Harin, et al.
Pubblicazione: (2026)
Optimal Regret for Single Index Bandits
di: Dey, Devdan, et al.
Pubblicazione: (2026)
di: Dey, Devdan, et al.
Pubblicazione: (2026)
Doubly Optimal No-Regret Online Learning in Strongly Monotone Games with Bandit Feedback
di: Ba, Wenjia, et al.
Pubblicazione: (2021)
di: Ba, Wenjia, et al.
Pubblicazione: (2021)
Beyond the Lower Bound: Bridging Regret Minimization and Best Arm Identification in Lexicographic Bandits
di: Xue, Bo, et al.
Pubblicazione: (2025)
di: Xue, Bo, et al.
Pubblicazione: (2025)
Near-Optimal Regret for Distributed Adversarial Bandits: A Black-Box Approach
di: Qiu, Hao, et al.
Pubblicazione: (2026)
di: Qiu, Hao, et al.
Pubblicazione: (2026)
Statistical Properties of Robust Satisficing
di: Li, Zhiyi, et al.
Pubblicazione: (2024)
di: Li, Zhiyi, et al.
Pubblicazione: (2024)
Improved Regret Bounds for Bandits with Expert Advice
di: Cesa-Bianchi, Nicolò, et al.
Pubblicazione: (2024)
di: Cesa-Bianchi, Nicolò, et al.
Pubblicazione: (2024)
Fast Best-in-Class Regret for Contextual Bandits
di: Girard, Samuel, et al.
Pubblicazione: (2025)
di: Girard, Samuel, et al.
Pubblicazione: (2025)
Near-Optimal Regret in Adversarial Kernel Bandits
di: Zhang, Yu-Jie, et al.
Pubblicazione: (2026)
di: Zhang, Yu-Jie, et al.
Pubblicazione: (2026)
Optimal Regret for Policy Optimization in Contextual Bandits
di: Levy, Orin, et al.
Pubblicazione: (2026)
di: Levy, Orin, et al.
Pubblicazione: (2026)
Improved Regret Bounds of (Multinomial) Logistic Bandits via Regret-to-Confidence-Set Conversion
di: Lee, Junghyun, et al.
Pubblicazione: (2023)
di: Lee, Junghyun, et al.
Pubblicazione: (2023)
A Simple and Optimal Policy Design with Safety against Heavy-Tailed Risk for Stochastic Bandits
di: Simchi-Levi, David, et al.
Pubblicazione: (2022)
di: Simchi-Levi, David, et al.
Pubblicazione: (2022)
On the KL-Divergence-based Robust Satisficing Model
di: Yan, Haojie, et al.
Pubblicazione: (2024)
di: Yan, Haojie, et al.
Pubblicazione: (2024)
Satisficing Exploration for Deep Reinforcement Learning
di: Arumugam, Dilip, et al.
Pubblicazione: (2024)
di: Arumugam, Dilip, et al.
Pubblicazione: (2024)
Imitation Learning via Focused Satisficing
di: Shah, Rushit N., et al.
Pubblicazione: (2025)
di: Shah, Rushit N., et al.
Pubblicazione: (2025)
Distributed Linear Bandits under Communication Constraints
di: Salgia, Sudeep, et al.
Pubblicazione: (2022)
di: Salgia, Sudeep, et al.
Pubblicazione: (2022)
Distributed No-Regret Learning for Multi-Stage Systems with End-to-End Bandit Feedback
di: Hou, I-Hong
Pubblicazione: (2024)
di: Hou, I-Hong
Pubblicazione: (2024)
Documenti analoghi
-
On the Peril of (Even a Little) Nonstationarity in Satisficing Regret Minimization
di: Zhang, Yixuan, et al.
Pubblicazione: (2026) -
$(ε, u)$-Adaptive Regret Minimization in Heavy-Tailed Bandits
di: Genalti, Gianmarco, et al.
Pubblicazione: (2023) -
Regret Distribution in Stochastic Bandits: Optimal Trade-off between Expectation and Tail Risk
di: Simchi-Levi, David, et al.
Pubblicazione: (2023) -
Neural Risk-sensitive Satisficing in Contextual Bandits
di: Ito, Shogo, et al.
Pubblicazione: (2025) -
Identifying All ε-Best Arms in (Misspecified) Linear Bandits
di: Li, Zhekai, et al.
Pubblicazione: (2025)