:: Library Catalog

Copertina

Salvato in:

Dettagli Bibliografici
Autori principali:	Feng, Qing, Ma, Tianyi, Zhu, Ruihao
Natura:	Preprint
Pubblicazione:	2024
Soggetti:	Machine Learning
Accesso online:	https://arxiv.org/abs/2406.06802
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Documenti analoghi

On the Peril of (Even a Little) Nonstationarity in Satisficing Regret Minimization
di: Zhang, Yixuan, et al.
Pubblicazione: (2026)

$(ε, u)$-Adaptive Regret Minimization in Heavy-Tailed Bandits
di: Genalti, Gianmarco, et al.
Pubblicazione: (2023)

Regret Distribution in Stochastic Bandits: Optimal Trade-off between Expectation and Tail Risk
di: Simchi-Levi, David, et al.
Pubblicazione: (2023)

Neural Risk-sensitive Satisficing in Contextual Bandits
di: Ito, Shogo, et al.
Pubblicazione: (2025)

Identifying All ε-Best Arms in (Misspecified) Linear Bandits
di: Li, Zhekai, et al.
Pubblicazione: (2025)

Catoni-Style Change Point Detection for Regret Minimization in Non-Stationary Heavy-Tailed Bandits
di: Genalti, Gianmarco, et al.
Pubblicazione: (2025)

Bayesian Regret Minimization in Offline Bandits
di: Petrik, Marek, et al.
Pubblicazione: (2023)

Multi-User mmWave Beam and Rate Adaptation via Combinatorial Satisficing Bandits
di: Özyıldırım, Emre, et al.
Pubblicazione: (2026)

Efficient Swap Regret Minimization in Combinatorial Bandits
di: Kontogiannis, Andreas, et al.
Pubblicazione: (2026)

No-Regret is not enough! Bandits with General Constraints through Adaptive Regret Minimization
di: Bernasconi, Martino, et al.
Pubblicazione: (2024)

Bandits with Stochastic Experts: Constant Regret, Empirical Experts and Episodes
di: Sharma, Nihal, et al.
Pubblicazione: (2021)

Regret Tail Characterization of Optimal Bandit Algorithms with Generic Rewards
di: Panda, Subhodip, et al.
Pubblicazione: (2026)

Improved Regret Bounds for Linear Bandits with Heavy-Tailed Rewards
di: Tajdini, Artin, et al.
Pubblicazione: (2025)

Efficient and Interpretable Bandit Algorithms
di: Mukherjee, Subhojyoti, et al.
Pubblicazione: (2023)

Robust Satisficing Gaussian Process Bandits Under Adversarial Attacks
di: Saday, Artun, et al.
Pubblicazione: (2025)

Data-Driven Upper Confidence Bounds with Near-Optimal Regret for Heavy-Tailed Bandits
di: Tamás, Ambrus, et al.
Pubblicazione: (2024)

Risk-Aware Linear Bandits: Theory and Applications in Smart Order Routing
di: Ji, Jingwei, et al.
Pubblicazione: (2022)

Tail Distribution of Regret in Optimistic Reinforcement Learning
di: Khodadadian, Sajad, et al.
Pubblicazione: (2025)

Order-Optimal Regret in Distributed Kernel Bandits using Uniform Sampling with Shared Randomness
di: Pavlovic, Nikola, et al.
Pubblicazione: (2024)

On the Benefits of Free Exploration for Regret Minimization in Multi-Armed Bandits
di: Hou, Yunlong, et al.
Pubblicazione: (2026)

Prior Diffusiveness and Regret in the Linear-Gaussian Bandit
di: Zhu, Yifan, et al.
Pubblicazione: (2026)

Chained Information-Theoretic bounds and Tight Regret Rate for Linear Bandit Problems
di: Gouverneur, Amaury, et al.
Pubblicazione: (2024)

Multi-Armed Bandits With Machine Learning-Generated Surrogate Rewards
di: Ji, Wenlong, et al.
Pubblicazione: (2025)

Unified Framework of Distributional Regret in Multi-Armed Bandits and Reinforcement Learning
di: Lee, Harin, et al.
Pubblicazione: (2026)

Optimal Regret for Single Index Bandits
di: Dey, Devdan, et al.
Pubblicazione: (2026)

Doubly Optimal No-Regret Online Learning in Strongly Monotone Games with Bandit Feedback
di: Ba, Wenjia, et al.
Pubblicazione: (2021)

Beyond the Lower Bound: Bridging Regret Minimization and Best Arm Identification in Lexicographic Bandits
di: Xue, Bo, et al.
Pubblicazione: (2025)

Near-Optimal Regret for Distributed Adversarial Bandits: A Black-Box Approach
di: Qiu, Hao, et al.
Pubblicazione: (2026)

Statistical Properties of Robust Satisficing
di: Li, Zhiyi, et al.
Pubblicazione: (2024)

Improved Regret Bounds for Bandits with Expert Advice
di: Cesa-Bianchi, Nicolò, et al.
Pubblicazione: (2024)

Fast Best-in-Class Regret for Contextual Bandits
di: Girard, Samuel, et al.
Pubblicazione: (2025)

Near-Optimal Regret in Adversarial Kernel Bandits
di: Zhang, Yu-Jie, et al.
Pubblicazione: (2026)

Optimal Regret for Policy Optimization in Contextual Bandits
di: Levy, Orin, et al.
Pubblicazione: (2026)

Improved Regret Bounds of (Multinomial) Logistic Bandits via Regret-to-Confidence-Set Conversion
di: Lee, Junghyun, et al.
Pubblicazione: (2023)

A Simple and Optimal Policy Design with Safety against Heavy-Tailed Risk for Stochastic Bandits
di: Simchi-Levi, David, et al.
Pubblicazione: (2022)

On the KL-Divergence-based Robust Satisficing Model
di: Yan, Haojie, et al.
Pubblicazione: (2024)

Satisficing Exploration for Deep Reinforcement Learning
di: Arumugam, Dilip, et al.
Pubblicazione: (2024)

Imitation Learning via Focused Satisficing
di: Shah, Rushit N., et al.
Pubblicazione: (2025)

Distributed Linear Bandits under Communication Constraints
di: Salgia, Sudeep, et al.
Pubblicazione: (2022)

Distributed No-Regret Learning for Multi-Stage Systems with End-to-End Bandit Feedback
di: Hou, I-Hong
Pubblicazione: (2024)