Torthaí cuardaigh údar :: Library Catalog

1

Winning Gold at IMO 2025 with a Model-Agnostic Verification-and-Refinement Pipeline de réir Huang, Yichen, Yang, Lin F.

Foilsithe / Cruthaithe 2025

Faigh an téacs iomlán

Preprint

Taifead Aonair
Cuir le mo chuid Ceanán

Sábháilte in:
2

Confident Natural Policy Gradient for Local Planning in $q_π$-realizable Constrained MDPs de réir Tian, Tian, Yang, Lin F., Szepesvári, Csaba

Foilsithe / Cruthaithe 2024

Faigh an téacs iomlán

Preprint

Taifead Aonair
Cuir le mo chuid Ceanán

Sábháilte in:
3

Sample Complexity Bounds for Linear Constrained MDPs with a Generative Model de réir Liu, Xingtu, Yang, Lin F., Vaswani, Sharan

Foilsithe / Cruthaithe 2025

Faigh an téacs iomlán

Preprint

Taifead Aonair
Cuir le mo chuid Ceanán

Sábháilte in:
4

Near-Optimal Sample Complexity Bounds for Constrained Average-Reward MDPs de réir Wei, Yukuan, Li, Xudong, Yang, Lin F.

Foilsithe / Cruthaithe 2025

Faigh an téacs iomlán

Preprint

Taifead Aonair
Cuir le mo chuid Ceanán

Sábháilte in:
5

Near-Optimal Sample Complexity for Online Constrained MDPs de réir Liu, Chang, Li, Yunfan, Yang, Lin F.

Foilsithe / Cruthaithe 2026

Faigh an téacs iomlán

Preprint

Taifead Aonair
Cuir le mo chuid Ceanán

Sábháilte in:
6

Misspecified $Q$-Learning with Sparse Linear Function Approximation: Tight Bounds on Approximation Error de réir Du, Ally Yalei, Yang, Lin F., Wang, Ruosong

Foilsithe / Cruthaithe 2024

Faigh an téacs iomlán

Preprint

Taifead Aonair
Cuir le mo chuid Ceanán

Sábháilte in:
7

Tackling Heavy-Tailed Rewards in Reinforcement Learning with Function Approximation: Minimax Optimal and Instance-Dependent Regret Bounds de réir Huang, Jiayi, Zhong, Han, Wang, Liwei, Yang, Lin F.

Foilsithe / Cruthaithe 2023

Faigh an téacs iomlán

Preprint

Taifead Aonair
Cuir le mo chuid Ceanán

Sábháilte in:
8

Uniform Last-Iterate Guarantee for Bandits and Reinforcement Learning de réir Liu, Junyan, Li, Yunfan, Wang, Ruosong, Yang, Lin F.

Foilsithe / Cruthaithe 2024

Faigh an téacs iomlán

Preprint

Taifead Aonair
Cuir le mo chuid Ceanán

Sábháilte in:
9

Learning for Bandits under Action Erasures de réir Hanna, Osama, Karakas, Merve, Yang, Lin F., Fragouli, Christina

Foilsithe / Cruthaithe 2024

Faigh an téacs iomlán

Preprint

Taifead Aonair
Cuir le mo chuid Ceanán

Sábháilte in:
10

Does Feedback Help in Bandits with Arm Erasures? de réir Karakas, Merve, Hanna, Osama, Yang, Lin F., Fragouli, Christina

Foilsithe / Cruthaithe 2025

Faigh an téacs iomlán

Preprint

Taifead Aonair
Cuir le mo chuid Ceanán

Sábháilte in:
11

On the optimal regret of collaborative personalized linear bandits de réir Huang, Bruce, Zhou, Ruida, Yang, Lin F., Diggavi, Suhas

Foilsithe / Cruthaithe 2025

Faigh an téacs iomlán

Preprint

Taifead Aonair
Cuir le mo chuid Ceanán

Sábháilte in:
12

Best-Arm Identification with Noisy Actuation de réir Karakas, Merve, Hanna, Osama, Yang, Lin F., Fragouli, Christina

Foilsithe / Cruthaithe 2026

Faigh an téacs iomlán

Preprint

Taifead Aonair
Cuir le mo chuid Ceanán

Sábháilte in:
13

Multi-Agent Bandit Learning through Heterogeneous Action Erasure Channels de réir Hanna, Osama A., Karakas, Merve, Yang, Lin F., Fragouli, Christina

Foilsithe / Cruthaithe 2023

Faigh an téacs iomlán

Preprint

Taifead Aonair
Cuir le mo chuid Ceanán

Sábháilte in:
14

Don't Forget to Connect! Improving RAG with Graph-based Reranking de réir Dong, Jialin, Fatemi, Bahare, Perozzi, Bryan, Yang, Lin F., Tsitsulin, Anton

Foilsithe / Cruthaithe 2024

Faigh an téacs iomlán

Preprint

Taifead Aonair
Cuir le mo chuid Ceanán

Sábháilte in:
15

ARMOR: High-Performance Semi-Structured Pruning via Adaptive Matrix Factorization de réir Liu, Lawrence, Liu, Alexander, Wang, Mengdi, Zhao, Tuo, Yang, Lin F.

Foilsithe / Cruthaithe 2025

Faigh an téacs iomlán

Preprint

Taifead Aonair
Cuir le mo chuid Ceanán

Sábháilte in:
16

A geometric distortion solution specifically for historical observations and its implementation de réir Lin, F. R., Peng, Q. Y., Zheng, Z. J., Guo, B. F.

Foilsithe / Cruthaithe 2024

Faigh an téacs iomlán

Preprint

Taifead Aonair
Cuir le mo chuid Ceanán

Sábháilte in:
17

Precision premium transformation -- a high-precision astrometric solution based on the precision premium curve de réir Zheng, Z. J., Peng, Q. Y., Lin, F. R., Li, D., Zheng, Y.

Foilsithe / Cruthaithe 2024

Faigh an téacs iomlán

Preprint

Taifead Aonair
Cuir le mo chuid Ceanán

Sábháilte in:
18

Hyper: Hyperparameter Robust Efficient Exploration in Reinforcement Learning de réir Wang, Yiran, Liu, Chenshu, Li, Yunfan, Amani, Sanae, Zhou, Bolei, Yang, Lin F.

Foilsithe / Cruthaithe 2024

Faigh an téacs iomlán

Preprint

Taifead Aonair
Cuir le mo chuid Ceanán

Sábháilte in:
19

NoWag: A Unified Framework for Shape Preserving Compression of Large Language Models de réir Liu, Lawrence, Chakrabarti, Inesh, Li, Yixiao, Wang, Mengdi, Zhao, Tuo, Yang, Lin F.

Foilsithe / Cruthaithe 2025

Faigh an téacs iomlán

Preprint

Taifead Aonair
Cuir le mo chuid Ceanán

Sábháilte in:
20

LACONIC: Length-Aware Constrained Reinforcement Learning for LLM de réir Liu, Chang, Zhao, Yiran, Liu, Lawrence, Ye, Yaoqi, Szepesvári, Csaba, Yang, Lin F.

Foilsithe / Cruthaithe 2026

Faigh an téacs iomlán

Preprint

Taifead Aonair
Cuir le mo chuid Ceanán

Sábháilte in:

Torthaí cuardaigh - Lin, F.

Winning Gold at IMO 2025 with a Model-Agnostic Verification-and-Refinement Pipeline de réir Huang, Yichen, Yang, Lin F.

Confident Natural Policy Gradient for Local Planning in $q_π$-realizable Constrained MDPs de réir Tian, Tian, Yang, Lin F., Szepesvári, Csaba

Sample Complexity Bounds for Linear Constrained MDPs with a Generative Model de réir Liu, Xingtu, Yang, Lin F., Vaswani, Sharan

Near-Optimal Sample Complexity Bounds for Constrained Average-Reward MDPs de réir Wei, Yukuan, Li, Xudong, Yang, Lin F.

Near-Optimal Sample Complexity for Online Constrained MDPs de réir Liu, Chang, Li, Yunfan, Yang, Lin F.

Misspecified $Q$-Learning with Sparse Linear Function Approximation: Tight Bounds on Approximation Error de réir Du, Ally Yalei, Yang, Lin F., Wang, Ruosong

Tackling Heavy-Tailed Rewards in Reinforcement Learning with Function Approximation: Minimax Optimal and Instance-Dependent Regret Bounds de réir Huang, Jiayi, Zhong, Han, Wang, Liwei, Yang, Lin F.

Uniform Last-Iterate Guarantee for Bandits and Reinforcement Learning de réir Liu, Junyan, Li, Yunfan, Wang, Ruosong, Yang, Lin F.

Learning for Bandits under Action Erasures de réir Hanna, Osama, Karakas, Merve, Yang, Lin F., Fragouli, Christina

Does Feedback Help in Bandits with Arm Erasures? de réir Karakas, Merve, Hanna, Osama, Yang, Lin F., Fragouli, Christina

On the optimal regret of collaborative personalized linear bandits de réir Huang, Bruce, Zhou, Ruida, Yang, Lin F., Diggavi, Suhas

Best-Arm Identification with Noisy Actuation de réir Karakas, Merve, Hanna, Osama, Yang, Lin F., Fragouli, Christina

Multi-Agent Bandit Learning through Heterogeneous Action Erasure Channels de réir Hanna, Osama A., Karakas, Merve, Yang, Lin F., Fragouli, Christina

Don't Forget to Connect! Improving RAG with Graph-based Reranking de réir Dong, Jialin, Fatemi, Bahare, Perozzi, Bryan, Yang, Lin F., Tsitsulin, Anton

ARMOR: High-Performance Semi-Structured Pruning via Adaptive Matrix Factorization de réir Liu, Lawrence, Liu, Alexander, Wang, Mengdi, Zhao, Tuo, Yang, Lin F.

A geometric distortion solution specifically for historical observations and its implementation de réir Lin, F. R., Peng, Q. Y., Zheng, Z. J., Guo, B. F.

Precision premium transformation -- a high-precision astrometric solution based on the precision premium curve de réir Zheng, Z. J., Peng, Q. Y., Lin, F. R., Li, D., Zheng, Y.

Hyper: Hyperparameter Robust Efficient Exploration in Reinforcement Learning de réir Wang, Yiran, Liu, Chenshu, Li, Yunfan, Amani, Sanae, Zhou, Bolei, Yang, Lin F.

NoWag: A Unified Framework for Shape Preserving Compression of Large Language Models de réir Liu, Lawrence, Chakrabarti, Inesh, Li, Yixiao, Wang, Mengdi, Zhao, Tuo, Yang, Lin F.

LACONIC: Length-Aware Constrained Reinforcement Learning for LLM de réir Liu, Chang, Zhao, Yiran, Liu, Lawrence, Ye, Yaoqi, Szepesvári, Csaba, Yang, Lin F.

Uirlisí cuardaigh: