Hu, C., Zhang, Y., & Baier, H. (2026). DiPRL: Learning Discrete Programmatic Policies via Architecture Entropy Regularization.
Style de citation Chicago (17e éd.)Hu, Chengpeng, Yingqian Zhang, et Hendrik Baier. DiPRL: Learning Discrete Programmatic Policies via Architecture Entropy Regularization. 2026.
Style de citation MLA (9e éd.)Hu, Chengpeng, et al. DiPRL: Learning Discrete Programmatic Policies via Architecture Entropy Regularization. 2026.
Attention : ces citations peuvent ne pas être correctes à 100%.