:: Library Catalog

Copertina

Salvato in:

Dettagli Bibliografici
Autori principali:	Voelcker, Claas A, Ahmadian, Arash, Abachi, Romina, Gilitschenski, Igor, Farahmand, Amir-massoud
Natura:	Preprint
Pubblicazione:	2023
Soggetti:	Machine Learning Artificial Intelligence
Accesso online:	https://arxiv.org/abs/2306.17366
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Documenti analoghi

Calibrated Value-Aware Model Learning with Probabilistic Environment Models
di: Voelcker, Claas, et al.
Pubblicazione: (2025)

Dissecting Deep RL with High Update Ratios: Combatting Value Divergence
di: Hussing, Marcel, et al.
Pubblicazione: (2024)

When does Self-Prediction help? Understanding Auxiliary Tasks in Reinforcement Learning
di: Voelcker, Claas, et al.
Pubblicazione: (2024)

MAD-TD: Model-Augmented Data stabilizes High Update Ratio RL
di: Voelcker, Claas A, et al.
Pubblicazione: (2024)

Relative Entropy Pathwise Policy Optimization
di: Voelcker, Claas, et al.
Pubblicazione: (2025)

PID Accelerated Temporal Difference Algorithms
di: Bedaywi, Mark, et al.
Pubblicazione: (2024)

Test-Time Graph Search for Goal-Conditioned Reinforcement Learning
di: Opryshko, Evgenii, et al.
Pubblicazione: (2025)

Majority of the Bests: Improving Best-of-N via Bootstrapping
di: Rakhsha, Amin, et al.
Pubblicazione: (2025)

Behavior-Consistent Deep Reinforcement Learning
di: Hussing, Marcel, et al.
Pubblicazione: (2026)

SimMerge: Learning to Select Merge Operators from Similarity Signals
di: Bolton, Oliver, et al.
Pubblicazione: (2026)

PANDAS: Improving Many-shot Jailbreaking via Positive Affirmation, Negative Demonstration, and Adaptive Sampling
di: Ma, Avery, et al.
Pubblicazione: (2025)

Self-Improving Robust Preference Optimization
di: Choi, Eugene, et al.
Pubblicazione: (2024)

Entropy-Aware Model Initialization for Effective Exploration in Deep Reinforcement Learning
di: Jang, Sooyoung, et al.
Pubblicazione: (2021)

medDreamer: Model-Based Reinforcement Learning with Latent Imagination on Complex EHRs for Clinical Decision Support
di: Xu, Qianyi, et al.
Pubblicazione: (2025)

Efficient and Accurate Optimal Transport with Mirror Descent and Conjugate Gradients
di: Kemertas, Mete, et al.
Pubblicazione: (2023)

Track, Inpaint, Resplat: Subject-driven 3D and 4D Generation with Progressive Texture Infilling
di: Zheng, Shuhong, et al.
Pubblicazione: (2025)

Press Start to Charge: Videogaming the Online Centralized Charging Scheduling Problem
di: Ghahtarani, Alireza, et al.
Pubblicazione: (2026)

Ada-Diffuser: Latent-Aware Adaptive Diffusion for Decision-Making
di: Feng, Fan, et al.
Pubblicazione: (2026)

SAFE-RL: Saliency-Aware Counterfactual Explainer for Deep Reinforcement Learning Policies
di: Samadi, Amir, et al.
Pubblicazione: (2024)

Task-Aware Harmony Multi-Task Decision Transformer for Offline Reinforcement Learning
di: Fan, Ziqing, et al.
Pubblicazione: (2024)

Deflated Dynamics Value Iteration
di: Lee, Jongmin, et al.
Pubblicazione: (2024)

A Truncated Newton Method for Optimal Transport
di: Kemertas, Mete, et al.
Pubblicazione: (2025)

Improving Adversarial Transferability via Model Alignment
di: Ma, Avery, et al.
Pubblicazione: (2023)

Boosting Hierarchical Reinforcement Learning with Meta-Learning for Complex Task Adaptation
di: Khajooeinejad, Arash, et al.
Pubblicazione: (2024)

RLHF Can Speak Many Languages: Unlocking Multilingual Preference Optimization for LLMs
di: Dang, John, et al.
Pubblicazione: (2024)

The Terminal Representation in Reinforcement Learning
di: Esterhuysen, Amir, et al.
Pubblicazione: (2026)

Decision-Focused Model-based Reinforcement Learning for Reward Transfer
di: Sharma, Abhishek, et al.
Pubblicazione: (2023)

Efficient Differentially Private Fine-Tuning of LLMs via Reinforcement Learning
di: Khadangi, Afshin, et al.
Pubblicazione: (2025)

Constrained Latent Action Policies for Model-Based Offline Reinforcement Learning
di: Alles, Marvin, et al.
Pubblicazione: (2024)

Fairness-Aware Reinforcement Learning (FAReL): A Framework for Transparent and Balanced Sequential Decision-Making
di: Cimpean, Alexandra, et al.
Pubblicazione: (2025)

Guided Exploration in Reinforcement Learning via Monte Carlo Critic Optimization
di: Kuznetsov, Igor
Pubblicazione: (2022)

Neural Assets: 3D-Aware Multi-Object Scene Synthesis with Image Diffusion Models
di: Wu, Ziyi, et al.
Pubblicazione: (2024)

The Multilingual Alignment Prism: Aligning Global and Local Preferences to Reduce Harm
di: Aakanksha, et al.
Pubblicazione: (2024)

Programming by Backprop: An Instruction is Worth 100 Examples When Finetuning LLMs
di: Cook, Jonathan, et al.
Pubblicazione: (2025)

Group-Aware Reinforcement Learning for Output Diversity in Large Language Models
di: Anschel, Oron, et al.
Pubblicazione: (2025)

A Full DAG Score-Based Algorithm for Learning Causal Bayesian Networks with Latent Confounders
di: Gonzales, Christophe, et al.
Pubblicazione: (2024)

LacaDM: A Latent Causal Diffusion Model for Multiobjective Reinforcement Learning
di: Yan, Xueming, et al.
Pubblicazione: (2025)

Selecting Decision-Relevant Concepts in Reinforcement Learning
di: Raman, Naveen, et al.
Pubblicazione: (2026)

On the Effective Horizon of Inverse Reinforcement Learning
di: Xu, Yiqing, et al.
Pubblicazione: (2023)

A Temporally Correlated Latent Exploration for Reinforcement Learning
di: Oh, SuMin, et al.
Pubblicazione: (2024)