Gespeichert in:
| Hauptverfasser: | Li, Hao, Zhou, Xiao-Hu, Li, Shu-Hai, Gui, Mei-Jiang, Xie, Xiao-Liang, Liu, Shi-Qi, Wang, Shuang-Yi, Feng, Zhen-Qiu, Hou, Zeng-Guang |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2023
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2310.17245 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
MICRO: Model-Based Offline Reinforcement Learning with a Conservative Bellman Operator
von: Liu, Xiao-Yin, et al.
Veröffentlicht: (2023)
von: Liu, Xiao-Yin, et al.
Veröffentlicht: (2023)
MOSformer: Momentum encoder-based inter-slice fusion transformer for medical image segmentation
von: Huang, De-Xing, et al.
Veröffentlicht: (2024)
von: Huang, De-Xing, et al.
Veröffentlicht: (2024)
SPIRONet: Spatial-Frequency Learning and Topological Channel Interaction Network for Vessel Segmentation
von: Huang, De-Xing, et al.
Veröffentlicht: (2024)
von: Huang, De-Xing, et al.
Veröffentlicht: (2024)
CAS-GAN for Contrast-free Angiography Synthesis
von: Huang, De-Xing, et al.
Veröffentlicht: (2024)
von: Huang, De-Xing, et al.
Veröffentlicht: (2024)
DOMAIN: MilDly COnservative Model-BAsed OfflINe Reinforcement Learning
von: Liu, Xiao-Yin, et al.
Veröffentlicht: (2023)
von: Liu, Xiao-Yin, et al.
Veröffentlicht: (2023)
LEASE: Offline Preference-based Reinforcement Learning with High Sample Efficiency
von: Liu, Xiao-Yin, et al.
Veröffentlicht: (2024)
von: Liu, Xiao-Yin, et al.
Veröffentlicht: (2024)
VLA Model Post-Training via Action-Chunked PPO and Self Behavior Cloning
von: Wang, Si-Cheng, et al.
Veröffentlicht: (2025)
von: Wang, Si-Cheng, et al.
Veröffentlicht: (2025)
VasoMIM: Vascular Anatomy-Aware Masked Image Modeling for Vessel Segmentation
von: Huang, De-Xing, et al.
Veröffentlicht: (2025)
von: Huang, De-Xing, et al.
Veröffentlicht: (2025)
Online Adaptation via Dual-Stage Alignment and Self-Supervision for Fast-Calibration Brain-Computer Interfaces
von: Duan, Sheng-Bin, et al.
Veröffentlicht: (2025)
von: Duan, Sheng-Bin, et al.
Veröffentlicht: (2025)
Activity and control of methanol metabolism in the seawaters across the estuary–coast–shelf continuum
von: Guang‐Chao Zhuang, et al.
Veröffentlicht: (2025)
von: Guang‐Chao Zhuang, et al.
Veröffentlicht: (2025)
Learning Novel Skills from Language-Generated Demonstrations
von: Jin, Ao-Qun, et al.
Veröffentlicht: (2024)
von: Jin, Ao-Qun, et al.
Veröffentlicht: (2024)
VLA Model-Expert Collaboration for Bi-directional Manipulation Learning
von: Xiang, Tian-Yu, et al.
Veröffentlicht: (2025)
von: Xiang, Tian-Yu, et al.
Veröffentlicht: (2025)
Task-Oriented Learning for Automatic EEG Denoising
von: Xiang, Tian-Yu, et al.
Veröffentlicht: (2025)
von: Xiang, Tian-Yu, et al.
Veröffentlicht: (2025)
REASON: Probability map-guided dual-branch fusion framework for gastric content assessment
von: Xiao, Nu-Fnag, et al.
Veröffentlicht: (2025)
von: Xiao, Nu-Fnag, et al.
Veröffentlicht: (2025)
COSBO: Conservative Offline Simulation-Based Policy Optimization
von: Kargar, Eshagh, et al.
Veröffentlicht: (2024)
von: Kargar, Eshagh, et al.
Veröffentlicht: (2024)
CROP: Expert-Aligned Image Cropping via Compositional Reasoning and Optimizing Preference
von: Dong, Zhitong, et al.
Veröffentlicht: (2026)
von: Dong, Zhitong, et al.
Veröffentlicht: (2026)
Parallels Between VLA Model Post-Training and Human Motor Learning: Progress, Challenges, and Trends
von: Xiang, Tian-Yu, et al.
Veröffentlicht: (2025)
von: Xiang, Tian-Yu, et al.
Veröffentlicht: (2025)
Behavior-Regularized Diffusion Policy Optimization for Offline Reinforcement Learning
von: Gao, Chen-Xiao, et al.
Veröffentlicht: (2025)
von: Gao, Chen-Xiao, et al.
Veröffentlicht: (2025)
TRIM26‐Mediated CBX6 Ubiquitination Triggers NETosis to Drive Bladder Cancer Tumor Growth via the CNPY2/NF‐κB Signaling Pathway
von: XiaoJuan Xie, et al.
Veröffentlicht: (2026)
von: XiaoJuan Xie, et al.
Veröffentlicht: (2026)
Conservative Offline Robot Policy Learning via Posterior-Transition Reweighting
von: Zhang, Wanpeng, et al.
Veröffentlicht: (2026)
von: Zhang, Wanpeng, et al.
Veröffentlicht: (2026)
Trajectory-Oriented Policy Optimization with Sparse Rewards
von: Wang, Guojian, et al.
Veröffentlicht: (2024)
von: Wang, Guojian, et al.
Veröffentlicht: (2024)
Deciphering viscosity‐driven mechanisms governing chaotic flow dynamics and mixing efficiency in micromixers
von: Shi‐Xiao Wei, et al.
Veröffentlicht: (2026)
von: Shi‐Xiao Wei, et al.
Veröffentlicht: (2026)
A Weight-aware-based Multi-source Unsupervised Domain Adaptation Method for Human Motion Intention Recognition
von: Liu, Xiao-Yin, et al.
Veröffentlicht: (2024)
von: Liu, Xiao-Yin, et al.
Veröffentlicht: (2024)
Enhancing Generative Auto-bidding with Offline Reward Evaluation and Policy Search
von: Mou, Zhiyu, et al.
Veröffentlicht: (2025)
von: Mou, Zhiyu, et al.
Veröffentlicht: (2025)
Arena as Offline Reward: Efficient Fine-Grained Preference Optimization for Diffusion Models
von: Li, Zhikai, et al.
Veröffentlicht: (2026)
von: Li, Zhikai, et al.
Veröffentlicht: (2026)
Preferred-Action-Optimized Diffusion Policies for Offline Reinforcement Learning
von: Zhang, Tianle, et al.
Veröffentlicht: (2024)
von: Zhang, Tianle, et al.
Veröffentlicht: (2024)
Landscape Analysis of Simultaneous Blind Deconvolution and Phase Retrieval via Structured Low-Rank Tensor Recovery
von: Liang, Xiao, et al.
Veröffentlicht: (2025)
von: Liang, Xiao, et al.
Veröffentlicht: (2025)
A Muon-Accelerated Algorithm for Low Separation Rank Tensor Generalized Linear Models
von: Liang, Xiao, et al.
Veröffentlicht: (2026)
von: Liang, Xiao, et al.
Veröffentlicht: (2026)
CAS-IQA: Teaching Vision-Language Models for Synthetic Angiography Quality Assessment
von: Wang, Bo, et al.
Veröffentlicht: (2025)
von: Wang, Bo, et al.
Veröffentlicht: (2025)
Robust Offline Reinforcement learning with Heavy-Tailed Rewards
von: Zhu, Jin, et al.
Veröffentlicht: (2023)
von: Zhu, Jin, et al.
Veröffentlicht: (2023)
Session-Level Dynamic Ad Load Optimization using Offline Robust Reinforcement Learning
von: Liu, Tao, et al.
Veröffentlicht: (2025)
von: Liu, Tao, et al.
Veröffentlicht: (2025)
Optimistic Model Rollouts for Pessimistic Offline Policy Optimization
von: Zhai, Yuanzhao, et al.
Veröffentlicht: (2024)
von: Zhai, Yuanzhao, et al.
Veröffentlicht: (2024)
ROLeR: Effective Reward Shaping in Offline Reinforcement Learning for Recommender Systems
von: Zhang, Yi, et al.
Veröffentlicht: (2024)
von: Zhang, Yi, et al.
Veröffentlicht: (2024)
Offline Policy Optimization with Posterior Sampling
von: Lin, Hongqiang, et al.
Veröffentlicht: (2026)
von: Lin, Hongqiang, et al.
Veröffentlicht: (2026)
Methane concentration and oxidation rate in the Yangtze River Estuary (July 2021) and East China Sea (April 2021)
von: Mao, Shi-Hai, et al.
Veröffentlicht: (2022)
von: Mao, Shi-Hai, et al.
Veröffentlicht: (2022)
Methane production in the Yangtze River Estuary and East China Sea in 2019/2020
von: Mao, Shi-Hai, et al.
Veröffentlicht: (2022)
von: Mao, Shi-Hai, et al.
Veröffentlicht: (2022)
Investigation on global and local RTD , mixing, and heat transfer of a high‐throughput passive chaotic microreactor
von: Shi‐Xiao Wei, et al.
Veröffentlicht: (2025)
von: Shi‐Xiao Wei, et al.
Veröffentlicht: (2025)
Dual RNA-Seq Unveils Candidate Key Virulence Genes of at the Early Stage of Infection in Hybrid Grouper (♀ × ♂ ).
von: Zeng, Yan-Hua, et al.
Veröffentlicht: (2024)
von: Zeng, Yan-Hua, et al.
Veröffentlicht: (2024)
Cooper: Co-Optimizing Policy and Reward Models in Reinforcement Learning for Large Language Models
von: Hong, Haitao, et al.
Veröffentlicht: (2025)
von: Hong, Haitao, et al.
Veröffentlicht: (2025)
Sedum qingyuanense (Crassulaceae), a new species from Qingyuan, Guangdong, China
von: Yi, Xiao-Wei, et al.
Veröffentlicht: (2025)
von: Yi, Xiao-Wei, et al.
Veröffentlicht: (2025)
Ähnliche Einträge
-
MICRO: Model-Based Offline Reinforcement Learning with a Conservative Bellman Operator
von: Liu, Xiao-Yin, et al.
Veröffentlicht: (2023) -
MOSformer: Momentum encoder-based inter-slice fusion transformer for medical image segmentation
von: Huang, De-Xing, et al.
Veröffentlicht: (2024) -
SPIRONet: Spatial-Frequency Learning and Topological Channel Interaction Network for Vessel Segmentation
von: Huang, De-Xing, et al.
Veröffentlicht: (2024) -
CAS-GAN for Contrast-free Angiography Synthesis
von: Huang, De-Xing, et al.
Veröffentlicht: (2024) -
DOMAIN: MilDly COnservative Model-BAsed OfflINe Reinforcement Learning
von: Liu, Xiao-Yin, et al.
Veröffentlicht: (2023)