:: Library Catalog

Buchumschlag

Gespeichert in:

Bibliographische Detailangaben
Hauptverfasser:	Li, Hao, Zhou, Xiao-Hu, Li, Shu-Hai, Gui, Mei-Jiang, Xie, Xiao-Liang, Liu, Shi-Qi, Wang, Shuang-Yi, Feng, Zhen-Qiu, Hou, Zeng-Guang
Format:	Preprint
Veröffentlicht:	2023
Schlagworte:	Machine Learning Artificial Intelligence
Online-Zugang:	https://arxiv.org/abs/2310.17245
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Ähnliche Einträge

MICRO: Model-Based Offline Reinforcement Learning with a Conservative Bellman Operator
von: Liu, Xiao-Yin, et al.
Veröffentlicht: (2023)

MOSformer: Momentum encoder-based inter-slice fusion transformer for medical image segmentation
von: Huang, De-Xing, et al.
Veröffentlicht: (2024)

SPIRONet: Spatial-Frequency Learning and Topological Channel Interaction Network for Vessel Segmentation
von: Huang, De-Xing, et al.
Veröffentlicht: (2024)

CAS-GAN for Contrast-free Angiography Synthesis
von: Huang, De-Xing, et al.
Veröffentlicht: (2024)

DOMAIN: MilDly COnservative Model-BAsed OfflINe Reinforcement Learning
von: Liu, Xiao-Yin, et al.
Veröffentlicht: (2023)

LEASE: Offline Preference-based Reinforcement Learning with High Sample Efficiency
von: Liu, Xiao-Yin, et al.
Veröffentlicht: (2024)

VLA Model Post-Training via Action-Chunked PPO and Self Behavior Cloning
von: Wang, Si-Cheng, et al.
Veröffentlicht: (2025)

VasoMIM: Vascular Anatomy-Aware Masked Image Modeling for Vessel Segmentation
von: Huang, De-Xing, et al.
Veröffentlicht: (2025)

Online Adaptation via Dual-Stage Alignment and Self-Supervision for Fast-Calibration Brain-Computer Interfaces
von: Duan, Sheng-Bin, et al.
Veröffentlicht: (2025)

Activity and control of methanol metabolism in the seawaters across the estuary–coast–shelf continuum
von: Guang‐Chao Zhuang, et al.
Veröffentlicht: (2025)

Learning Novel Skills from Language-Generated Demonstrations
von: Jin, Ao-Qun, et al.
Veröffentlicht: (2024)

VLA Model-Expert Collaboration for Bi-directional Manipulation Learning
von: Xiang, Tian-Yu, et al.
Veröffentlicht: (2025)

Task-Oriented Learning for Automatic EEG Denoising
von: Xiang, Tian-Yu, et al.
Veröffentlicht: (2025)

REASON: Probability map-guided dual-branch fusion framework for gastric content assessment
von: Xiao, Nu-Fnag, et al.
Veröffentlicht: (2025)

COSBO: Conservative Offline Simulation-Based Policy Optimization
von: Kargar, Eshagh, et al.
Veröffentlicht: (2024)

CROP: Expert-Aligned Image Cropping via Compositional Reasoning and Optimizing Preference
von: Dong, Zhitong, et al.
Veröffentlicht: (2026)

Parallels Between VLA Model Post-Training and Human Motor Learning: Progress, Challenges, and Trends
von: Xiang, Tian-Yu, et al.
Veröffentlicht: (2025)

Behavior-Regularized Diffusion Policy Optimization for Offline Reinforcement Learning
von: Gao, Chen-Xiao, et al.
Veröffentlicht: (2025)

TRIM26‐Mediated CBX6 Ubiquitination Triggers NETosis to Drive Bladder Cancer Tumor Growth via the CNPY2/NF‐κB Signaling Pathway
von: XiaoJuan Xie, et al.
Veröffentlicht: (2026)

Conservative Offline Robot Policy Learning via Posterior-Transition Reweighting
von: Zhang, Wanpeng, et al.
Veröffentlicht: (2026)

Trajectory-Oriented Policy Optimization with Sparse Rewards
von: Wang, Guojian, et al.
Veröffentlicht: (2024)

Deciphering viscosity‐driven mechanisms governing chaotic flow dynamics and mixing efficiency in micromixers
von: Shi‐Xiao Wei, et al.
Veröffentlicht: (2026)

A Weight-aware-based Multi-source Unsupervised Domain Adaptation Method for Human Motion Intention Recognition
von: Liu, Xiao-Yin, et al.
Veröffentlicht: (2024)

Enhancing Generative Auto-bidding with Offline Reward Evaluation and Policy Search
von: Mou, Zhiyu, et al.
Veröffentlicht: (2025)

Arena as Offline Reward: Efficient Fine-Grained Preference Optimization for Diffusion Models
von: Li, Zhikai, et al.
Veröffentlicht: (2026)

Preferred-Action-Optimized Diffusion Policies for Offline Reinforcement Learning
von: Zhang, Tianle, et al.
Veröffentlicht: (2024)

Landscape Analysis of Simultaneous Blind Deconvolution and Phase Retrieval via Structured Low-Rank Tensor Recovery
von: Liang, Xiao, et al.
Veröffentlicht: (2025)

A Muon-Accelerated Algorithm for Low Separation Rank Tensor Generalized Linear Models
von: Liang, Xiao, et al.
Veröffentlicht: (2026)

CAS-IQA: Teaching Vision-Language Models for Synthetic Angiography Quality Assessment
von: Wang, Bo, et al.
Veröffentlicht: (2025)

Robust Offline Reinforcement learning with Heavy-Tailed Rewards
von: Zhu, Jin, et al.
Veröffentlicht: (2023)

Session-Level Dynamic Ad Load Optimization using Offline Robust Reinforcement Learning
von: Liu, Tao, et al.
Veröffentlicht: (2025)

Optimistic Model Rollouts for Pessimistic Offline Policy Optimization
von: Zhai, Yuanzhao, et al.
Veröffentlicht: (2024)

ROLeR: Effective Reward Shaping in Offline Reinforcement Learning for Recommender Systems
von: Zhang, Yi, et al.
Veröffentlicht: (2024)

Offline Policy Optimization with Posterior Sampling
von: Lin, Hongqiang, et al.
Veröffentlicht: (2026)

Methane concentration and oxidation rate in the Yangtze River Estuary (July 2021) and East China Sea (April 2021)
von: Mao, Shi-Hai, et al.
Veröffentlicht: (2022)

Methane production in the Yangtze River Estuary and East China Sea in 2019/2020
von: Mao, Shi-Hai, et al.
Veröffentlicht: (2022)

Investigation on global and local RTD , mixing, and heat transfer of a high‐throughput passive chaotic microreactor
von: Shi‐Xiao Wei, et al.
Veröffentlicht: (2025)

Dual RNA-Seq Unveils Candidate Key Virulence Genes of at the Early Stage of Infection in Hybrid Grouper (♀ × ♂ ).
von: Zeng, Yan-Hua, et al.
Veröffentlicht: (2024)

Cooper: Co-Optimizing Policy and Reward Models in Reinforcement Learning for Large Language Models
von: Hong, Haitao, et al.
Veröffentlicht: (2025)

Sedum qingyuanense (Crassulaceae), a new species from Qingyuan, Guangdong, China
von: Yi, Xiao-Wei, et al.
Veröffentlicht: (2025)