:: Library Catalog

Cover Image

Saved in:

Bibliographic Details
Main Authors:	Wu, Junyu, Chang, Weiming, Liu, Xiaotao, He, Guanyou, Hong, Haoqiang, Liu, Boqi, Tian, Hongtao, Yang, Tao, Shi, Yunsheng, Lin, Feng, Yao, Ting
Format:	Preprint
Published:	2025
Subjects:	Machine Learning Artificial Intelligence
Online Access:	https://arxiv.org/abs/2507.22789
Tags:	Add Tag No Tags, Be the first to tag this record!

Similar Items

WeChat-YATT: A Scalable, Simple, Efficient, and Production Ready Training Library
by: Wu, Junyu, et al.
Published: (2025)

From Faithfulness to Correctness: Generative Reward Models that Think Critically
by: Ma, Qiyao, et al.
Published: (2025)

Learning More with Less: A Dynamic Dual-Level Down-Sampling Framework for Efficient Policy Optimization
by: Wang, Chao, et al.
Published: (2025)

CAPO: Towards Enhancing LLM Reasoning through Generative Credit Assignment
by: Xie, Guofu, et al.
Published: (2025)

LACF Anti-RLHF Pipeline — Methode Infaillible (Heart + Trainer + Burner)
by: Ochej, Stephane
Published: (2026)

OpenRLHF: An Easy-to-use, Scalable and High-performance RLHF Framework
by: Hu, Jian, et al.
Published: (2024)

Bone Soups: A Seek-and-Soup Model Merging Approach for Controllable Multi-Objective Generation
by: Xie, Guofu, et al.
Published: (2025)

Optimization of High-Order Quarter-Wave Plate for Residual Birefringence Suppression in FOCS
by: Liu, Yuechen, et al.
Published: (2025)

Unifying Stable Optimization and Reference Regularization in RLHF
by: He, Li, et al.
Published: (2026)

Train the Trainer.
by: Todaro, Julie Beth
Published: (2002)

Training of Trainers.
by: Douglas, Daphne
Published: (1987)

Train‐The‐Trainer: A Generic Offer‐And‐Use Model for the Development of Trainers
by: Susanne Wisshak, et al.
Published: (2025)

Balanced Actor Initialization: Stable RLHF Training of Distillation-Based Reasoning Models
by: Zheng, Chen, et al.
Published: (2025)

Language Models Learn to Mislead Humans via RLHF
by: Wen, Jiaxin, et al.
Published: (2024)

Mask What Matters: Mitigating Object Hallucinations in Multimodal Large Language Models with Object-Aligned Visual Contrastive Decoding
by: Chen, Boqi, et al.
Published: (2026)

From <Answer> to <Think>: Multidimensional Supervision of Reasoning Process for LLM Optimization
by: Wang, Beining, et al.
Published: (2025)

SCHEME: Scalable Channel Mixer for Vision Transformers
by: Sridhar, Deepak, et al.
Published: (2023)

Equilibrate RLHF: Towards Balancing Helpfulness-Safety Trade-off in Large Language Models
by: Tan, Yingshui, et al.
Published: (2025)

Merge and Guide: Unifying Model Merging and Guided Decoding for Controllable Multi-Objective Generation
by: Xie, Guofu, et al.
Published: (2025)

Towards Data-Centric RLHF: Simple Metrics for Preference Dataset Comparison
by: Shen, Judy Hanwen, et al.
Published: (2024)

DECODE: Domain-aware Continual Domain Expansion for Motion Prediction
by: Li, Boqi, et al.
Published: (2024)

C-Lizenz Fitness Trainer Test
by: Easy Quizzz
Published: (2026)

The Educational Media Specialist: Training the Trainer.
by: Mendrinos, Roxanne Baxter
Published: (1987)

Discriminative Policy Optimization for Token-Level Reward Models
by: Chen, Hongzhan, et al.
Published: (2025)

RubricRL: Simple Generalizable Rewards for Text-to-Image Generation
by: Feng, Xuelu, et al.
Published: (2025)

Ever: Mitigating Hallucination in Large Language Models through Real-Time Verification and Rectification
by: Kang, Haoqiang, et al.
Published: (2023)

Cross-Modal Retrieval for Motion and Text via DropTriple Loss
by: Yan, Sheng, et al.
Published: (2023)

Mitigating the Alignment Tax of RLHF
by: Lin, Yong, et al.
Published: (2023)

AMB-DSGDN: Adaptive Modality-Balanced Dynamic Semantic Graph Differential Network for Multimodal Emotion Recognition
by: Wang, Yunsheng, et al.
Published: (2026)

Flexiffusion: Training-Free Segment-Wise Neural Architecture Search for Efficient Diffusion Models
by: Huang, Hongtao, et al.
Published: (2025)

Flexiffusion: Segment-wise Neural Architecture Search for Flexible Denoising Schedule
by: Huang, Hongtao, et al.
Published: (2024)

Revisiting Greedy Decoding for Visual Question Answering: A Calibration Perspective
by: Chen, Boqi, et al.
Published: (2026)

Generative Denoise Distillation: Simple Stochastic Noises Induce Efficient Knowledge Transfer for Dense Prediction
by: Liu, Zhaoge, et al.
Published: (2024)

A Trainers Guide to Sailing in the Age of Al
by: Alotaibi, Fehaid
Published: (2025)

Strengthening Trainers' Transfer Knowledge: An Intervention Study
by: Alisha Koch, et al.
Published: (2025)

The Impact of Train-the-Trainer Food Safety Education
by: Barret B. Elizabeth, Penner P. Kanner, and Shanklin W. Carol
Published: (1992)

Grandparents and Books. Trainer's Manual. Revised Edition.
by: Wade, Maureen, et al.
Published: (1991)

Community Development Sourcebook for Researchers, Trainers, Librarians.
by: Goldreyer, Annette, Comp.

You Only Look Around: Learning Illumination Invariant Feature for Low-light Object Detection
by: Hong, Mingbo, et al.
Published: (2024)

Efficient Hybrid SE(3)-Equivariant Visuomotor Flow Policy via Spherical Harmonics for Robot Manipulation
by: Zhang, Qinglun, et al.
Published: (2026)