Salvato in:
| Autori principali: | Wang, Jing, Liang, Jiajun, Liu, Jie, Liu, Henglin, Liu, Gongye, Zheng, Jun, Pang, Wanyuan, Ma, Ao, Xie, Zhenyu, Wang, Xintao, Wang, Meng, Wan, Pengfei, Liang, Xiaodan |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2025
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2510.22319 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
Flow-GRPO: Training Flow Matching Models via Online RL
di: Liu, Jie, et al.
Pubblicazione: (2025)
di: Liu, Jie, et al.
Pubblicazione: (2025)
DiverseGRPO: Mitigating Mode Collapse in Image Generation via Diversity-Aware GRPO
di: Liu, Henglin, et al.
Pubblicazione: (2025)
di: Liu, Henglin, et al.
Pubblicazione: (2025)
VR-Thinker: Boosting Video Reward Models through Thinking-with-Image Reasoning
di: Wang, Qunzhong, et al.
Pubblicazione: (2025)
di: Wang, Qunzhong, et al.
Pubblicazione: (2025)
Improving Video Generation with Human Feedback
di: Liu, Jie, et al.
Pubblicazione: (2025)
di: Liu, Jie, et al.
Pubblicazione: (2025)
GARDO: Reinforcing Diffusion Models without Reward Hacking
di: He, Haoran, et al.
Pubblicazione: (2025)
di: He, Haoran, et al.
Pubblicazione: (2025)
LithoGRPO: Fast Inverse Lithography via GRPO Reinforced Flow Matching
di: Lai, Yao, et al.
Pubblicazione: (2026)
di: Lai, Yao, et al.
Pubblicazione: (2026)
Think, then Score: Decoupled Reasoning and Scoring for Video Reward Modeling
di: Wang, Yuan, et al.
Pubblicazione: (2026)
di: Wang, Yuan, et al.
Pubblicazione: (2026)
Stepwise Credit Assignment for GRPO on Flow-Matching Models
di: Savani, Yash, et al.
Pubblicazione: (2026)
di: Savani, Yash, et al.
Pubblicazione: (2026)
Scaling Image and Video Generation via Test-Time Evolutionary Search
di: He, Haoran, et al.
Pubblicazione: (2025)
di: He, Haoran, et al.
Pubblicazione: (2025)
AdaViewPlanner: Adapting Video Diffusion Models for Viewpoint Planning in 4D Scenes
di: Li, Yu, et al.
Pubblicazione: (2025)
di: Li, Yu, et al.
Pubblicazione: (2025)
Adaptive-Boundary-Clipping GRPO: Ensuring Bounded Ratios for Stable and Generalizable Training
di: Liu, Chi, et al.
Pubblicazione: (2026)
di: Liu, Chi, et al.
Pubblicazione: (2026)
AlignMiF: Geometry-Aligned Multimodal Implicit Field for LiDAR-Camera Joint Synthesis
di: Tang, Tao, et al.
Pubblicazione: (2024)
di: Tang, Tao, et al.
Pubblicazione: (2024)
DenseGRPO: From Sparse to Dense Reward for Flow Matching Model Alignment
di: Deng, Haoyou, et al.
Pubblicazione: (2026)
di: Deng, Haoyou, et al.
Pubblicazione: (2026)
InjecGuard: Benchmarking and Mitigating Over-defense in Prompt Injection Guardrail Models
di: Li, Hao, et al.
Pubblicazione: (2024)
di: Li, Hao, et al.
Pubblicazione: (2024)
Smart-GRPO: Smartly Sampling Noise for Efficient RL of Flow-Matching Models
di: Yu, Benjamin, et al.
Pubblicazione: (2025)
di: Yu, Benjamin, et al.
Pubblicazione: (2025)
Implicit Hierarchical GRPO: Decoupling Tool Invocation from Execution for Tool-Integrated Mathematical Reasoning
di: Wang, Li, et al.
Pubblicazione: (2026)
di: Wang, Li, et al.
Pubblicazione: (2026)
OP-GRPO: Efficient Off-Policy GRPO for Flow-Matching Models
di: Zhang, Liyu, et al.
Pubblicazione: (2026)
di: Zhang, Liyu, et al.
Pubblicazione: (2026)
DIVA-GRPO: Enhancing Multimodal Reasoning through Difficulty-Adaptive Variant Advantage
di: Gao, Haowen, et al.
Pubblicazione: (2026)
di: Gao, Haowen, et al.
Pubblicazione: (2026)
CineScene: Implicit 3D as Effective Scene Representation for Cinematic Video Generation
di: Huang, Kaiyi, et al.
Pubblicazione: (2026)
di: Huang, Kaiyi, et al.
Pubblicazione: (2026)
Endoscopic Mucosal Resection Using an Over‐the‐Scope Clip for Duodenal Neuroendocrine Tumors: A Promising Method
di: Yi‐Heng Yao, et al.
Pubblicazione: (2025)
di: Yi‐Heng Yao, et al.
Pubblicazione: (2025)
StyleCrafter: Enhancing Stylized Text-to-Video Generation with Style Adapter
di: Liu, Gongye, et al.
Pubblicazione: (2023)
di: Liu, Gongye, et al.
Pubblicazione: (2023)
Online Reward-Weighted Fine-Tuning of Flow Matching with Wasserstein Regularization
di: Fan, Jiajun, et al.
Pubblicazione: (2025)
di: Fan, Jiajun, et al.
Pubblicazione: (2025)
VOILA: Complexity-Aware Universal Segmentation of CT images by Voxel Interacting with Language
di: Wan, Zishuo, et al.
Pubblicazione: (2025)
di: Wan, Zishuo, et al.
Pubblicazione: (2025)
Simulating the Visual World with Artificial Intelligence: A Roadmap
di: Yue, Jingtong, et al.
Pubblicazione: (2025)
di: Yue, Jingtong, et al.
Pubblicazione: (2025)
GameFactory: Creating New Games with Generative Interactive Videos
di: Yu, Jiwen, et al.
Pubblicazione: (2025)
di: Yu, Jiwen, et al.
Pubblicazione: (2025)
UniMMVSR: A Unified Multi-Modal Framework for Cascaded Video Super-Resolution
di: Du, Shian, et al.
Pubblicazione: (2025)
di: Du, Shian, et al.
Pubblicazione: (2025)
OmniX: From Unified Panoramic Generation and Perception to Graphics-Ready 3D Scenes
di: Huang, Yukun, et al.
Pubblicazione: (2025)
di: Huang, Yukun, et al.
Pubblicazione: (2025)
Design and Optimization of a Radial Magnetic Flux Array‐Type Wireless Charging Coupler
di: Dan Chen, et al.
Pubblicazione: (2026)
di: Dan Chen, et al.
Pubblicazione: (2026)
AMIR-GRPO: Inducing Implicit Preference Signals into GRPO
di: Yari, Amir Hossein, et al.
Pubblicazione: (2026)
di: Yari, Amir Hossein, et al.
Pubblicazione: (2026)
ClipGStream: Clip-Stream Gaussian Splatting for Any Length and Any Motion Multi-View Dynamic Scene Reconstruction
di: Liang, Jie, et al.
Pubblicazione: (2026)
di: Liang, Jie, et al.
Pubblicazione: (2026)
Geometry-Aware Implicit Memory for Video World Models
di: Wei, Zhengxuan, et al.
Pubblicazione: (2026)
di: Wei, Zhengxuan, et al.
Pubblicazione: (2026)
FlowSE-GRPO: Training Flow Matching Speech Enhancement via Online Reinforcement Learning
di: Wang, Haoxu, et al.
Pubblicazione: (2026)
di: Wang, Haoxu, et al.
Pubblicazione: (2026)
CycleFlow: Leveraging Cycle Consistency in Flow Matching for Speaker Style Adaptation
di: Liang, Ziqi, et al.
Pubblicazione: (2025)
di: Liang, Ziqi, et al.
Pubblicazione: (2025)
MENTOR: A Metacognition-Driven Self-Evolution Framework for Uncovering and Mitigating Implicit Domain Risks in LLMs
di: Shan, Liang, et al.
Pubblicazione: (2025)
di: Shan, Liang, et al.
Pubblicazione: (2025)
GIFT: Group-Relative Implicit Fine-Tuning Integrates GRPO with DPO and UNA
di: Wang, Zhichao
Pubblicazione: (2025)
di: Wang, Zhichao
Pubblicazione: (2025)
To Clip or not to Clip: the Dynamics of SGD with Gradient Clipping in High-Dimensions
di: Marshall, Noah, et al.
Pubblicazione: (2024)
di: Marshall, Noah, et al.
Pubblicazione: (2024)
Optimization of Pipeline Leakage Detection System in Utility Tunnel Based on Finite Element Method
di: Yongli Liu, et al.
Pubblicazione: (2024)
di: Yongli Liu, et al.
Pubblicazione: (2024)
DanceGRPO: Unleashing GRPO on Visual Generation
di: Xue, Zeyue, et al.
Pubblicazione: (2025)
di: Xue, Zeyue, et al.
Pubblicazione: (2025)
$λ$-GRPO: Unifying the GRPO Frameworks with Learnable Token Preferences
di: Wang, Yining, et al.
Pubblicazione: (2025)
di: Wang, Yining, et al.
Pubblicazione: (2025)
Stable Velocity: A Variance Perspective on Flow Matching
di: Yang, Donglin, et al.
Pubblicazione: (2026)
di: Yang, Donglin, et al.
Pubblicazione: (2026)
Documenti analoghi
-
Flow-GRPO: Training Flow Matching Models via Online RL
di: Liu, Jie, et al.
Pubblicazione: (2025) -
DiverseGRPO: Mitigating Mode Collapse in Image Generation via Diversity-Aware GRPO
di: Liu, Henglin, et al.
Pubblicazione: (2025) -
VR-Thinker: Boosting Video Reward Models through Thinking-with-Image Reasoning
di: Wang, Qunzhong, et al.
Pubblicazione: (2025) -
Improving Video Generation with Human Feedback
di: Liu, Jie, et al.
Pubblicazione: (2025) -
GARDO: Reinforcing Diffusion Models without Reward Hacking
di: He, Haoran, et al.
Pubblicazione: (2025)