:: Library Catalog

Copertina

Salvato in:

Dettagli Bibliografici
Autori principali:	Wang, Jing, Liang, Jiajun, Liu, Jie, Liu, Henglin, Liu, Gongye, Zheng, Jun, Pang, Wanyuan, Ma, Ao, Xie, Zhenyu, Wang, Xintao, Wang, Meng, Wan, Pengfei, Liang, Xiaodan
Natura:	Preprint
Pubblicazione:	2025
Soggetti:	Computer Vision and Pattern Recognition Machine Learning
Accesso online:	https://arxiv.org/abs/2510.22319
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Documenti analoghi

Flow-GRPO: Training Flow Matching Models via Online RL
di: Liu, Jie, et al.
Pubblicazione: (2025)

DiverseGRPO: Mitigating Mode Collapse in Image Generation via Diversity-Aware GRPO
di: Liu, Henglin, et al.
Pubblicazione: (2025)

VR-Thinker: Boosting Video Reward Models through Thinking-with-Image Reasoning
di: Wang, Qunzhong, et al.
Pubblicazione: (2025)

Improving Video Generation with Human Feedback
di: Liu, Jie, et al.
Pubblicazione: (2025)

GARDO: Reinforcing Diffusion Models without Reward Hacking
di: He, Haoran, et al.
Pubblicazione: (2025)

LithoGRPO: Fast Inverse Lithography via GRPO Reinforced Flow Matching
di: Lai, Yao, et al.
Pubblicazione: (2026)

Think, then Score: Decoupled Reasoning and Scoring for Video Reward Modeling
di: Wang, Yuan, et al.
Pubblicazione: (2026)

Stepwise Credit Assignment for GRPO on Flow-Matching Models
di: Savani, Yash, et al.
Pubblicazione: (2026)

Scaling Image and Video Generation via Test-Time Evolutionary Search
di: He, Haoran, et al.
Pubblicazione: (2025)

AdaViewPlanner: Adapting Video Diffusion Models for Viewpoint Planning in 4D Scenes
di: Li, Yu, et al.
Pubblicazione: (2025)

Adaptive-Boundary-Clipping GRPO: Ensuring Bounded Ratios for Stable and Generalizable Training
di: Liu, Chi, et al.
Pubblicazione: (2026)

AlignMiF: Geometry-Aligned Multimodal Implicit Field for LiDAR-Camera Joint Synthesis
di: Tang, Tao, et al.
Pubblicazione: (2024)

DenseGRPO: From Sparse to Dense Reward for Flow Matching Model Alignment
di: Deng, Haoyou, et al.
Pubblicazione: (2026)

InjecGuard: Benchmarking and Mitigating Over-defense in Prompt Injection Guardrail Models
di: Li, Hao, et al.
Pubblicazione: (2024)

Smart-GRPO: Smartly Sampling Noise for Efficient RL of Flow-Matching Models
di: Yu, Benjamin, et al.
Pubblicazione: (2025)

Implicit Hierarchical GRPO: Decoupling Tool Invocation from Execution for Tool-Integrated Mathematical Reasoning
di: Wang, Li, et al.
Pubblicazione: (2026)

OP-GRPO: Efficient Off-Policy GRPO for Flow-Matching Models
di: Zhang, Liyu, et al.
Pubblicazione: (2026)

DIVA-GRPO: Enhancing Multimodal Reasoning through Difficulty-Adaptive Variant Advantage
di: Gao, Haowen, et al.
Pubblicazione: (2026)

CineScene: Implicit 3D as Effective Scene Representation for Cinematic Video Generation
di: Huang, Kaiyi, et al.
Pubblicazione: (2026)

Endoscopic Mucosal Resection Using an Over‐the‐Scope Clip for Duodenal Neuroendocrine Tumors: A Promising Method
di: Yi‐Heng Yao, et al.
Pubblicazione: (2025)

StyleCrafter: Enhancing Stylized Text-to-Video Generation with Style Adapter
di: Liu, Gongye, et al.
Pubblicazione: (2023)

Online Reward-Weighted Fine-Tuning of Flow Matching with Wasserstein Regularization
di: Fan, Jiajun, et al.
Pubblicazione: (2025)

VOILA: Complexity-Aware Universal Segmentation of CT images by Voxel Interacting with Language
di: Wan, Zishuo, et al.
Pubblicazione: (2025)

Simulating the Visual World with Artificial Intelligence: A Roadmap
di: Yue, Jingtong, et al.
Pubblicazione: (2025)

GameFactory: Creating New Games with Generative Interactive Videos
di: Yu, Jiwen, et al.
Pubblicazione: (2025)

UniMMVSR: A Unified Multi-Modal Framework for Cascaded Video Super-Resolution
di: Du, Shian, et al.
Pubblicazione: (2025)

OmniX: From Unified Panoramic Generation and Perception to Graphics-Ready 3D Scenes
di: Huang, Yukun, et al.
Pubblicazione: (2025)

Design and Optimization of a Radial Magnetic Flux Array‐Type Wireless Charging Coupler
di: Dan Chen, et al.
Pubblicazione: (2026)

AMIR-GRPO: Inducing Implicit Preference Signals into GRPO
di: Yari, Amir Hossein, et al.
Pubblicazione: (2026)

ClipGStream: Clip-Stream Gaussian Splatting for Any Length and Any Motion Multi-View Dynamic Scene Reconstruction
di: Liang, Jie, et al.
Pubblicazione: (2026)

Geometry-Aware Implicit Memory for Video World Models
di: Wei, Zhengxuan, et al.
Pubblicazione: (2026)

FlowSE-GRPO: Training Flow Matching Speech Enhancement via Online Reinforcement Learning
di: Wang, Haoxu, et al.
Pubblicazione: (2026)

CycleFlow: Leveraging Cycle Consistency in Flow Matching for Speaker Style Adaptation
di: Liang, Ziqi, et al.
Pubblicazione: (2025)

MENTOR: A Metacognition-Driven Self-Evolution Framework for Uncovering and Mitigating Implicit Domain Risks in LLMs
di: Shan, Liang, et al.
Pubblicazione: (2025)

GIFT: Group-Relative Implicit Fine-Tuning Integrates GRPO with DPO and UNA
di: Wang, Zhichao
Pubblicazione: (2025)

To Clip or not to Clip: the Dynamics of SGD with Gradient Clipping in High-Dimensions
di: Marshall, Noah, et al.
Pubblicazione: (2024)

Optimization of Pipeline Leakage Detection System in Utility Tunnel Based on Finite Element Method
di: Yongli Liu, et al.
Pubblicazione: (2024)

DanceGRPO: Unleashing GRPO on Visual Generation
di: Xue, Zeyue, et al.
Pubblicazione: (2025)

$λ$-GRPO: Unifying the GRPO Frameworks with Learnable Token Preferences
di: Wang, Yining, et al.
Pubblicazione: (2025)

Stable Velocity: A Variance Perspective on Flow Matching
di: Yang, Donglin, et al.
Pubblicazione: (2026)