Gespeichert in:
| Hauptverfasser: | Wang, Haomin, Wei, Qi, Ma, Qianli, Ding, Shengyuan, Yin, Jinhui, Chen, Kai, Zhang, Hongjie |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2026
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2603.16189 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
InternSVG: Towards Unified SVG Tasks with Multimodal Large Language Models
von: Wang, Haomin, et al.
Veröffentlicht: (2025)
von: Wang, Haomin, et al.
Veröffentlicht: (2025)
Reason-SVG: Enhancing Structured Reasoning for Vector Graphics Generation with Reinforcement Learning
von: Xing, Ximing, et al.
Veröffentlicht: (2025)
von: Xing, Ximing, et al.
Veröffentlicht: (2025)
WildSVG: Towards Reliable SVG Generation Under Real-Word Conditions
von: Terral, Marco, et al.
Veröffentlicht: (2026)
von: Terral, Marco, et al.
Veröffentlicht: (2026)
CraftSVG: Multi-Object Text-to-SVG Synthesis via Layout Guided Diffusion
von: Banerjee, Ayan, et al.
Veröffentlicht: (2024)
von: Banerjee, Ayan, et al.
Veröffentlicht: (2024)
Decouple-Then-Merge: Finetune Diffusion Models as Multi-Task Learning
von: Ma, Qianli, et al.
Veröffentlicht: (2024)
von: Ma, Qianli, et al.
Veröffentlicht: (2024)
RoboSVG: A Unified Framework for Interactive SVG Generation with Multi-modal Guidance
von: Wang, Jiuniu, et al.
Veröffentlicht: (2025)
von: Wang, Jiuniu, et al.
Veröffentlicht: (2025)
MIRG-RL: Multi-Image Reasoning and Grounding with Reinforcement Learning
von: Zheng, Lihao, et al.
Veröffentlicht: (2025)
von: Zheng, Lihao, et al.
Veröffentlicht: (2025)
LiveSVG: Zero-Shot SVG Animation via Video Generation
von: Levy, Matan, et al.
Veröffentlicht: (2026)
von: Levy, Matan, et al.
Veröffentlicht: (2026)
InternLM-XComposer2.5-Reward: A Simple Yet Effective Multi-Modal Reward Model
von: Zang, Yuhang, et al.
Veröffentlicht: (2025)
von: Zang, Yuhang, et al.
Veröffentlicht: (2025)
SVGThinker: Instruction-Aligned and Reasoning-Driven Text-to-SVG Generation
von: Chen, Hanqi, et al.
Veröffentlicht: (2025)
von: Chen, Hanqi, et al.
Veröffentlicht: (2025)
IntroSVG: Learning from Rendering Feedback for Text-to-SVG Generation via an Introspective Generator-Critic Framework
von: Wang, Feiyu, et al.
Veröffentlicht: (2026)
von: Wang, Feiyu, et al.
Veröffentlicht: (2026)
RewardMap: Tackling Sparse Rewards in Fine-grained Visual Reasoning via Multi-Stage Reinforcement Learning
von: Feng, Sicheng, et al.
Veröffentlicht: (2025)
von: Feng, Sicheng, et al.
Veröffentlicht: (2025)
OmniSVG: A Unified Scalable Vector Graphics Generation Model
von: Yang, Yiying, et al.
Veröffentlicht: (2025)
von: Yang, Yiying, et al.
Veröffentlicht: (2025)
MSRL: Scaling Generative Multimodal Reward Modeling via Multi-Stage Reinforcement Learning
von: Wang, Chenglong, et al.
Veröffentlicht: (2026)
von: Wang, Chenglong, et al.
Veröffentlicht: (2026)
ARM-Thinker: Reinforcing Multimodal Generative Reward Models with Agentic Tool Use and Visual Reasoning
von: Ding, Shengyuan, et al.
Veröffentlicht: (2025)
von: Ding, Shengyuan, et al.
Veröffentlicht: (2025)
SVGenius: Benchmarking LLMs in SVG Understanding, Editing and Generation
von: Chen, Siqi, et al.
Veröffentlicht: (2025)
von: Chen, Siqi, et al.
Veröffentlicht: (2025)
DuetSVG: Unified Multimodal SVG Generation with Internal Visual Guidance
von: Zhang, Peiying, et al.
Veröffentlicht: (2025)
von: Zhang, Peiying, et al.
Veröffentlicht: (2025)
Trust Your Critic: Robust Reward Modeling and Reinforcement Learning for Faithful Image Editing and Generation
von: Zhao, Xiangyu, et al.
Veröffentlicht: (2026)
von: Zhao, Xiangyu, et al.
Veröffentlicht: (2026)
AmodalSVG: Amodal Image Vectorization via Semantic Layer Peeling
von: Hu, Juncheng, et al.
Veröffentlicht: (2026)
von: Hu, Juncheng, et al.
Veröffentlicht: (2026)
AD-FM: Multimodal LLMs for Anomaly Detection via Multi-Stage Reasoning and Fine-Grained Reward Optimization
von: Liao, Jingyi, et al.
Veröffentlicht: (2025)
von: Liao, Jingyi, et al.
Veröffentlicht: (2025)
SVG: 3D Stereoscopic Video Generation via Denoising Frame Matrix
von: Dai, Peng, et al.
Veröffentlicht: (2024)
von: Dai, Peng, et al.
Veröffentlicht: (2024)
Reliable Multi-Modal Object Re-Identification via Modality-Aware Graph Reasoning
von: Wan, Xixi, et al.
Veröffentlicht: (2025)
von: Wan, Xixi, et al.
Veröffentlicht: (2025)
MedSAM-Agent: Empowering Interactive Medical Image Segmentation with Multi-turn Agentic Reinforcement Learning
von: Liu, Shengyuan, et al.
Veröffentlicht: (2026)
von: Liu, Shengyuan, et al.
Veröffentlicht: (2026)
InternVL-U: Democratizing Unified Multimodal Models for Understanding, Reasoning, Generation and Editing
von: Tian, Changyao, et al.
Veröffentlicht: (2026)
von: Tian, Changyao, et al.
Veröffentlicht: (2026)
T-SVG: Text-Driven Stereoscopic Video Generation
von: Jin, Qiao, et al.
Veröffentlicht: (2024)
von: Jin, Qiao, et al.
Veröffentlicht: (2024)
Improving the Reasoning of Multi-Image Grounding in MLLMs via Reinforcement Learning
von: Zhang, Bob, et al.
Veröffentlicht: (2025)
von: Zhang, Bob, et al.
Veröffentlicht: (2025)
LayerTracer: Cognitive-Aligned Layered SVG Synthesis via Diffusion Transformer
von: Song, Yiren, et al.
Veröffentlicht: (2025)
von: Song, Yiren, et al.
Veröffentlicht: (2025)
OneReward: Unified Mask-Guided Image Generation via Multi-Task Human Preference Learning
von: Gong, Yuan, et al.
Veröffentlicht: (2025)
von: Gong, Yuan, et al.
Veröffentlicht: (2025)
MedAtlas: Evaluating LLMs for Multi-Round, Multi-Task Medical Reasoning Across Diverse Imaging Modalities and Clinical Text
von: Xu, Ronghao, et al.
Veröffentlicht: (2025)
von: Xu, Ronghao, et al.
Veröffentlicht: (2025)
OmniAlpha: Aligning Transparency-Aware Generation via Multi-Task Unified Reinforcement Learning
von: Yu, Hao, et al.
Veröffentlicht: (2025)
von: Yu, Hao, et al.
Veröffentlicht: (2025)
Adaptive Reinforcement for Open-ended Medical Reasoning via Semantic-Guided Reward Collapse Mitigation
von: Liu, Yizhou, et al.
Veröffentlicht: (2025)
von: Liu, Yizhou, et al.
Veröffentlicht: (2025)
MOSS-ChatV: Reinforcement Learning with Process Reasoning Reward for Video Temporal Reasoning
von: Tao, Sicheng, et al.
Veröffentlicht: (2025)
von: Tao, Sicheng, et al.
Veröffentlicht: (2025)
Visual-ERM: Reward Modeling for Visual Equivalence
von: Liu, Ziyu, et al.
Veröffentlicht: (2026)
von: Liu, Ziyu, et al.
Veröffentlicht: (2026)
Saliency-R1: Enforcing Interpretable and Faithful Vision-language Reasoning via Saliency-map Alignment Reward
von: Gong, Shizhan, et al.
Veröffentlicht: (2026)
von: Gong, Shizhan, et al.
Veröffentlicht: (2026)
Multi-Granularity Reasoning for Image Quality Assessment via Attribute-Aware Reinforcement Learning to Rank
von: Chen, Xiangyong, et al.
Veröffentlicht: (2026)
von: Chen, Xiangyong, et al.
Veröffentlicht: (2026)
Deep But Reliable: Advancing Multi-turn Reasoning for Thinking with Images
von: Yang, Wenhao, et al.
Veröffentlicht: (2025)
von: Yang, Wenhao, et al.
Veröffentlicht: (2025)
Reinforcement Learning Tuning for VideoLLMs: Reward Design and Data Efficiency
von: Li, Hongyu, et al.
Veröffentlicht: (2025)
von: Li, Hongyu, et al.
Veröffentlicht: (2025)
Parrot: Pareto-optimal Multi-Reward Reinforcement Learning Framework for Text-to-Image Generation
von: Lee, Seung Hyun, et al.
Veröffentlicht: (2024)
von: Lee, Seung Hyun, et al.
Veröffentlicht: (2024)
DeepAudio-V1:Towards Multi-Modal Multi-Stage End-to-End Video to Speech and Audio Generation
von: Zhang, Haomin, et al.
Veröffentlicht: (2025)
von: Zhang, Haomin, et al.
Veröffentlicht: (2025)
High-Resolution Visual Reasoning via Multi-Turn Grounding-Based Reinforcement Learning
von: Huang, Xinyu, et al.
Veröffentlicht: (2025)
von: Huang, Xinyu, et al.
Veröffentlicht: (2025)
Ähnliche Einträge
-
InternSVG: Towards Unified SVG Tasks with Multimodal Large Language Models
von: Wang, Haomin, et al.
Veröffentlicht: (2025) -
Reason-SVG: Enhancing Structured Reasoning for Vector Graphics Generation with Reinforcement Learning
von: Xing, Ximing, et al.
Veröffentlicht: (2025) -
WildSVG: Towards Reliable SVG Generation Under Real-Word Conditions
von: Terral, Marco, et al.
Veröffentlicht: (2026) -
CraftSVG: Multi-Object Text-to-SVG Synthesis via Layout Guided Diffusion
von: Banerjee, Ayan, et al.
Veröffentlicht: (2024) -
Decouple-Then-Merge: Finetune Diffusion Models as Multi-Task Learning
von: Ma, Qianli, et al.
Veröffentlicht: (2024)