Salvato in:
| Autori principali: | Zhang, Xinshen, Ye, Zhen, Zheng, Xu |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2025
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2505.14197 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
Omnidirectional Spatial Modeling from Correlated Panoramas
di: Zhang, Xinshen, et al.
Pubblicazione: (2025)
di: Zhang, Xinshen, et al.
Pubblicazione: (2025)
360VFI: A Dataset and Benchmark for Omnidirectional Video Frame Interpolation
di: Lu, Wenxuan, et al.
Pubblicazione: (2024)
di: Lu, Wenxuan, et al.
Pubblicazione: (2024)
EARL: Towards a Unified Analysis-Guided Reinforcement Learning Framework for Egocentric Interaction Reasoning and Pixel Grounding
di: Su, Yuejiao, et al.
Pubblicazione: (2026)
di: Su, Yuejiao, et al.
Pubblicazione: (2026)
360Loc: A Dataset and Benchmark for Omnidirectional Visual Localization with Cross-device Queries
di: Huang, Huajian, et al.
Pubblicazione: (2023)
di: Huang, Huajian, et al.
Pubblicazione: (2023)
Dense360: Dense Understanding from Omnidirectional Panoramas
di: Zhou, Yikang, et al.
Pubblicazione: (2025)
di: Zhou, Yikang, et al.
Pubblicazione: (2025)
360VOTS: Visual Object Tracking and Segmentation in Omnidirectional Videos
di: Xu, Yinzhe, et al.
Pubblicazione: (2024)
di: Xu, Yinzhe, et al.
Pubblicazione: (2024)
Seam360GS: Seamless 360° Gaussian Splatting from Real-World Omnidirectional Images
di: Shin, Changha, et al.
Pubblicazione: (2025)
di: Shin, Changha, et al.
Pubblicazione: (2025)
Robust and Flexible Omnidirectional Depth Estimation with Multiple 360-degree Cameras
di: Li, Ming, et al.
Pubblicazione: (2024)
di: Li, Ming, et al.
Pubblicazione: (2024)
Are Multimodal Large Language Models Ready for Omnidirectional Spatial Reasoning?
di: Dongfang, Zihao, et al.
Pubblicazione: (2025)
di: Dongfang, Zihao, et al.
Pubblicazione: (2025)
TSalV360: A Method and Dataset for Text-driven Saliency Detection in 360-Degrees Videos
di: Kontostathis, Ioannis, et al.
Pubblicazione: (2025)
di: Kontostathis, Ioannis, et al.
Pubblicazione: (2025)
Pose-Free Omnidirectional Gaussian Splatting for 360-Degree Videos with Consistent Depth Priors
di: Zhuang, Chuanqing, et al.
Pubblicazione: (2026)
di: Zhuang, Chuanqing, et al.
Pubblicazione: (2026)
Underwater360: Reconstructing Underwater Scenes from Panoramic Images with Omnidirectional Gaussian Splatting
di: Hu, Jiangbei, et al.
Pubblicazione: (2026)
di: Hu, Jiangbei, et al.
Pubblicazione: (2026)
TreeGRPO: Tree-Advantage GRPO for Online RL Post-Training of Diffusion Models
di: Ding, Zheng, et al.
Pubblicazione: (2025)
di: Ding, Zheng, et al.
Pubblicazione: (2025)
OB3D: A New Dataset for Benchmarking Omnidirectional 3D Reconstruction Using Blender
di: Ito, Shintaro, et al.
Pubblicazione: (2025)
di: Ito, Shintaro, et al.
Pubblicazione: (2025)
ArgusCogito: Chain-of-Thought for Cross-Modal Synergy and Omnidirectional Reasoning in Camouflaged Object Segmentation
di: Tan, Jianwen, et al.
Pubblicazione: (2025)
di: Tan, Jianwen, et al.
Pubblicazione: (2025)
AnomalyR1: A GRPO-based End-to-end MLLM for Industrial Anomaly Detection
di: Chao, Yuhao, et al.
Pubblicazione: (2025)
di: Chao, Yuhao, et al.
Pubblicazione: (2025)
Advancing Adaptive Multi-Stage Video Anomaly Reasoning: A Benchmark Dataset and Method
di: Huang, Chao, et al.
Pubblicazione: (2026)
di: Huang, Chao, et al.
Pubblicazione: (2026)
UniGRPO: Unified Policy Optimization for Reasoning-Driven Visual Generation
di: Liu, Jie, et al.
Pubblicazione: (2026)
di: Liu, Jie, et al.
Pubblicazione: (2026)
Image Aesthetic Reasoning via HCM-GRPO: Empowering Compact Model for Superior Performance
di: Hu, Zhiyuan, et al.
Pubblicazione: (2025)
di: Hu, Zhiyuan, et al.
Pubblicazione: (2025)
CTForensics: A Comprehensive Dataset and Method for AI-Generated CT Image Detection
di: Li, Yiheng, et al.
Pubblicazione: (2026)
di: Li, Yiheng, et al.
Pubblicazione: (2026)
UAV-VL-R1: Generalizing Vision-Language Models via Supervised Fine-Tuning and Multi-Stage GRPO for UAV Visual Reasoning
di: Guan, Jiajin, et al.
Pubblicazione: (2025)
di: Guan, Jiajin, et al.
Pubblicazione: (2025)
ORMOT: A Dataset and Framework for Omnidirectional Referring Multi-Object Tracking
di: Chen, Sijia, et al.
Pubblicazione: (2026)
di: Chen, Sijia, et al.
Pubblicazione: (2026)
Boosting MLLM Reasoning with Text-Debiased Hint-GRPO
di: Huang, Qihan, et al.
Pubblicazione: (2025)
di: Huang, Qihan, et al.
Pubblicazione: (2025)
SportR: A Benchmark for Multimodal Large Language Model Reasoning in Sports
di: Xia, Haotian, et al.
Pubblicazione: (2025)
di: Xia, Haotian, et al.
Pubblicazione: (2025)
Max360IQ: Blind Omnidirectional Image Quality Assessment with Multi-axis Attention
di: Yan, Jiebin, et al.
Pubblicazione: (2025)
di: Yan, Jiebin, et al.
Pubblicazione: (2025)
Syn-GRPO: Self-Evolving Data Synthesis for MLLM Perception Reasoning
di: Huang, Qihan, et al.
Pubblicazione: (2025)
di: Huang, Qihan, et al.
Pubblicazione: (2025)
DanceGRPO: Unleashing GRPO on Visual Generation
di: Xue, Zeyue, et al.
Pubblicazione: (2025)
di: Xue, Zeyue, et al.
Pubblicazione: (2025)
DiffPortrait360: Consistent Portrait Diffusion for 360 View Synthesis
di: Gu, Yuming, et al.
Pubblicazione: (2025)
di: Gu, Yuming, et al.
Pubblicazione: (2025)
Dur360BEV: A Real-world 360-degree Single Camera Dataset and Benchmark for Bird-Eye View Mapping in Autonomous Driving
di: E, Wenke, et al.
Pubblicazione: (2025)
di: E, Wenke, et al.
Pubblicazione: (2025)
SketchThinker-R1: Towards Efficient Sketch-Style Reasoning in Large Multimodal Models
di: Zhang, Ruiyang, et al.
Pubblicazione: (2026)
di: Zhang, Ruiyang, et al.
Pubblicazione: (2026)
nuReasoning: A Reasoning-Centric Dataset and Benchmark for Long-Tail Autonomous Driving
di: Huang, Zhiyu, et al.
Pubblicazione: (2026)
di: Huang, Zhiyu, et al.
Pubblicazione: (2026)
Splatter-360: Generalizable 360$^{\circ}$ Gaussian Splatting for Wide-baseline Panoramic Images
di: Chen, Zheng, et al.
Pubblicazione: (2024)
di: Chen, Zheng, et al.
Pubblicazione: (2024)
360SFUDA++: Towards Source-free UDA for Panoramic Segmentation by Learning Reliable Category Prototypes
di: Zheng, Xu, et al.
Pubblicazione: (2024)
di: Zheng, Xu, et al.
Pubblicazione: (2024)
Pref-GRPO: Pairwise Preference Reward-based GRPO for Stable Text-to-Image Reinforcement Learning
di: Wang, Yibin, et al.
Pubblicazione: (2025)
di: Wang, Yibin, et al.
Pubblicazione: (2025)
OP-GRPO: Efficient Off-Policy GRPO for Flow-Matching Models
di: Zhang, Liyu, et al.
Pubblicazione: (2026)
di: Zhang, Liyu, et al.
Pubblicazione: (2026)
TempFlow-GRPO: When Timing Matters for GRPO in Flow Models
di: He, Xiaoxuan, et al.
Pubblicazione: (2025)
di: He, Xiaoxuan, et al.
Pubblicazione: (2025)
MVSplat360: Feed-Forward 360 Scene Synthesis from Sparse Views
di: Chen, Yuedong, et al.
Pubblicazione: (2024)
di: Chen, Yuedong, et al.
Pubblicazione: (2024)
GRPO-RM: Fine-Tuning Representation Models via GRPO-Driven Reinforcement Learning
di: Xu, Yanchen, et al.
Pubblicazione: (2025)
di: Xu, Yanchen, et al.
Pubblicazione: (2025)
R1-ShareVL: Incentivizing Reasoning Capability of Multimodal Large Language Models via Share-GRPO
di: Yao, Huanjin, et al.
Pubblicazione: (2025)
di: Yao, Huanjin, et al.
Pubblicazione: (2025)
Towards Small Object Editing: A Benchmark Dataset and A Training-Free Approach
di: Pan, Qihe, et al.
Pubblicazione: (2024)
di: Pan, Qihe, et al.
Pubblicazione: (2024)
Documenti analoghi
-
Omnidirectional Spatial Modeling from Correlated Panoramas
di: Zhang, Xinshen, et al.
Pubblicazione: (2025) -
360VFI: A Dataset and Benchmark for Omnidirectional Video Frame Interpolation
di: Lu, Wenxuan, et al.
Pubblicazione: (2024) -
EARL: Towards a Unified Analysis-Guided Reinforcement Learning Framework for Egocentric Interaction Reasoning and Pixel Grounding
di: Su, Yuejiao, et al.
Pubblicazione: (2026) -
360Loc: A Dataset and Benchmark for Omnidirectional Visual Localization with Cross-device Queries
di: Huang, Huajian, et al.
Pubblicazione: (2023) -
Dense360: Dense Understanding from Omnidirectional Panoramas
di: Zhou, Yikang, et al.
Pubblicazione: (2025)