:: Library Catalog

Copertina

Salvato in:

Dettagli Bibliografici
Autori principali:	Zhang, Xinshen, Ye, Zhen, Zheng, Xu
Natura:	Preprint
Pubblicazione:	2025
Soggetti:	Computer Vision and Pattern Recognition
Accesso online:	https://arxiv.org/abs/2505.14197
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Documenti analoghi

Omnidirectional Spatial Modeling from Correlated Panoramas
di: Zhang, Xinshen, et al.
Pubblicazione: (2025)

360VFI: A Dataset and Benchmark for Omnidirectional Video Frame Interpolation
di: Lu, Wenxuan, et al.
Pubblicazione: (2024)

EARL: Towards a Unified Analysis-Guided Reinforcement Learning Framework for Egocentric Interaction Reasoning and Pixel Grounding
di: Su, Yuejiao, et al.
Pubblicazione: (2026)

360Loc: A Dataset and Benchmark for Omnidirectional Visual Localization with Cross-device Queries
di: Huang, Huajian, et al.
Pubblicazione: (2023)

Dense360: Dense Understanding from Omnidirectional Panoramas
di: Zhou, Yikang, et al.
Pubblicazione: (2025)

360VOTS: Visual Object Tracking and Segmentation in Omnidirectional Videos
di: Xu, Yinzhe, et al.
Pubblicazione: (2024)

Seam360GS: Seamless 360° Gaussian Splatting from Real-World Omnidirectional Images
di: Shin, Changha, et al.
Pubblicazione: (2025)

Robust and Flexible Omnidirectional Depth Estimation with Multiple 360-degree Cameras
di: Li, Ming, et al.
Pubblicazione: (2024)

Are Multimodal Large Language Models Ready for Omnidirectional Spatial Reasoning?
di: Dongfang, Zihao, et al.
Pubblicazione: (2025)

TSalV360: A Method and Dataset for Text-driven Saliency Detection in 360-Degrees Videos
di: Kontostathis, Ioannis, et al.
Pubblicazione: (2025)

Pose-Free Omnidirectional Gaussian Splatting for 360-Degree Videos with Consistent Depth Priors
di: Zhuang, Chuanqing, et al.
Pubblicazione: (2026)

Underwater360: Reconstructing Underwater Scenes from Panoramic Images with Omnidirectional Gaussian Splatting
di: Hu, Jiangbei, et al.
Pubblicazione: (2026)

TreeGRPO: Tree-Advantage GRPO for Online RL Post-Training of Diffusion Models
di: Ding, Zheng, et al.
Pubblicazione: (2025)

OB3D: A New Dataset for Benchmarking Omnidirectional 3D Reconstruction Using Blender
di: Ito, Shintaro, et al.
Pubblicazione: (2025)

ArgusCogito: Chain-of-Thought for Cross-Modal Synergy and Omnidirectional Reasoning in Camouflaged Object Segmentation
di: Tan, Jianwen, et al.
Pubblicazione: (2025)

AnomalyR1: A GRPO-based End-to-end MLLM for Industrial Anomaly Detection
di: Chao, Yuhao, et al.
Pubblicazione: (2025)

Advancing Adaptive Multi-Stage Video Anomaly Reasoning: A Benchmark Dataset and Method
di: Huang, Chao, et al.
Pubblicazione: (2026)

UniGRPO: Unified Policy Optimization for Reasoning-Driven Visual Generation
di: Liu, Jie, et al.
Pubblicazione: (2026)

Image Aesthetic Reasoning via HCM-GRPO: Empowering Compact Model for Superior Performance
di: Hu, Zhiyuan, et al.
Pubblicazione: (2025)

CTForensics: A Comprehensive Dataset and Method for AI-Generated CT Image Detection
di: Li, Yiheng, et al.
Pubblicazione: (2026)

UAV-VL-R1: Generalizing Vision-Language Models via Supervised Fine-Tuning and Multi-Stage GRPO for UAV Visual Reasoning
di: Guan, Jiajin, et al.
Pubblicazione: (2025)

ORMOT: A Dataset and Framework for Omnidirectional Referring Multi-Object Tracking
di: Chen, Sijia, et al.
Pubblicazione: (2026)

Boosting MLLM Reasoning with Text-Debiased Hint-GRPO
di: Huang, Qihan, et al.
Pubblicazione: (2025)

SportR: A Benchmark for Multimodal Large Language Model Reasoning in Sports
di: Xia, Haotian, et al.
Pubblicazione: (2025)

Max360IQ: Blind Omnidirectional Image Quality Assessment with Multi-axis Attention
di: Yan, Jiebin, et al.
Pubblicazione: (2025)

Syn-GRPO: Self-Evolving Data Synthesis for MLLM Perception Reasoning
di: Huang, Qihan, et al.
Pubblicazione: (2025)

DanceGRPO: Unleashing GRPO on Visual Generation
di: Xue, Zeyue, et al.
Pubblicazione: (2025)

DiffPortrait360: Consistent Portrait Diffusion for 360 View Synthesis
di: Gu, Yuming, et al.
Pubblicazione: (2025)

Dur360BEV: A Real-world 360-degree Single Camera Dataset and Benchmark for Bird-Eye View Mapping in Autonomous Driving
di: E, Wenke, et al.
Pubblicazione: (2025)

SketchThinker-R1: Towards Efficient Sketch-Style Reasoning in Large Multimodal Models
di: Zhang, Ruiyang, et al.
Pubblicazione: (2026)

nuReasoning: A Reasoning-Centric Dataset and Benchmark for Long-Tail Autonomous Driving
di: Huang, Zhiyu, et al.
Pubblicazione: (2026)

Splatter-360: Generalizable 360$^{\circ}$ Gaussian Splatting for Wide-baseline Panoramic Images
di: Chen, Zheng, et al.
Pubblicazione: (2024)

360SFUDA++: Towards Source-free UDA for Panoramic Segmentation by Learning Reliable Category Prototypes
di: Zheng, Xu, et al.
Pubblicazione: (2024)

Pref-GRPO: Pairwise Preference Reward-based GRPO for Stable Text-to-Image Reinforcement Learning
di: Wang, Yibin, et al.
Pubblicazione: (2025)

OP-GRPO: Efficient Off-Policy GRPO for Flow-Matching Models
di: Zhang, Liyu, et al.
Pubblicazione: (2026)

TempFlow-GRPO: When Timing Matters for GRPO in Flow Models
di: He, Xiaoxuan, et al.
Pubblicazione: (2025)

MVSplat360: Feed-Forward 360 Scene Synthesis from Sparse Views
di: Chen, Yuedong, et al.
Pubblicazione: (2024)

GRPO-RM: Fine-Tuning Representation Models via GRPO-Driven Reinforcement Learning
di: Xu, Yanchen, et al.
Pubblicazione: (2025)

R1-ShareVL: Incentivizing Reasoning Capability of Multimodal Large Language Models via Share-GRPO
di: Yao, Huanjin, et al.
Pubblicazione: (2025)

Towards Small Object Editing: A Benchmark Dataset and A Training-Free Approach
di: Pan, Qihe, et al.
Pubblicazione: (2024)