:: Library Catalog

Copertina

Salvato in:

Dettagli Bibliografici
Autori principali:	Wang, Yuhan, Liu, Cheng, Zhao, Zihan, Wu, Weichao
Natura:	Preprint
Pubblicazione:	2025
Soggetti:	Computer Vision and Pattern Recognition
Accesso online:	https://arxiv.org/abs/2509.18571
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Documenti analoghi

Hoi2Threat: An Interpretable Threat Detection Method for Human Violence Scenarios Guided by Human-Object Interaction
di: Wang, Yuhan, et al.
Pubblicazione: (2025)

Chain of Event-Centric Causal Thought for Physically Plausible Video Generation
di: Wang, Zixuan, et al.
Pubblicazione: (2026)

Vad-R1: Towards Video Anomaly Reasoning via Perception-to-Cognition Chain-of-Thought
di: Huang, Chao, et al.
Pubblicazione: (2025)

Unsupervised Visual Chain-of-Thought Reasoning via Preference Optimization
di: Zhao, Kesen, et al.
Pubblicazione: (2025)

Multimodal Chain-of-Thought Reasoning: A Comprehensive Survey
di: Wang, Yaoting, et al.
Pubblicazione: (2025)

X-CoT: Explainable Text-to-Video Retrieval via LLM-based Chain-of-Thought Reasoning
di: Pulakurthi, Prasanna Reddy, et al.
Pubblicazione: (2025)

RCoT-Seg: Reinforced Chain-of-Thought for Video Reasoning and Segmentation
di: Wen, Junwei, et al.
Pubblicazione: (2026)

Rethinking Chain-of-Thought Reasoning for Videos
di: Zhong, Yiwu, et al.
Pubblicazione: (2025)

Ego-R1: Chain-of-Tool-Thought for Ultra-Long Egocentric Video Reasoning
di: Tian, Shulin, et al.
Pubblicazione: (2025)

CoT-RVS: Zero-Shot Chain-of-Thought Reasoning Segmentation for Videos
di: Kao, Shiu-hong, et al.
Pubblicazione: (2025)

Argus: Vision-Centric Reasoning with Grounded Chain-of-Thought
di: Man, Yunze, et al.
Pubblicazione: (2025)

LongLive: Real-time Interactive Long Video Generation
di: Yang, Shuai, et al.
Pubblicazione: (2025)

VCR-Bench: A Comprehensive Evaluation Framework for Video Chain-of-Thought Reasoning
di: Qi, Yukun, et al.
Pubblicazione: (2025)

ThinkMorph: Emergent Properties in Multimodal Interleaved Chain-of-Thought Reasoning
di: Gu, Jiawei, et al.
Pubblicazione: (2025)

SurgCoT: Advancing Spatiotemporal Reasoning in Surgical Videos through a Chain-of-Thought Benchmark
di: Wang, Gui, et al.
Pubblicazione: (2026)

RSVP: Reasoning Segmentation via Visual Prompting and Multi-modal Chain-of-Thought
di: Lu, Yi, et al.
Pubblicazione: (2025)

SpatialCoT: Advancing Spatial Reasoning through Coordinate Alignment and Chain-of-Thought for Embodied Task Planning
di: Liu, Yuecheng, et al.
Pubblicazione: (2025)

Rex-Thinker: Grounded Object Referring via Chain-of-Thought Reasoning
di: Jiang, Qing, et al.
Pubblicazione: (2025)

Process-of-Thought Reasoning for Videos
di: Zhang, Jusheng, et al.
Pubblicazione: (2026)

Explainable Action Form Assessment by Exploiting Multimodal Chain-of-Thoughts Reasoning
di: Qi, Mengshi, et al.
Pubblicazione: (2025)

StreamingCoT: A Dataset for Temporal Dynamics and Multimodal Chain-of-Thought Reasoning in Streaming VideoQA
di: Hu, Yuhang, et al.
Pubblicazione: (2025)

ImageGen-CoT: Enhancing Text-to-Image In-context Learning with Chain-of-Thought Reasoning
di: Liao, Jiaqi, et al.
Pubblicazione: (2025)

Revisiting the Necessity of Lengthy Chain-of-Thought in Vision-centric Reasoning Generalization
di: Du, Yifan, et al.
Pubblicazione: (2025)

Video-CoE: Reinforcing Video Event Prediction via Chain of Events
di: Su, Qile, et al.
Pubblicazione: (2026)

MedCoT: Medical Chain of Thought via Hierarchical Expert
di: Liu, Jiaxiang, et al.
Pubblicazione: (2024)

CaRDiff: Video Salient Object Ranking Chain of Thought Reasoning for Saliency Prediction with Diffusion
di: Tang, Yolo Yunlong, et al.
Pubblicazione: (2024)

Theorem-Validated Reverse Chain-of-Thought Problem Generation for Geometric Reasoning
di: Deng, Linger, et al.
Pubblicazione: (2024)

Enhancing Video-LLM Reasoning via Agent-of-Thoughts Distillation
di: Shi, Yudi, et al.
Pubblicazione: (2024)

Shape of Thought: Progressive Object Assembly via Visual Chain-of-Thought
di: Huo, Yu, et al.
Pubblicazione: (2026)

TumorChain: Interleaved Multimodal Chain-of-Thought Reasoning for Traceable Clinical Tumor Analysis
di: Li, Sijing, et al.
Pubblicazione: (2026)

ProSR: Process-Shaped Spatial Reasoning for Reliable Chain-of-Thought in VLMs
di: Li, Jiangyang, et al.
Pubblicazione: (2026)

Video-CoT: A Comprehensive Dataset for Spatiotemporal Understanding of Videos Based on Chain-of-Thought
di: Zhang, Shuyi, et al.
Pubblicazione: (2025)

Reinforcing Structured Chain-of-Thought for Video Understanding
di: Wang, Peiyao, et al.
Pubblicazione: (2026)

Render-of-Thought: Rendering Textual Chain-of-Thought as Images for Visual Latent Reasoning
di: Wang, Yifan, et al.
Pubblicazione: (2026)

CoT-Seg: Rethinking Segmentation with Chain-of-Thought Reasoning and Self-Correction
di: Kao, Shiu-hong, et al.
Pubblicazione: (2026)

Multimodal Chain-of-Thought Reasoning in Language Models
di: Zhang, Zhuosheng, et al.
Pubblicazione: (2023)

GEMeX-RMCoT: An Enhanced Med-VQA Dataset for Region-Aware Multimodal Chain-of-Thought Reasoning
di: Liu, Bo, et al.
Pubblicazione: (2025)

Video-Skill-CoT: Skill-based Chain-of-Thoughts for Domain-Adaptive Video Reasoning
di: Lee, Daeun, et al.
Pubblicazione: (2025)

MECD: Unlocking Multi-Event Causal Discovery in Video Reasoning
di: Chen, Tieyuan, et al.
Pubblicazione: (2024)

Efficient Reasoning via Thought Compression for Language Segmentation
di: Zhou, Qing, et al.
Pubblicazione: (2026)