Salvato in:
| Autori principali: | Wang, Yuhan, Liu, Cheng, Zhao, Zihan, Wu, Weichao |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2025
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2509.18571 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
Hoi2Threat: An Interpretable Threat Detection Method for Human Violence Scenarios Guided by Human-Object Interaction
di: Wang, Yuhan, et al.
Pubblicazione: (2025)
di: Wang, Yuhan, et al.
Pubblicazione: (2025)
Chain of Event-Centric Causal Thought for Physically Plausible Video Generation
di: Wang, Zixuan, et al.
Pubblicazione: (2026)
di: Wang, Zixuan, et al.
Pubblicazione: (2026)
Vad-R1: Towards Video Anomaly Reasoning via Perception-to-Cognition Chain-of-Thought
di: Huang, Chao, et al.
Pubblicazione: (2025)
di: Huang, Chao, et al.
Pubblicazione: (2025)
Unsupervised Visual Chain-of-Thought Reasoning via Preference Optimization
di: Zhao, Kesen, et al.
Pubblicazione: (2025)
di: Zhao, Kesen, et al.
Pubblicazione: (2025)
Multimodal Chain-of-Thought Reasoning: A Comprehensive Survey
di: Wang, Yaoting, et al.
Pubblicazione: (2025)
di: Wang, Yaoting, et al.
Pubblicazione: (2025)
X-CoT: Explainable Text-to-Video Retrieval via LLM-based Chain-of-Thought Reasoning
di: Pulakurthi, Prasanna Reddy, et al.
Pubblicazione: (2025)
di: Pulakurthi, Prasanna Reddy, et al.
Pubblicazione: (2025)
RCoT-Seg: Reinforced Chain-of-Thought for Video Reasoning and Segmentation
di: Wen, Junwei, et al.
Pubblicazione: (2026)
di: Wen, Junwei, et al.
Pubblicazione: (2026)
Rethinking Chain-of-Thought Reasoning for Videos
di: Zhong, Yiwu, et al.
Pubblicazione: (2025)
di: Zhong, Yiwu, et al.
Pubblicazione: (2025)
Ego-R1: Chain-of-Tool-Thought for Ultra-Long Egocentric Video Reasoning
di: Tian, Shulin, et al.
Pubblicazione: (2025)
di: Tian, Shulin, et al.
Pubblicazione: (2025)
CoT-RVS: Zero-Shot Chain-of-Thought Reasoning Segmentation for Videos
di: Kao, Shiu-hong, et al.
Pubblicazione: (2025)
di: Kao, Shiu-hong, et al.
Pubblicazione: (2025)
Argus: Vision-Centric Reasoning with Grounded Chain-of-Thought
di: Man, Yunze, et al.
Pubblicazione: (2025)
di: Man, Yunze, et al.
Pubblicazione: (2025)
LongLive: Real-time Interactive Long Video Generation
di: Yang, Shuai, et al.
Pubblicazione: (2025)
di: Yang, Shuai, et al.
Pubblicazione: (2025)
VCR-Bench: A Comprehensive Evaluation Framework for Video Chain-of-Thought Reasoning
di: Qi, Yukun, et al.
Pubblicazione: (2025)
di: Qi, Yukun, et al.
Pubblicazione: (2025)
ThinkMorph: Emergent Properties in Multimodal Interleaved Chain-of-Thought Reasoning
di: Gu, Jiawei, et al.
Pubblicazione: (2025)
di: Gu, Jiawei, et al.
Pubblicazione: (2025)
SurgCoT: Advancing Spatiotemporal Reasoning in Surgical Videos through a Chain-of-Thought Benchmark
di: Wang, Gui, et al.
Pubblicazione: (2026)
di: Wang, Gui, et al.
Pubblicazione: (2026)
RSVP: Reasoning Segmentation via Visual Prompting and Multi-modal Chain-of-Thought
di: Lu, Yi, et al.
Pubblicazione: (2025)
di: Lu, Yi, et al.
Pubblicazione: (2025)
SpatialCoT: Advancing Spatial Reasoning through Coordinate Alignment and Chain-of-Thought for Embodied Task Planning
di: Liu, Yuecheng, et al.
Pubblicazione: (2025)
di: Liu, Yuecheng, et al.
Pubblicazione: (2025)
Rex-Thinker: Grounded Object Referring via Chain-of-Thought Reasoning
di: Jiang, Qing, et al.
Pubblicazione: (2025)
di: Jiang, Qing, et al.
Pubblicazione: (2025)
Process-of-Thought Reasoning for Videos
di: Zhang, Jusheng, et al.
Pubblicazione: (2026)
di: Zhang, Jusheng, et al.
Pubblicazione: (2026)
Explainable Action Form Assessment by Exploiting Multimodal Chain-of-Thoughts Reasoning
di: Qi, Mengshi, et al.
Pubblicazione: (2025)
di: Qi, Mengshi, et al.
Pubblicazione: (2025)
StreamingCoT: A Dataset for Temporal Dynamics and Multimodal Chain-of-Thought Reasoning in Streaming VideoQA
di: Hu, Yuhang, et al.
Pubblicazione: (2025)
di: Hu, Yuhang, et al.
Pubblicazione: (2025)
ImageGen-CoT: Enhancing Text-to-Image In-context Learning with Chain-of-Thought Reasoning
di: Liao, Jiaqi, et al.
Pubblicazione: (2025)
di: Liao, Jiaqi, et al.
Pubblicazione: (2025)
Revisiting the Necessity of Lengthy Chain-of-Thought in Vision-centric Reasoning Generalization
di: Du, Yifan, et al.
Pubblicazione: (2025)
di: Du, Yifan, et al.
Pubblicazione: (2025)
Video-CoE: Reinforcing Video Event Prediction via Chain of Events
di: Su, Qile, et al.
Pubblicazione: (2026)
di: Su, Qile, et al.
Pubblicazione: (2026)
MedCoT: Medical Chain of Thought via Hierarchical Expert
di: Liu, Jiaxiang, et al.
Pubblicazione: (2024)
di: Liu, Jiaxiang, et al.
Pubblicazione: (2024)
CaRDiff: Video Salient Object Ranking Chain of Thought Reasoning for Saliency Prediction with Diffusion
di: Tang, Yolo Yunlong, et al.
Pubblicazione: (2024)
di: Tang, Yolo Yunlong, et al.
Pubblicazione: (2024)
Theorem-Validated Reverse Chain-of-Thought Problem Generation for Geometric Reasoning
di: Deng, Linger, et al.
Pubblicazione: (2024)
di: Deng, Linger, et al.
Pubblicazione: (2024)
Enhancing Video-LLM Reasoning via Agent-of-Thoughts Distillation
di: Shi, Yudi, et al.
Pubblicazione: (2024)
di: Shi, Yudi, et al.
Pubblicazione: (2024)
Shape of Thought: Progressive Object Assembly via Visual Chain-of-Thought
di: Huo, Yu, et al.
Pubblicazione: (2026)
di: Huo, Yu, et al.
Pubblicazione: (2026)
TumorChain: Interleaved Multimodal Chain-of-Thought Reasoning for Traceable Clinical Tumor Analysis
di: Li, Sijing, et al.
Pubblicazione: (2026)
di: Li, Sijing, et al.
Pubblicazione: (2026)
ProSR: Process-Shaped Spatial Reasoning for Reliable Chain-of-Thought in VLMs
di: Li, Jiangyang, et al.
Pubblicazione: (2026)
di: Li, Jiangyang, et al.
Pubblicazione: (2026)
Video-CoT: A Comprehensive Dataset for Spatiotemporal Understanding of Videos Based on Chain-of-Thought
di: Zhang, Shuyi, et al.
Pubblicazione: (2025)
di: Zhang, Shuyi, et al.
Pubblicazione: (2025)
Reinforcing Structured Chain-of-Thought for Video Understanding
di: Wang, Peiyao, et al.
Pubblicazione: (2026)
di: Wang, Peiyao, et al.
Pubblicazione: (2026)
Render-of-Thought: Rendering Textual Chain-of-Thought as Images for Visual Latent Reasoning
di: Wang, Yifan, et al.
Pubblicazione: (2026)
di: Wang, Yifan, et al.
Pubblicazione: (2026)
CoT-Seg: Rethinking Segmentation with Chain-of-Thought Reasoning and Self-Correction
di: Kao, Shiu-hong, et al.
Pubblicazione: (2026)
di: Kao, Shiu-hong, et al.
Pubblicazione: (2026)
Multimodal Chain-of-Thought Reasoning in Language Models
di: Zhang, Zhuosheng, et al.
Pubblicazione: (2023)
di: Zhang, Zhuosheng, et al.
Pubblicazione: (2023)
GEMeX-RMCoT: An Enhanced Med-VQA Dataset for Region-Aware Multimodal Chain-of-Thought Reasoning
di: Liu, Bo, et al.
Pubblicazione: (2025)
di: Liu, Bo, et al.
Pubblicazione: (2025)
Video-Skill-CoT: Skill-based Chain-of-Thoughts for Domain-Adaptive Video Reasoning
di: Lee, Daeun, et al.
Pubblicazione: (2025)
di: Lee, Daeun, et al.
Pubblicazione: (2025)
MECD: Unlocking Multi-Event Causal Discovery in Video Reasoning
di: Chen, Tieyuan, et al.
Pubblicazione: (2024)
di: Chen, Tieyuan, et al.
Pubblicazione: (2024)
Efficient Reasoning via Thought Compression for Language Segmentation
di: Zhou, Qing, et al.
Pubblicazione: (2026)
di: Zhou, Qing, et al.
Pubblicazione: (2026)
Documenti analoghi
-
Hoi2Threat: An Interpretable Threat Detection Method for Human Violence Scenarios Guided by Human-Object Interaction
di: Wang, Yuhan, et al.
Pubblicazione: (2025) -
Chain of Event-Centric Causal Thought for Physically Plausible Video Generation
di: Wang, Zixuan, et al.
Pubblicazione: (2026) -
Vad-R1: Towards Video Anomaly Reasoning via Perception-to-Cognition Chain-of-Thought
di: Huang, Chao, et al.
Pubblicazione: (2025) -
Unsupervised Visual Chain-of-Thought Reasoning via Preference Optimization
di: Zhao, Kesen, et al.
Pubblicazione: (2025) -
Multimodal Chain-of-Thought Reasoning: A Comprehensive Survey
di: Wang, Yaoting, et al.
Pubblicazione: (2025)