Salvato in:
| Autori principali: | He, Yulin, Chen, Wei, Jian, Zhikang, Guo, Tianhang, Zhou, Wenjuan, Li, Minglong, Yang, Shaowu, Yang, Wenjing |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2026
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2601.09981 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
HBTP: Heuristic Behavior Tree Planning with Large Language Model Reasoning
di: Cai, Yishuai, et al.
Pubblicazione: (2024)
di: Cai, Yishuai, et al.
Pubblicazione: (2024)
MedSeg-R: Reasoning Segmentation in Medical Images with Multimodal Large Language Models
di: Huang, Yu, et al.
Pubblicazione: (2025)
di: Huang, Yu, et al.
Pubblicazione: (2025)
Task2Morph: Differentiable Task-inspired Framework for Contact-Aware Robot Design
di: Cai, Yishuai, et al.
Pubblicazione: (2024)
di: Cai, Yishuai, et al.
Pubblicazione: (2024)
AnchorSeg: Language Grounded Query Banks for Reasoning Segmentation
di: Qian, Rui, et al.
Pubblicazione: (2026)
di: Qian, Rui, et al.
Pubblicazione: (2026)
Stable and Efficient Single-Rollout RL for Multimodal Reasoning
di: Liu, Rui, et al.
Pubblicazione: (2025)
di: Liu, Rui, et al.
Pubblicazione: (2025)
HyperSeg: Towards Universal Visual Segmentation with Large Language Model
di: Wei, Cong, et al.
Pubblicazione: (2024)
di: Wei, Cong, et al.
Pubblicazione: (2024)
LLM-Seg: Bridging Image Segmentation and Large Language Model Reasoning
di: Wang, Junchi, et al.
Pubblicazione: (2024)
di: Wang, Junchi, et al.
Pubblicazione: (2024)
Seg-ReSearch: Segmentation with Interleaved Reasoning and External Search
di: Liang, Tianming, et al.
Pubblicazione: (2026)
di: Liang, Tianming, et al.
Pubblicazione: (2026)
BeyondFacial: Identity-Preserving Personalized Generation Beyond Facial Close-ups
di: Zhang, Songsong, et al.
Pubblicazione: (2025)
di: Zhang, Songsong, et al.
Pubblicazione: (2025)
Seg-Agent: Test-Time Multimodal Reasoning for Training-Free Language-Guided Segmentation
di: Hao, Chao, et al.
Pubblicazione: (2026)
di: Hao, Chao, et al.
Pubblicazione: (2026)
AnyUser: Translating Sketched User Intent into Domestic Robots
di: Yang, Songyuan, et al.
Pubblicazione: (2026)
di: Yang, Songyuan, et al.
Pubblicazione: (2026)
Seg the HAB: Language-Guided Geospatial Algae Bloom Reasoning and Segmentation
di: Hsieh, Patterson, et al.
Pubblicazione: (2025)
di: Hsieh, Patterson, et al.
Pubblicazione: (2025)
InstructSeg: Unifying Instructed Visual Segmentation with Multi-modal Large Language Models
di: Wei, Cong, et al.
Pubblicazione: (2024)
di: Wei, Cong, et al.
Pubblicazione: (2024)
VideoSeg-R1:Reasoning Video Object Segmentation via Reinforcement Learning
di: Xu, Zishan, et al.
Pubblicazione: (2025)
di: Xu, Zishan, et al.
Pubblicazione: (2025)
CORE-Seg: Reasoning-Driven Segmentation for Complex Lesions via Reinforcement Learning
di: Xie, Yuxin, et al.
Pubblicazione: (2026)
di: Xie, Yuxin, et al.
Pubblicazione: (2026)
WaveSeg: Enhancing Segmentation Precision via High-Frequency Prior and Mamba-Driven Spectrum Decomposition
di: Xu, Guoan, et al.
Pubblicazione: (2025)
di: Xu, Guoan, et al.
Pubblicazione: (2025)
One Token to Seg Them All: Language Instructed Reasoning Segmentation in Videos
di: Bai, Zechen, et al.
Pubblicazione: (2024)
di: Bai, Zechen, et al.
Pubblicazione: (2024)
SegPoint: Segment Any Point Cloud via Large Language Model
di: He, Shuting, et al.
Pubblicazione: (2024)
di: He, Shuting, et al.
Pubblicazione: (2024)
Post-Experiment Decisions: The Dual Adjustments for Rollout and Downstream Optimizations
di: He, Guoxing, et al.
Pubblicazione: (2026)
di: He, Guoxing, et al.
Pubblicazione: (2026)
MAIRA-Seg: Enhancing Radiology Report Generation with Segmentation-Aware Multimodal Large Language Models
di: Sharma, Harshita, et al.
Pubblicazione: (2024)
di: Sharma, Harshita, et al.
Pubblicazione: (2024)
CAMD: Coverage-Aware Multimodal Decoding for Efficient Reasoning of Multimodal Large Language Models
di: Guo, Huijie, et al.
Pubblicazione: (2026)
di: Guo, Huijie, et al.
Pubblicazione: (2026)
A Survey of Efficient Reasoning for Large Reasoning Models: Language, Multimodality, and Beyond
di: Qu, Xiaoye, et al.
Pubblicazione: (2025)
di: Qu, Xiaoye, et al.
Pubblicazione: (2025)
ImagineBench: Evaluating Reinforcement Learning with Large Language Model Rollouts
di: Pang, Jing-Cheng, et al.
Pubblicazione: (2025)
di: Pang, Jing-Cheng, et al.
Pubblicazione: (2025)
Act Only When It Pays: Efficient Reinforcement Learning for LLM Reasoning via Selective Rollouts
di: Zheng, Haizhong, et al.
Pubblicazione: (2025)
di: Zheng, Haizhong, et al.
Pubblicazione: (2025)
MRBTP: Efficient Multi-Robot Behavior Tree Planning and Collaboration
di: Cai, Yishuai, et al.
Pubblicazione: (2025)
di: Cai, Yishuai, et al.
Pubblicazione: (2025)
Effect of a Nonlinear Energy Sink on the Nonlinear Panel Flutter Suppression Under Variable Temperature Rise and Airflow Yawed Angle
di: Zhou Jian, et al.
Pubblicazione: (2025)
di: Zhou Jian, et al.
Pubblicazione: (2025)
SegLLM: Multi-round Reasoning Segmentation
di: Wang, XuDong, et al.
Pubblicazione: (2024)
di: Wang, XuDong, et al.
Pubblicazione: (2024)
TokenSeg: Efficient 3D Medical Image Segmentation via Hierarchical Visual Token Compression
di: Zeng, Sen, et al.
Pubblicazione: (2026)
di: Zeng, Sen, et al.
Pubblicazione: (2026)
Enhancing Spatial Reasoning in Multimodal Large Language Models through Reasoning-based Segmentation
di: Ning, Zhenhua, et al.
Pubblicazione: (2025)
di: Ning, Zhenhua, et al.
Pubblicazione: (2025)
Aeroelastic Stability Analysis of a Laminated Composite Sandwich Panel With a Magnetorheological Fluid Core Under Yawed Supersonic Airflow
di: Jian Zhou, et al.
Pubblicazione: (2024)
di: Jian Zhou, et al.
Pubblicazione: (2024)
Qwen3-VL-Seg: Unlocking Open-World Referring Segmentation with Vision-Language Grounding
di: Yao, Yuan, et al.
Pubblicazione: (2026)
di: Yao, Yuan, et al.
Pubblicazione: (2026)
Knowledgeable Agents by Offline Reinforcement Learning from Large Language Model Rollouts
di: Pang, Jing-Cheng, et al.
Pubblicazione: (2024)
di: Pang, Jing-Cheng, et al.
Pubblicazione: (2024)
MLLM-For3D: Adapting Multimodal Large Language Model for 3D Reasoning Segmentation
di: Huang, Jiaxin, et al.
Pubblicazione: (2025)
di: Huang, Jiaxin, et al.
Pubblicazione: (2025)
Analysis of Two-Stage Rollout Designs with Clustering for Causal Inference under Network Interference
di: Cortez-Rodriguez, Mayleen, et al.
Pubblicazione: (2024)
di: Cortez-Rodriguez, Mayleen, et al.
Pubblicazione: (2024)
WeatherReasonSeg: A Benchmark for Weather-Aware Reasoning Segmentation in Visual Language Models
di: Du, Wanjun, et al.
Pubblicazione: (2026)
di: Du, Wanjun, et al.
Pubblicazione: (2026)
LAST: Leveraging Tools as Hints to Enhance Spatial Reasoning for Multimodal Large Language Models
di: Tian, Shi-Yu, et al.
Pubblicazione: (2026)
di: Tian, Shi-Yu, et al.
Pubblicazione: (2026)
MAgSeg: Segmentation of Agricultural Landscapes in High-Resolution Satellite Imagery using Multimodal Large Language Models
di: Tiwary, Piyush, et al.
Pubblicazione: (2026)
di: Tiwary, Piyush, et al.
Pubblicazione: (2026)
Reinforced MLLM: A Survey on RL-Based Reasoning in Multimodal Large Language Models
di: Zhou, Guanghao, et al.
Pubblicazione: (2025)
di: Zhou, Guanghao, et al.
Pubblicazione: (2025)
SegICL: A Multimodal In-context Learning Framework for Enhanced Segmentation in Medical Imaging
di: Shen, Lingdong, et al.
Pubblicazione: (2024)
di: Shen, Lingdong, et al.
Pubblicazione: (2024)
IdealGPT: Iteratively Decomposing Vision and Language Reasoning via Large Language Models
di: You, Haoxuan, et al.
Pubblicazione: (2023)
di: You, Haoxuan, et al.
Pubblicazione: (2023)
Documenti analoghi
-
HBTP: Heuristic Behavior Tree Planning with Large Language Model Reasoning
di: Cai, Yishuai, et al.
Pubblicazione: (2024) -
MedSeg-R: Reasoning Segmentation in Medical Images with Multimodal Large Language Models
di: Huang, Yu, et al.
Pubblicazione: (2025) -
Task2Morph: Differentiable Task-inspired Framework for Contact-Aware Robot Design
di: Cai, Yishuai, et al.
Pubblicazione: (2024) -
AnchorSeg: Language Grounded Query Banks for Reasoning Segmentation
di: Qian, Rui, et al.
Pubblicazione: (2026) -
Stable and Efficient Single-Rollout RL for Multimodal Reasoning
di: Liu, Rui, et al.
Pubblicazione: (2025)