:: Library Catalog

Copertina

Salvato in:

Dettagli Bibliografici
Autori principali:	He, Yulin, Chen, Wei, Jian, Zhikang, Guo, Tianhang, Zhou, Wenjuan, Li, Minglong, Yang, Shaowu, Yang, Wenjing
Natura:	Preprint
Pubblicazione:	2026
Soggetti:	Computer Vision and Pattern Recognition
Accesso online:	https://arxiv.org/abs/2601.09981
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Documenti analoghi

HBTP: Heuristic Behavior Tree Planning with Large Language Model Reasoning
di: Cai, Yishuai, et al.
Pubblicazione: (2024)

MedSeg-R: Reasoning Segmentation in Medical Images with Multimodal Large Language Models
di: Huang, Yu, et al.
Pubblicazione: (2025)

Task2Morph: Differentiable Task-inspired Framework for Contact-Aware Robot Design
di: Cai, Yishuai, et al.
Pubblicazione: (2024)

AnchorSeg: Language Grounded Query Banks for Reasoning Segmentation
di: Qian, Rui, et al.
Pubblicazione: (2026)

Stable and Efficient Single-Rollout RL for Multimodal Reasoning
di: Liu, Rui, et al.
Pubblicazione: (2025)

HyperSeg: Towards Universal Visual Segmentation with Large Language Model
di: Wei, Cong, et al.
Pubblicazione: (2024)

LLM-Seg: Bridging Image Segmentation and Large Language Model Reasoning
di: Wang, Junchi, et al.
Pubblicazione: (2024)

Seg-ReSearch: Segmentation with Interleaved Reasoning and External Search
di: Liang, Tianming, et al.
Pubblicazione: (2026)

BeyondFacial: Identity-Preserving Personalized Generation Beyond Facial Close-ups
di: Zhang, Songsong, et al.
Pubblicazione: (2025)

Seg-Agent: Test-Time Multimodal Reasoning for Training-Free Language-Guided Segmentation
di: Hao, Chao, et al.
Pubblicazione: (2026)

AnyUser: Translating Sketched User Intent into Domestic Robots
di: Yang, Songyuan, et al.
Pubblicazione: (2026)

Seg the HAB: Language-Guided Geospatial Algae Bloom Reasoning and Segmentation
di: Hsieh, Patterson, et al.
Pubblicazione: (2025)

InstructSeg: Unifying Instructed Visual Segmentation with Multi-modal Large Language Models
di: Wei, Cong, et al.
Pubblicazione: (2024)

VideoSeg-R1:Reasoning Video Object Segmentation via Reinforcement Learning
di: Xu, Zishan, et al.
Pubblicazione: (2025)

CORE-Seg: Reasoning-Driven Segmentation for Complex Lesions via Reinforcement Learning
di: Xie, Yuxin, et al.
Pubblicazione: (2026)

WaveSeg: Enhancing Segmentation Precision via High-Frequency Prior and Mamba-Driven Spectrum Decomposition
di: Xu, Guoan, et al.
Pubblicazione: (2025)

One Token to Seg Them All: Language Instructed Reasoning Segmentation in Videos
di: Bai, Zechen, et al.
Pubblicazione: (2024)

SegPoint: Segment Any Point Cloud via Large Language Model
di: He, Shuting, et al.
Pubblicazione: (2024)

Post-Experiment Decisions: The Dual Adjustments for Rollout and Downstream Optimizations
di: He, Guoxing, et al.
Pubblicazione: (2026)

MAIRA-Seg: Enhancing Radiology Report Generation with Segmentation-Aware Multimodal Large Language Models
di: Sharma, Harshita, et al.
Pubblicazione: (2024)

CAMD: Coverage-Aware Multimodal Decoding for Efficient Reasoning of Multimodal Large Language Models
di: Guo, Huijie, et al.
Pubblicazione: (2026)

A Survey of Efficient Reasoning for Large Reasoning Models: Language, Multimodality, and Beyond
di: Qu, Xiaoye, et al.
Pubblicazione: (2025)

ImagineBench: Evaluating Reinforcement Learning with Large Language Model Rollouts
di: Pang, Jing-Cheng, et al.
Pubblicazione: (2025)

Act Only When It Pays: Efficient Reinforcement Learning for LLM Reasoning via Selective Rollouts
di: Zheng, Haizhong, et al.
Pubblicazione: (2025)

MRBTP: Efficient Multi-Robot Behavior Tree Planning and Collaboration
di: Cai, Yishuai, et al.
Pubblicazione: (2025)

Effect of a Nonlinear Energy Sink on the Nonlinear Panel Flutter Suppression Under Variable Temperature Rise and Airflow Yawed Angle
di: Zhou Jian, et al.
Pubblicazione: (2025)

SegLLM: Multi-round Reasoning Segmentation
di: Wang, XuDong, et al.
Pubblicazione: (2024)

TokenSeg: Efficient 3D Medical Image Segmentation via Hierarchical Visual Token Compression
di: Zeng, Sen, et al.
Pubblicazione: (2026)

Enhancing Spatial Reasoning in Multimodal Large Language Models through Reasoning-based Segmentation
di: Ning, Zhenhua, et al.
Pubblicazione: (2025)

Aeroelastic Stability Analysis of a Laminated Composite Sandwich Panel With a Magnetorheological Fluid Core Under Yawed Supersonic Airflow
di: Jian Zhou, et al.
Pubblicazione: (2024)

Qwen3-VL-Seg: Unlocking Open-World Referring Segmentation with Vision-Language Grounding
di: Yao, Yuan, et al.
Pubblicazione: (2026)

Knowledgeable Agents by Offline Reinforcement Learning from Large Language Model Rollouts
di: Pang, Jing-Cheng, et al.
Pubblicazione: (2024)

MLLM-For3D: Adapting Multimodal Large Language Model for 3D Reasoning Segmentation
di: Huang, Jiaxin, et al.
Pubblicazione: (2025)

Analysis of Two-Stage Rollout Designs with Clustering for Causal Inference under Network Interference
di: Cortez-Rodriguez, Mayleen, et al.
Pubblicazione: (2024)

WeatherReasonSeg: A Benchmark for Weather-Aware Reasoning Segmentation in Visual Language Models
di: Du, Wanjun, et al.
Pubblicazione: (2026)

LAST: Leveraging Tools as Hints to Enhance Spatial Reasoning for Multimodal Large Language Models
di: Tian, Shi-Yu, et al.
Pubblicazione: (2026)

MAgSeg: Segmentation of Agricultural Landscapes in High-Resolution Satellite Imagery using Multimodal Large Language Models
di: Tiwary, Piyush, et al.
Pubblicazione: (2026)

Reinforced MLLM: A Survey on RL-Based Reasoning in Multimodal Large Language Models
di: Zhou, Guanghao, et al.
Pubblicazione: (2025)

SegICL: A Multimodal In-context Learning Framework for Enhanced Segmentation in Medical Imaging
di: Shen, Lingdong, et al.
Pubblicazione: (2024)

IdealGPT: Iteratively Decomposing Vision and Language Reasoning via Large Language Models
di: You, Haoxuan, et al.
Pubblicazione: (2023)