Salvato in:
| Autori principali: | Xi, Zhiheng, Li, Guanyu, Fan, Yutao, Guo, Honglin, Liu, Yufang, Fan, Xiaoran, Liu, Jiaqi, Ding, Jingchao, Zuo, Wangmeng, Yin, Zhenfei, Bai, Lei, Ji, Tao, Gui, Tao, Zhang, Qi, Torr, Philip, Huang, Xuanjing |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2025
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2507.03483 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
Distill Visual Chart Reasoning Ability from LLMs to MLLMs
di: He, Wei, et al.
Pubblicazione: (2024)
di: He, Wei, et al.
Pubblicazione: (2024)
Visual-O1: Understanding Ambiguous Instructions via Multi-modal Multi-turn Chain-of-thoughts Reasoning
di: Ni, Minheng, et al.
Pubblicazione: (2024)
di: Ni, Minheng, et al.
Pubblicazione: (2024)
Can RL Improve Generalization of LLM Agents? An Empirical Study
di: Xi, Zhiheng, et al.
Pubblicazione: (2026)
di: Xi, Zhiheng, et al.
Pubblicazione: (2026)
Feedback-Driven Tool-Use Improvements in Large Language Models via Automated Build Environments
di: Ye, Junjie, et al.
Pubblicazione: (2025)
di: Ye, Junjie, et al.
Pubblicazione: (2025)
RoTBench: A Multi-Level Benchmark for Evaluating the Robustness of Large Language Models in Tool Learning
di: Ye, Junjie, et al.
Pubblicazione: (2024)
di: Ye, Junjie, et al.
Pubblicazione: (2024)
Subspace Defense: Discarding Adversarial Perturbations by Learning a Subspace for Clean Signals
di: Zheng, Rui, et al.
Pubblicazione: (2024)
di: Zheng, Rui, et al.
Pubblicazione: (2024)
Self-Polish: Enhance Reasoning in Large Language Models via Problem Refinement
di: Xi, Zhiheng, et al.
Pubblicazione: (2023)
di: Xi, Zhiheng, et al.
Pubblicazione: (2023)
Have the VLMs Lost Confidence? A Study of Sycophancy in VLMs
di: Li, Shuo, et al.
Pubblicazione: (2024)
di: Li, Shuo, et al.
Pubblicazione: (2024)
Mitigating Object Hallucinations in MLLMs via Multi-Frequency Perturbations
di: Li, Shuo, et al.
Pubblicazione: (2025)
di: Li, Shuo, et al.
Pubblicazione: (2025)
SpeechRole: A Large-Scale Dataset and Benchmark for Evaluating Speech Role-Playing Agents
di: Jiang, Changhao, et al.
Pubblicazione: (2025)
di: Jiang, Changhao, et al.
Pubblicazione: (2025)
ToolEyes: Fine-Grained Evaluation for Tool Learning Capabilities of Large Language Models in Real-world Scenarios
di: Ye, Junjie, et al.
Pubblicazione: (2024)
di: Ye, Junjie, et al.
Pubblicazione: (2024)
ChartE$^{3}$: A Comprehensive Benchmark for End-to-End Chart Editing
di: Li, Shuo, et al.
Pubblicazione: (2026)
di: Li, Shuo, et al.
Pubblicazione: (2026)
MHA2MLA-VLM: Enabling DeepSeek's Economical Multi-Head Latent Attention across Vision-Language Models
di: Fan, Xiaoran, et al.
Pubblicazione: (2026)
di: Fan, Xiaoran, et al.
Pubblicazione: (2026)
EliteKV: Scalable KV Cache Compression via RoPE Frequency Selection and Joint Low-Rank Projection
di: Zhou, Yuhao, et al.
Pubblicazione: (2025)
di: Zhou, Yuhao, et al.
Pubblicazione: (2025)
Training Large Language Models for Reasoning through Reverse Curriculum Reinforcement Learning
di: Xi, Zhiheng, et al.
Pubblicazione: (2024)
di: Xi, Zhiheng, et al.
Pubblicazione: (2024)
RoCoIns: Enhancing Robustness of Large Language Models through Code-Style Instructions
di: Zhang, Yuansen, et al.
Pubblicazione: (2024)
di: Zhang, Yuansen, et al.
Pubblicazione: (2024)
CMDAR: A Chinese Multi-scene Dynamic Audio Reasoning Benchmark with Diverse Challenges
di: Li, Hui, et al.
Pubblicazione: (2025)
di: Li, Hui, et al.
Pubblicazione: (2025)
Why Reinforcement Fine-Tuning Enables MLLMs Preserve Prior Knowledge Better: A Data Perspective
di: Zhang, Zhihao, et al.
Pubblicazione: (2025)
di: Zhang, Zhihao, et al.
Pubblicazione: (2025)
Beyond Scaling: Measuring and Predicting the Upper Bound of Knowledge Retention in Language Model Pre-Training
di: Jiang, Changhao, et al.
Pubblicazione: (2025)
di: Jiang, Changhao, et al.
Pubblicazione: (2025)
Self-Demos: Eliciting Out-of-Demonstration Generalizability in Large Language Models
di: He, Wei, et al.
Pubblicazione: (2024)
di: He, Wei, et al.
Pubblicazione: (2024)
StepCoder: Improve Code Generation with Reinforcement Learning from Compiler Feedback
di: Dou, Shihan, et al.
Pubblicazione: (2024)
di: Dou, Shihan, et al.
Pubblicazione: (2024)
SciAgentGym: Benchmarking Multi-Step Scientific Tool-use in LLM Agents
di: Shen, Yujiong, et al.
Pubblicazione: (2026)
di: Shen, Yujiong, et al.
Pubblicazione: (2026)
SciReasoner: Laying the Scientific Reasoning Ground Across Disciplines
di: Wang, Yizhou, et al.
Pubblicazione: (2025)
di: Wang, Yizhou, et al.
Pubblicazione: (2025)
Better Process Supervision with Bi-directional Rewarding Signals
di: Chen, Wenxiang, et al.
Pubblicazione: (2025)
di: Chen, Wenxiang, et al.
Pubblicazione: (2025)
CoEditor++: Instruction-based Visual Editing via Cognitive Reasoning
di: Ni, Minheng, et al.
Pubblicazione: (2026)
di: Ni, Minheng, et al.
Pubblicazione: (2026)
LoRAMoE: Alleviate World Knowledge Forgetting in Large Language Models via MoE-Style Plugin
di: Dou, Shihan, et al.
Pubblicazione: (2023)
di: Dou, Shihan, et al.
Pubblicazione: (2023)
PreferThinker: Reasoning-based Personalized Image Preference Assessment
di: Xu, Shengqi, et al.
Pubblicazione: (2025)
di: Xu, Shengqi, et al.
Pubblicazione: (2025)
Counteracting Matthew Effect in Self-Improvement of LVLMs through Head-Tail Re-balancing
di: Guo, Xin, et al.
Pubblicazione: (2025)
di: Guo, Xin, et al.
Pubblicazione: (2025)
AgentPRM: Process Reward Models for LLM Agents via Step-Wise Promise and Progress
di: Xi, Zhiheng, et al.
Pubblicazione: (2025)
di: Xi, Zhiheng, et al.
Pubblicazione: (2025)
Parrot: A Training Pipeline Enhances Both Program CoT and Natural Language CoT for Reasoning
di: Jin, Senjie, et al.
Pubblicazione: (2025)
di: Jin, Senjie, et al.
Pubblicazione: (2025)
TL-Training: A Task-Feature-Based Framework for Training Large Language Models in Tool Use
di: Ye, Junjie, et al.
Pubblicazione: (2024)
di: Ye, Junjie, et al.
Pubblicazione: (2024)
MMFineReason: Closing the Multimodal Reasoning Gap via Open Data-Centric Methods
di: Lin, Honglin, et al.
Pubblicazione: (2026)
di: Lin, Honglin, et al.
Pubblicazione: (2026)
Game-RL: Synthesizing Multimodal Verifiable Game Data to Boost VLMs' General Reasoning
di: Tong, Jingqi, et al.
Pubblicazione: (2025)
di: Tong, Jingqi, et al.
Pubblicazione: (2025)
SplatWeaver: Learning to Allocate Gaussian Primitives for Generalizable Novel View Synthesis
di: Wan, Yecong, et al.
Pubblicazione: (2026)
di: Wan, Yecong, et al.
Pubblicazione: (2026)
MM-Doc-R1: Training Agents for Long Document Visual Question Answering through Multi-turn Reinforcement Learning
di: Lin, Jiahang, et al.
Pubblicazione: (2026)
di: Lin, Jiahang, et al.
Pubblicazione: (2026)
MIRAGE: Assessing Hallucination in Multimodal Reasoning Chains of MLLM
di: Dong, Bowen, et al.
Pubblicazione: (2025)
di: Dong, Bowen, et al.
Pubblicazione: (2025)
InterCoG: Towards Spatially Precise Image Editing with Interleaved Chain-of-Grounding Reasoning
di: Wan, Yecong, et al.
Pubblicazione: (2026)
di: Wan, Yecong, et al.
Pubblicazione: (2026)
The Role of Visual Modality in Multimodal Mathematical Reasoning: Challenges and Insights
di: Liu, Yufang, et al.
Pubblicazione: (2025)
di: Liu, Yufang, et al.
Pubblicazione: (2025)
CoEnv: Driving Embodied Multi-Agent Collaboration via Compositional Environment
di: Kang, Li, et al.
Pubblicazione: (2026)
di: Kang, Li, et al.
Pubblicazione: (2026)
Integrating Visual Interpretation and Linguistic Reasoning for Math Problem Solving
di: Guo, Zixian, et al.
Pubblicazione: (2025)
di: Guo, Zixian, et al.
Pubblicazione: (2025)
Documenti analoghi
-
Distill Visual Chart Reasoning Ability from LLMs to MLLMs
di: He, Wei, et al.
Pubblicazione: (2024) -
Visual-O1: Understanding Ambiguous Instructions via Multi-modal Multi-turn Chain-of-thoughts Reasoning
di: Ni, Minheng, et al.
Pubblicazione: (2024) -
Can RL Improve Generalization of LLM Agents? An Empirical Study
di: Xi, Zhiheng, et al.
Pubblicazione: (2026) -
Feedback-Driven Tool-Use Improvements in Large Language Models via Automated Build Environments
di: Ye, Junjie, et al.
Pubblicazione: (2025) -
RoTBench: A Multi-Level Benchmark for Evaluating the Robustness of Large Language Models in Tool Learning
di: Ye, Junjie, et al.
Pubblicazione: (2024)