:: Library Catalog

Copertina

Salvato in:

Dettagli Bibliografici
Autori principali:	Xi, Zhiheng, Li, Guanyu, Fan, Yutao, Guo, Honglin, Liu, Yufang, Fan, Xiaoran, Liu, Jiaqi, Ding, Jingchao, Zuo, Wangmeng, Yin, Zhenfei, Bai, Lei, Ji, Tao, Gui, Tao, Zhang, Qi, Torr, Philip, Huang, Xuanjing
Natura:	Preprint
Pubblicazione:	2025
Soggetti:	Computation and Language Artificial Intelligence
Accesso online:	https://arxiv.org/abs/2507.03483
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Documenti analoghi

Distill Visual Chart Reasoning Ability from LLMs to MLLMs
di: He, Wei, et al.
Pubblicazione: (2024)

Visual-O1: Understanding Ambiguous Instructions via Multi-modal Multi-turn Chain-of-thoughts Reasoning
di: Ni, Minheng, et al.
Pubblicazione: (2024)

Can RL Improve Generalization of LLM Agents? An Empirical Study
di: Xi, Zhiheng, et al.
Pubblicazione: (2026)

Feedback-Driven Tool-Use Improvements in Large Language Models via Automated Build Environments
di: Ye, Junjie, et al.
Pubblicazione: (2025)

RoTBench: A Multi-Level Benchmark for Evaluating the Robustness of Large Language Models in Tool Learning
di: Ye, Junjie, et al.
Pubblicazione: (2024)

Subspace Defense: Discarding Adversarial Perturbations by Learning a Subspace for Clean Signals
di: Zheng, Rui, et al.
Pubblicazione: (2024)

Self-Polish: Enhance Reasoning in Large Language Models via Problem Refinement
di: Xi, Zhiheng, et al.
Pubblicazione: (2023)

Have the VLMs Lost Confidence? A Study of Sycophancy in VLMs
di: Li, Shuo, et al.
Pubblicazione: (2024)

Mitigating Object Hallucinations in MLLMs via Multi-Frequency Perturbations
di: Li, Shuo, et al.
Pubblicazione: (2025)

SpeechRole: A Large-Scale Dataset and Benchmark for Evaluating Speech Role-Playing Agents
di: Jiang, Changhao, et al.
Pubblicazione: (2025)

ToolEyes: Fine-Grained Evaluation for Tool Learning Capabilities of Large Language Models in Real-world Scenarios
di: Ye, Junjie, et al.
Pubblicazione: (2024)

ChartE$^{3}$: A Comprehensive Benchmark for End-to-End Chart Editing
di: Li, Shuo, et al.
Pubblicazione: (2026)

MHA2MLA-VLM: Enabling DeepSeek's Economical Multi-Head Latent Attention across Vision-Language Models
di: Fan, Xiaoran, et al.
Pubblicazione: (2026)

EliteKV: Scalable KV Cache Compression via RoPE Frequency Selection and Joint Low-Rank Projection
di: Zhou, Yuhao, et al.
Pubblicazione: (2025)

Training Large Language Models for Reasoning through Reverse Curriculum Reinforcement Learning
di: Xi, Zhiheng, et al.
Pubblicazione: (2024)

RoCoIns: Enhancing Robustness of Large Language Models through Code-Style Instructions
di: Zhang, Yuansen, et al.
Pubblicazione: (2024)

CMDAR: A Chinese Multi-scene Dynamic Audio Reasoning Benchmark with Diverse Challenges
di: Li, Hui, et al.
Pubblicazione: (2025)

Why Reinforcement Fine-Tuning Enables MLLMs Preserve Prior Knowledge Better: A Data Perspective
di: Zhang, Zhihao, et al.
Pubblicazione: (2025)

Beyond Scaling: Measuring and Predicting the Upper Bound of Knowledge Retention in Language Model Pre-Training
di: Jiang, Changhao, et al.
Pubblicazione: (2025)

Self-Demos: Eliciting Out-of-Demonstration Generalizability in Large Language Models
di: He, Wei, et al.
Pubblicazione: (2024)

StepCoder: Improve Code Generation with Reinforcement Learning from Compiler Feedback
di: Dou, Shihan, et al.
Pubblicazione: (2024)

SciAgentGym: Benchmarking Multi-Step Scientific Tool-use in LLM Agents
di: Shen, Yujiong, et al.
Pubblicazione: (2026)

SciReasoner: Laying the Scientific Reasoning Ground Across Disciplines
di: Wang, Yizhou, et al.
Pubblicazione: (2025)

Better Process Supervision with Bi-directional Rewarding Signals
di: Chen, Wenxiang, et al.
Pubblicazione: (2025)

CoEditor++: Instruction-based Visual Editing via Cognitive Reasoning
di: Ni, Minheng, et al.
Pubblicazione: (2026)

LoRAMoE: Alleviate World Knowledge Forgetting in Large Language Models via MoE-Style Plugin
di: Dou, Shihan, et al.
Pubblicazione: (2023)

PreferThinker: Reasoning-based Personalized Image Preference Assessment
di: Xu, Shengqi, et al.
Pubblicazione: (2025)

Counteracting Matthew Effect in Self-Improvement of LVLMs through Head-Tail Re-balancing
di: Guo, Xin, et al.
Pubblicazione: (2025)

AgentPRM: Process Reward Models for LLM Agents via Step-Wise Promise and Progress
di: Xi, Zhiheng, et al.
Pubblicazione: (2025)

Parrot: A Training Pipeline Enhances Both Program CoT and Natural Language CoT for Reasoning
di: Jin, Senjie, et al.
Pubblicazione: (2025)

TL-Training: A Task-Feature-Based Framework for Training Large Language Models in Tool Use
di: Ye, Junjie, et al.
Pubblicazione: (2024)

MMFineReason: Closing the Multimodal Reasoning Gap via Open Data-Centric Methods
di: Lin, Honglin, et al.
Pubblicazione: (2026)

Game-RL: Synthesizing Multimodal Verifiable Game Data to Boost VLMs' General Reasoning
di: Tong, Jingqi, et al.
Pubblicazione: (2025)

SplatWeaver: Learning to Allocate Gaussian Primitives for Generalizable Novel View Synthesis
di: Wan, Yecong, et al.
Pubblicazione: (2026)

MM-Doc-R1: Training Agents for Long Document Visual Question Answering through Multi-turn Reinforcement Learning
di: Lin, Jiahang, et al.
Pubblicazione: (2026)

MIRAGE: Assessing Hallucination in Multimodal Reasoning Chains of MLLM
di: Dong, Bowen, et al.
Pubblicazione: (2025)

InterCoG: Towards Spatially Precise Image Editing with Interleaved Chain-of-Grounding Reasoning
di: Wan, Yecong, et al.
Pubblicazione: (2026)

The Role of Visual Modality in Multimodal Mathematical Reasoning: Challenges and Insights
di: Liu, Yufang, et al.
Pubblicazione: (2025)

CoEnv: Driving Embodied Multi-Agent Collaboration via Compositional Environment
di: Kang, Li, et al.
Pubblicazione: (2026)

Integrating Visual Interpretation and Linguistic Reasoning for Math Problem Solving
di: Guo, Zixian, et al.
Pubblicazione: (2025)