Gespeichert in:
| Hauptverfasser: | Lu, Shuo, Xu, Yinuo, Cheng, Jianjie, He, Lingxiao, Wang, Meng, Liang, Jian |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2025
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2601.03261 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
DeepResearcher: Scaling Deep Research via Reinforcement Learning in Real-world Environments
von: Zheng, Yuxiang, et al.
Veröffentlicht: (2025)
von: Zheng, Yuxiang, et al.
Veröffentlicht: (2025)
Marco DeepResearch: Unlocking Efficient Deep Research Agents via Verification-Centric Design
von: Zhu, Bin, et al.
Veröffentlicht: (2026)
von: Zhu, Bin, et al.
Veröffentlicht: (2026)
Multimodal DeepResearcher: Generating Text-Chart Interleaved Reports From Scratch with Agentic Framework
von: Yang, Zhaorui, et al.
Veröffentlicht: (2025)
von: Yang, Zhaorui, et al.
Veröffentlicht: (2025)
How to Train Your Deep Research Agent? Prompt, Reward, and Policy Optimization in Search-R1
von: Xu, Yinuo, et al.
Veröffentlicht: (2026)
von: Xu, Yinuo, et al.
Veröffentlicht: (2026)
Tongyi DeepResearch Technical Report
von: Tongyi DeepResearch Team, et al.
Veröffentlicht: (2025)
von: Tongyi DeepResearch Team, et al.
Veröffentlicht: (2025)
SFR-DeepResearch: Towards Effective Reinforcement Learning for Autonomously Reasoning Single Agents
von: Nguyen, Xuan-Phi, et al.
Veröffentlicht: (2025)
von: Nguyen, Xuan-Phi, et al.
Veröffentlicht: (2025)
You Only Use Reactive Attention Slice For Long Context Retrieval
von: Soh, Yun Joon, et al.
Veröffentlicht: (2024)
von: Soh, Yun Joon, et al.
Veröffentlicht: (2024)
Dingtalk DeepResearch: A Unified Multi Agent Framework for Adaptive Intelligence in Enterprise Environments
von: Chen, Mengyuan, et al.
Veröffentlicht: (2025)
von: Chen, Mengyuan, et al.
Veröffentlicht: (2025)
Understanding DeepResearch via Reports
von: Fan, Tianyu, et al.
Veröffentlicht: (2025)
von: Fan, Tianyu, et al.
Veröffentlicht: (2025)
SliceMoE: Routing Embedding Slices Instead of Tokens for Fine-Grained and Balanced Transformer Scaling
von: Vejendla, Harshil
Veröffentlicht: (2025)
von: Vejendla, Harshil
Veröffentlicht: (2025)
Vision-DeepResearch: Incentivizing DeepResearch Capability in Multimodal Large Language Models
von: Huang, Wenxuan, et al.
Veröffentlicht: (2026)
von: Huang, Wenxuan, et al.
Veröffentlicht: (2026)
DeepResearch$^{\text{Eco}}$: A Recursive Agentic Workflow for Complex Scientific Question Answering in Ecology
von: D'Souza, Jennifer, et al.
Veröffentlicht: (2025)
von: D'Souza, Jennifer, et al.
Veröffentlicht: (2025)
Mind DeepResearch Technical Report
von: MindDR Team, et al.
Veröffentlicht: (2026)
von: MindDR Team, et al.
Veröffentlicht: (2026)
Vision-DeepResearch Benchmark: Rethinking Visual and Textual Search for Multimodal Large Language Models
von: Zeng, Yu, et al.
Veröffentlicht: (2026)
von: Zeng, Yu, et al.
Veröffentlicht: (2026)
Static Program Slicing Using Language Models With Dataflow-Aware Pretraining and Constrained Decoding
von: He, Pengfei, et al.
Veröffentlicht: (2026)
von: He, Pengfei, et al.
Veröffentlicht: (2026)
S2WTM: Spherical Sliced-Wasserstein Autoencoder for Topic Modeling
von: Adhya, Suman, et al.
Veröffentlicht: (2025)
von: Adhya, Suman, et al.
Veröffentlicht: (2025)
Fathom-DeepResearch: Unlocking Long Horizon Information Retrieval and Synthesis for SLMs
von: Singh, Shreyas, et al.
Veröffentlicht: (2025)
von: Singh, Shreyas, et al.
Veröffentlicht: (2025)
DeepResearch-9K: A Challenging Benchmark Dataset of Deep-Research Agent
von: Wu, Tongzhou, et al.
Veröffentlicht: (2026)
von: Wu, Tongzhou, et al.
Veröffentlicht: (2026)
Bridging the Semantic Gap: Contrastive Rewards for Multilingual Text-to-SQL with GRPO
von: Kattamuri, Ashish, et al.
Veröffentlicht: (2025)
von: Kattamuri, Ashish, et al.
Veröffentlicht: (2025)
Understanding and Mitigating Spurious Signal Amplification in Test-Time Reinforcement Learning for Math Reasoning
von: Yu, Yongcan, et al.
Veröffentlicht: (2026)
von: Yu, Yongcan, et al.
Veröffentlicht: (2026)
The Salami Slicing Threat: Exploiting Cumulative Risks in LLM Systems
von: Zhang, Yihao, et al.
Veröffentlicht: (2026)
von: Zhang, Yihao, et al.
Veröffentlicht: (2026)
DeepResearch Arena: The First Exam of LLMs' Research Abilities via Seminar-Grounded Tasks
von: Wan, Haiyuan, et al.
Veröffentlicht: (2025)
von: Wan, Haiyuan, et al.
Veröffentlicht: (2025)
From Text to Forecasts: Bridging Modality Gap with Temporal Evolution Semantic Space
von: Li, Lehui, et al.
Veröffentlicht: (2026)
von: Li, Lehui, et al.
Veröffentlicht: (2026)
From Sub-Ability Diagnosis to Human-Aligned Generation: Bridging the Gap for Text Length Control via MARKERGEN
von: Yuan, Peiwen, et al.
Veröffentlicht: (2025)
von: Yuan, Peiwen, et al.
Veröffentlicht: (2025)
Do MLLMs Really Understand Space? A Mathematical Reasoning Evaluation
von: Lu, Shuo, et al.
Veröffentlicht: (2026)
von: Lu, Shuo, et al.
Veröffentlicht: (2026)
SafeSlice: Enabling SLA-Compliant O-RAN Slicing via Safe Deep Reinforcement Learning
von: Nagib, Ahmad M., et al.
Veröffentlicht: (2025)
von: Nagib, Ahmad M., et al.
Veröffentlicht: (2025)
Mind the Gap: Bridging Thought Leap for Improved Chain-of-Thought Tuning
von: Xu, Haolei, et al.
Veröffentlicht: (2025)
von: Xu, Haolei, et al.
Veröffentlicht: (2025)
The Art of Audience Engagement: LLM-Based Thin-Slicing of Scientific Talks
von: Schmälzle, Ralf, et al.
Veröffentlicht: (2025)
von: Schmälzle, Ralf, et al.
Veröffentlicht: (2025)
What Is Wrong with My Model? Identifying Systematic Problems with Semantic Data Slicing
von: Yang, Chenyang, et al.
Veröffentlicht: (2024)
von: Yang, Chenyang, et al.
Veröffentlicht: (2024)
Bridging the Data Gap: Creating a Hindi Text Summarization Dataset from the English XSUM
von: Katwe, Praveenkumar, et al.
Veröffentlicht: (2026)
von: Katwe, Praveenkumar, et al.
Veröffentlicht: (2026)
ActMem: Bridging the Gap Between Memory Retrieval and Reasoning in LLM Agents
von: Zhang, Xiaohui, et al.
Veröffentlicht: (2026)
von: Zhang, Xiaohui, et al.
Veröffentlicht: (2026)
Bridging Language Gaps: Advances in Cross-Lingual Information Retrieval with Multilingual LLMs
von: Goworek, Roksana, et al.
Veröffentlicht: (2025)
von: Goworek, Roksana, et al.
Veröffentlicht: (2025)
Retrieval Augmented Generation-based Large Language Models for Bridging Transportation Cybersecurity Legal Knowledge Gaps
von: Akbar, Khandakar Ashrafi, et al.
Veröffentlicht: (2025)
von: Akbar, Khandakar Ashrafi, et al.
Veröffentlicht: (2025)
Bridging the Data Provenance Gap Across Text, Speech and Video
von: Longpre, Shayne, et al.
Veröffentlicht: (2024)
von: Longpre, Shayne, et al.
Veröffentlicht: (2024)
MedSlice: Fine-Tuned Large Language Models for Secure Clinical Note Sectioning
von: Davis, Joshua, et al.
Veröffentlicht: (2025)
von: Davis, Joshua, et al.
Veröffentlicht: (2025)
MacRAG: Compress, Slice, and Scale-up for Multi-Scale Adaptive Context RAG
von: Lim, Woosang, et al.
Veröffentlicht: (2025)
von: Lim, Woosang, et al.
Veröffentlicht: (2025)
Bridging Writing Manner Gap in Visual Instruction Tuning by Creating LLM-aligned Instructions
von: Jing, Dong, et al.
Veröffentlicht: (2025)
von: Jing, Dong, et al.
Veröffentlicht: (2025)
SliceIt! -- A Dual Simulator Framework for Learning Robot Food Slicing
von: Beltran-Hernandez, Cristian C., et al.
Veröffentlicht: (2024)
von: Beltran-Hernandez, Cristian C., et al.
Veröffentlicht: (2024)
Bridging Context Gaps: Leveraging Coreference Resolution for Long Contextual Understanding
von: Liu, Yanming, et al.
Veröffentlicht: (2024)
von: Liu, Yanming, et al.
Veröffentlicht: (2024)
Slicing Through Bias: Explaining Performance Gaps in Medical Image Analysis using Slice Discovery Methods
von: Olesen, Vincent, et al.
Veröffentlicht: (2024)
von: Olesen, Vincent, et al.
Veröffentlicht: (2024)
Ähnliche Einträge
-
DeepResearcher: Scaling Deep Research via Reinforcement Learning in Real-world Environments
von: Zheng, Yuxiang, et al.
Veröffentlicht: (2025) -
Marco DeepResearch: Unlocking Efficient Deep Research Agents via Verification-Centric Design
von: Zhu, Bin, et al.
Veröffentlicht: (2026) -
Multimodal DeepResearcher: Generating Text-Chart Interleaved Reports From Scratch with Agentic Framework
von: Yang, Zhaorui, et al.
Veröffentlicht: (2025) -
How to Train Your Deep Research Agent? Prompt, Reward, and Policy Optimization in Search-R1
von: Xu, Yinuo, et al.
Veröffentlicht: (2026) -
Tongyi DeepResearch Technical Report
von: Tongyi DeepResearch Team, et al.
Veröffentlicht: (2025)