Enregistré dans:
| Auteurs principaux: | Chen, Yankai, Zhang, Xinni, Zhang, Yifei, Li, Yangning, Zou, Henry Peng, Miao, Chunyu, Zhang, Weizhi, Liu, Xue, Yu, Philip S. |
|---|---|
| Format: | Preprint |
| Publié: |
2025
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2510.22095 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
A Call for Collaborative Intelligence: Why Human-Agent Systems Should Precede AI Autonomy
par: Zou, Henry Peng, et autres
Publié: (2025)
par: Zou, Henry Peng, et autres
Publié: (2025)
LLM-Based Human-Agent Collaboration and Interaction Systems: A Survey
par: Zou, Henry Peng, et autres
Publié: (2025)
par: Zou, Henry Peng, et autres
Publié: (2025)
TestNUC: Enhancing Test-Time Computing Approaches and Scaling through Neighboring Unlabeled Data Consistency
par: Zou, Henry Peng, et autres
Publié: (2025)
par: Zou, Henry Peng, et autres
Publié: (2025)
Scaling Laws for Many-Shot In-Context Learning with Self-Generated Annotations
par: Gu, Zhengyao, et autres
Publié: (2025)
par: Gu, Zhengyao, et autres
Publié: (2025)
Deep Research with Open-Domain Evaluation and Multi-Stage Guardrails for Safety
par: Huang, Wei-Chieh, et autres
Publié: (2025)
par: Huang, Wei-Chieh, et autres
Publié: (2025)
When Users Change Their Mind: Evaluating Interruptible Agents in Long-Horizon Web Navigation
par: Zou, Henry Peng, et autres
Publié: (2026)
par: Zou, Henry Peng, et autres
Publié: (2026)
From Web Search towards Agentic Deep Research: Incentivizing Search with Reasoning Agents
par: Zhang, Weizhi, et autres
Publié: (2025)
par: Zhang, Weizhi, et autres
Publié: (2025)
Locally Confident, Globally Stuck: The Quality-Exploration Dilemma in Diffusion Language Models
par: Fang, Liancheng, et autres
Publié: (2026)
par: Fang, Liancheng, et autres
Publié: (2026)
PSG-Agent: Personality-Aware Safety Guardrail for LLM-based Agents
par: Wu, Yaozu, et autres
Publié: (2025)
par: Wu, Yaozu, et autres
Publié: (2025)
Embracing Ambiguity: Improving Similarity-oriented Tasks with Contextual Synonym Knowledge
par: Li, Yangning, et autres
Publié: (2022)
par: Li, Yangning, et autres
Publié: (2022)
Recent Advances of Multimodal Continual Learning: A Comprehensive Survey
par: Yu, Dianzhi, et autres
Publié: (2024)
par: Yu, Dianzhi, et autres
Publié: (2024)
Towards Agentic RAG with Deep Reasoning: A Survey of RAG-Reasoning Systems in LLMs
par: Li, Yangning, et autres
Publié: (2025)
par: Li, Yangning, et autres
Publié: (2025)
RECODE-H: A Benchmark for Research Code Development with Interactive Human Feedback
par: Miao, Chunyu, et autres
Publié: (2025)
par: Miao, Chunyu, et autres
Publié: (2025)
LLMInit: A Free Lunch from Large Language Models for Selective Initialization of Recommendation
par: Zhang, Weizhi, et autres
Publié: (2025)
par: Zhang, Weizhi, et autres
Publié: (2025)
AdmTree: Compressing Lengthy Context with Adaptive Semantic Trees
par: Li, Yangning, et autres
Publié: (2025)
par: Li, Yangning, et autres
Publié: (2025)
Learning Binarized Representations with Pseudo-positive Sample Enhancement for Efficient Graph Collaborative Filtering
par: Chen, Yankai, et autres
Publié: (2025)
par: Chen, Yankai, et autres
Publié: (2025)
Process-Level Trajectory Evaluation for Environment Configuration in Software Engineering Agents
par: Kuang, Jiayi, et autres
Publié: (2025)
par: Kuang, Jiayi, et autres
Publié: (2025)
ImplicitAVE: An Open-Source Dataset and Multimodal LLMs Benchmark for Implicit Attribute Value Extraction
par: Zou, Henry Peng, et autres
Publié: (2024)
par: Zou, Henry Peng, et autres
Publié: (2024)
GAM: Hierarchical Graph-based Agentic Memory for LLM Agents
par: Wu, Zhaofen, et autres
Publié: (2026)
par: Wu, Zhaofen, et autres
Publié: (2026)
Teaching According to Talents! Instruction Tuning LLMs with Competence-Aware Curriculum Learning
par: Li, Yangning, et autres
Publié: (2025)
par: Li, Yangning, et autres
Publié: (2025)
MemoryCD: Benchmarking Long-Context User Memory of LLM Agents for Lifelong Cross-Domain Personalization
par: Zhang, Weizhi, et autres
Publié: (2026)
par: Zhang, Weizhi, et autres
Publié: (2026)
BadAgent: Inserting and Activating Backdoor Attacks in LLM Agents
par: Wang, Yifei, et autres
Publié: (2024)
par: Wang, Yifei, et autres
Publié: (2024)
Bidirectional End-to-End Learning of Retriever-Reader Paradigm for Entity Linking
par: Li, Yinghui, et autres
Publié: (2023)
par: Li, Yinghui, et autres
Publié: (2023)
Pedagogically-Inspired Data Synthesis for Language Model Knowledge Distillation
par: He, Bowei, et autres
Publié: (2026)
par: He, Bowei, et autres
Publié: (2026)
Reliable Conversational Agents under ASP Control that Understand Natural Language
par: Zeng, Yankai
Publié: (2025)
par: Zeng, Yankai
Publié: (2025)
AgentDropout: Dynamic Agent Elimination for Token-Efficient and High-Performance LLM-Based Multi-Agent Collaboration
par: Wang, Zhexuan, et autres
Publié: (2025)
par: Wang, Zhexuan, et autres
Publié: (2025)
Benchmarking Multimodal Retrieval Augmented Generation with Dynamic VQA Dataset and Self-adaptive Planning Agent
par: Li, Yangning, et autres
Publié: (2024)
par: Li, Yangning, et autres
Publié: (2024)
Stop Overvaluing Multi-Agent Debate -- We Must Rethink Evaluation and Embrace Model Heterogeneity
par: Zhang, Hangfan, et autres
Publié: (2025)
par: Zhang, Hangfan, et autres
Publié: (2025)
MARCO: Meta-Reflection with Cross-Referencing for Code Reasoning
par: Zhao, Yusheng, et autres
Publié: (2025)
par: Zhao, Yusheng, et autres
Publié: (2025)
FAITH: Factuality Alignment through Integrating Trustworthiness and Honestness
par: Dong, Xiaoning, et autres
Publié: (2026)
par: Dong, Xiaoning, et autres
Publié: (2026)
SAFEFLOW: A Principled Protocol for Trustworthy and Transactional Autonomous Agent Systems
par: Li, Peiran, et autres
Publié: (2025)
par: Li, Peiran, et autres
Publié: (2025)
Multi-Agent Collaboration for Multilingual Code Instruction Tuning
par: Yang, Jian, et autres
Publié: (2025)
par: Yang, Jian, et autres
Publié: (2025)
Multi-Agent Autonomous Driving Systems with Large Language Models: A Survey of Recent Advances
par: Wu, Yaozu, et autres
Publié: (2025)
par: Wu, Yaozu, et autres
Publié: (2025)
SATA: A Paradigm for LLM Jailbreak via Simple Assistive Task Linkage
par: Dong, Xiaoning, et autres
Publié: (2024)
par: Dong, Xiaoning, et autres
Publié: (2024)
FinDebate: Multi-Agent Collaborative Intelligence for Financial Analysis
par: Cai, Tianshi, et autres
Publié: (2025)
par: Cai, Tianshi, et autres
Publié: (2025)
AgentCollab: A Self-Evaluation-Driven Collaboration Paradigm for Efficient LLM Agents
par: Gao, Wenbo, et autres
Publié: (2026)
par: Gao, Wenbo, et autres
Publié: (2026)
Select-then-Solve: Paradigm Routing as Inference-Time Optimization for LLM Agents
par: Zhou, Heng, et autres
Publié: (2026)
par: Zhou, Heng, et autres
Publié: (2026)
VeriOS: Query-Driven Proactive Human-Agent-GUI Interaction for Trustworthy OS Agents
par: Wu, Zheng, et autres
Publié: (2025)
par: Wu, Zheng, et autres
Publié: (2025)
MemRouter: Memory-as-Embedding Routing for Long-Term Conversational Agents
par: Hu, Tianyu, et autres
Publié: (2026)
par: Hu, Tianyu, et autres
Publié: (2026)
An Evaluation-Centric Paradigm for Scientific Visualization Agents
par: Ai, Kuangshi, et autres
Publié: (2025)
par: Ai, Kuangshi, et autres
Publié: (2025)
Documents similaires
-
A Call for Collaborative Intelligence: Why Human-Agent Systems Should Precede AI Autonomy
par: Zou, Henry Peng, et autres
Publié: (2025) -
LLM-Based Human-Agent Collaboration and Interaction Systems: A Survey
par: Zou, Henry Peng, et autres
Publié: (2025) -
TestNUC: Enhancing Test-Time Computing Approaches and Scaling through Neighboring Unlabeled Data Consistency
par: Zou, Henry Peng, et autres
Publié: (2025) -
Scaling Laws for Many-Shot In-Context Learning with Self-Generated Annotations
par: Gu, Zhengyao, et autres
Publié: (2025) -
Deep Research with Open-Domain Evaluation and Multi-Stage Guardrails for Safety
par: Huang, Wei-Chieh, et autres
Publié: (2025)