:: Library Catalog

Image de couverture de livre

Enregistré dans:

Détails bibliographiques
Auteurs principaux:	Chen, Yankai, Zhang, Xinni, Zhang, Yifei, Li, Yangning, Zou, Henry Peng, Miao, Chunyu, Zhang, Weizhi, Liu, Xue, Yu, Philip S.
Format:	Preprint
Publié:	2025
Sujets:	Artificial Intelligence Computation and Language
Accès en ligne:	https://arxiv.org/abs/2510.22095
Tags:	Ajouter un tag Pas de tags, Soyez le premier à ajouter un tag!

Documents similaires

A Call for Collaborative Intelligence: Why Human-Agent Systems Should Precede AI Autonomy
par: Zou, Henry Peng, et autres
Publié: (2025)

LLM-Based Human-Agent Collaboration and Interaction Systems: A Survey
par: Zou, Henry Peng, et autres
Publié: (2025)

TestNUC: Enhancing Test-Time Computing Approaches and Scaling through Neighboring Unlabeled Data Consistency
par: Zou, Henry Peng, et autres
Publié: (2025)

Scaling Laws for Many-Shot In-Context Learning with Self-Generated Annotations
par: Gu, Zhengyao, et autres
Publié: (2025)

Deep Research with Open-Domain Evaluation and Multi-Stage Guardrails for Safety
par: Huang, Wei-Chieh, et autres
Publié: (2025)

When Users Change Their Mind: Evaluating Interruptible Agents in Long-Horizon Web Navigation
par: Zou, Henry Peng, et autres
Publié: (2026)

From Web Search towards Agentic Deep Research: Incentivizing Search with Reasoning Agents
par: Zhang, Weizhi, et autres
Publié: (2025)

Locally Confident, Globally Stuck: The Quality-Exploration Dilemma in Diffusion Language Models
par: Fang, Liancheng, et autres
Publié: (2026)

PSG-Agent: Personality-Aware Safety Guardrail for LLM-based Agents
par: Wu, Yaozu, et autres
Publié: (2025)

Embracing Ambiguity: Improving Similarity-oriented Tasks with Contextual Synonym Knowledge
par: Li, Yangning, et autres
Publié: (2022)

Recent Advances of Multimodal Continual Learning: A Comprehensive Survey
par: Yu, Dianzhi, et autres
Publié: (2024)

Towards Agentic RAG with Deep Reasoning: A Survey of RAG-Reasoning Systems in LLMs
par: Li, Yangning, et autres
Publié: (2025)

RECODE-H: A Benchmark for Research Code Development with Interactive Human Feedback
par: Miao, Chunyu, et autres
Publié: (2025)

LLMInit: A Free Lunch from Large Language Models for Selective Initialization of Recommendation
par: Zhang, Weizhi, et autres
Publié: (2025)

AdmTree: Compressing Lengthy Context with Adaptive Semantic Trees
par: Li, Yangning, et autres
Publié: (2025)

Learning Binarized Representations with Pseudo-positive Sample Enhancement for Efficient Graph Collaborative Filtering
par: Chen, Yankai, et autres
Publié: (2025)

Process-Level Trajectory Evaluation for Environment Configuration in Software Engineering Agents
par: Kuang, Jiayi, et autres
Publié: (2025)

ImplicitAVE: An Open-Source Dataset and Multimodal LLMs Benchmark for Implicit Attribute Value Extraction
par: Zou, Henry Peng, et autres
Publié: (2024)

GAM: Hierarchical Graph-based Agentic Memory for LLM Agents
par: Wu, Zhaofen, et autres
Publié: (2026)

Teaching According to Talents! Instruction Tuning LLMs with Competence-Aware Curriculum Learning
par: Li, Yangning, et autres
Publié: (2025)

MemoryCD: Benchmarking Long-Context User Memory of LLM Agents for Lifelong Cross-Domain Personalization
par: Zhang, Weizhi, et autres
Publié: (2026)

BadAgent: Inserting and Activating Backdoor Attacks in LLM Agents
par: Wang, Yifei, et autres
Publié: (2024)

Bidirectional End-to-End Learning of Retriever-Reader Paradigm for Entity Linking
par: Li, Yinghui, et autres
Publié: (2023)

Pedagogically-Inspired Data Synthesis for Language Model Knowledge Distillation
par: He, Bowei, et autres
Publié: (2026)

Reliable Conversational Agents under ASP Control that Understand Natural Language
par: Zeng, Yankai
Publié: (2025)

AgentDropout: Dynamic Agent Elimination for Token-Efficient and High-Performance LLM-Based Multi-Agent Collaboration
par: Wang, Zhexuan, et autres
Publié: (2025)

Benchmarking Multimodal Retrieval Augmented Generation with Dynamic VQA Dataset and Self-adaptive Planning Agent
par: Li, Yangning, et autres
Publié: (2024)

Stop Overvaluing Multi-Agent Debate -- We Must Rethink Evaluation and Embrace Model Heterogeneity
par: Zhang, Hangfan, et autres
Publié: (2025)

MARCO: Meta-Reflection with Cross-Referencing for Code Reasoning
par: Zhao, Yusheng, et autres
Publié: (2025)

FAITH: Factuality Alignment through Integrating Trustworthiness and Honestness
par: Dong, Xiaoning, et autres
Publié: (2026)

SAFEFLOW: A Principled Protocol for Trustworthy and Transactional Autonomous Agent Systems
par: Li, Peiran, et autres
Publié: (2025)

Multi-Agent Collaboration for Multilingual Code Instruction Tuning
par: Yang, Jian, et autres
Publié: (2025)

Multi-Agent Autonomous Driving Systems with Large Language Models: A Survey of Recent Advances
par: Wu, Yaozu, et autres
Publié: (2025)

SATA: A Paradigm for LLM Jailbreak via Simple Assistive Task Linkage
par: Dong, Xiaoning, et autres
Publié: (2024)

FinDebate: Multi-Agent Collaborative Intelligence for Financial Analysis
par: Cai, Tianshi, et autres
Publié: (2025)

AgentCollab: A Self-Evaluation-Driven Collaboration Paradigm for Efficient LLM Agents
par: Gao, Wenbo, et autres
Publié: (2026)

Select-then-Solve: Paradigm Routing as Inference-Time Optimization for LLM Agents
par: Zhou, Heng, et autres
Publié: (2026)

VeriOS: Query-Driven Proactive Human-Agent-GUI Interaction for Trustworthy OS Agents
par: Wu, Zheng, et autres
Publié: (2025)

MemRouter: Memory-as-Embedding Routing for Long-Term Conversational Agents
par: Hu, Tianyu, et autres
Publié: (2026)

An Evaluation-Centric Paradigm for Scientific Visualization Agents
par: Ai, Kuangshi, et autres
Publié: (2025)