Salvato in:
| Autori principali: | Yang, Ke, Zhai, ChengXiang |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2025
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2505.20273 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
TinyHelen's First Curriculum: Training and Evaluating Tiny Language Models in a Simpler Language Environment
di: Yang, Ke, et al.
Pubblicazione: (2024)
di: Yang, Ke, et al.
Pubblicazione: (2024)
The Indispensable Role of User Simulation in the Pursuit of AGI
di: Balog, Krisztian, et al.
Pubblicazione: (2025)
di: Balog, Krisztian, et al.
Pubblicazione: (2025)
User Simulation in the Era of Generative AI: User Modeling, Synthetic Data Generation, and System Evaluation
di: Balog, Krisztian, et al.
Pubblicazione: (2025)
di: Balog, Krisztian, et al.
Pubblicazione: (2025)
An Axiomatic Benchmark for Evaluation of Scientific Novelty Metrics
di: Liu, Miri, et al.
Pubblicazione: (2026)
di: Liu, Miri, et al.
Pubblicazione: (2026)
User Simulation for Evaluating Information Access Systems
di: Balog, Krisztian, et al.
Pubblicazione: (2023)
di: Balog, Krisztian, et al.
Pubblicazione: (2023)
Globally Optimal Training of Spiking Neural Networks via Parameter Reconstruction
di: Udupi, Himanshu, et al.
Pubblicazione: (2026)
di: Udupi, Himanshu, et al.
Pubblicazione: (2026)
An Investigation of Robustness of LLMs in Mathematical Reasoning: Benchmarking with Mathematically-Equivalent Transformation of Advanced Mathematical Problems
di: Hao, Yuren, et al.
Pubblicazione: (2025)
di: Hao, Yuren, et al.
Pubblicazione: (2025)
JIR-Arena: The First Benchmark Dataset for Just-in-time Information Recommendation
di: Yang, Ke, et al.
Pubblicazione: (2025)
di: Yang, Ke, et al.
Pubblicazione: (2025)
Beyond Reactive Safety: Risk-Aware LLM Alignment via Long-Horizon Simulation
di: Sun, Chenkai, et al.
Pubblicazione: (2025)
di: Sun, Chenkai, et al.
Pubblicazione: (2025)
User Preference Modeling for Conversational LLM Agents: Weak Rewards from Retrieval-Augmented Interaction
di: Hao, Yuren, et al.
Pubblicazione: (2026)
di: Hao, Yuren, et al.
Pubblicazione: (2026)
PlugMem: A Task-Agnostic Plugin Memory Module for LLM Agents
di: Yang, Ke, et al.
Pubblicazione: (2026)
di: Yang, Ke, et al.
Pubblicazione: (2026)
Do Role-Playing Agents Practice What They Preach? Belief-Behavior Consistency in LLM-Based Simulations of Human Trust
di: Mannekote, Amogh, et al.
Pubblicazione: (2025)
di: Mannekote, Amogh, et al.
Pubblicazione: (2025)
Persona-DB: Efficient Large Language Model Personalization for Response Prediction with Collaborative Data Refinement
di: Sun, Chenkai, et al.
Pubblicazione: (2024)
di: Sun, Chenkai, et al.
Pubblicazione: (2024)
ERA: Transforming VLMs into Embodied Agents via Embodied Prior Learning and Online Reinforcement Learning
di: Chen, Hanyang, et al.
Pubblicazione: (2025)
di: Chen, Hanyang, et al.
Pubblicazione: (2025)
Agent Exchange: Shaping the Future of AI Agent Economics
di: Yang, Yingxuan, et al.
Pubblicazione: (2025)
di: Yang, Yingxuan, et al.
Pubblicazione: (2025)
Socio-Economic Model of AI Agents
di: Qian, Yuxinyue, et al.
Pubblicazione: (2025)
di: Qian, Yuxinyue, et al.
Pubblicazione: (2025)
UnitTenX: Generating Tests for Legacy Packages with AI Agents Powered by Formal Verification
di: Charalambous, Yiannis, et al.
Pubblicazione: (2025)
di: Charalambous, Yiannis, et al.
Pubblicazione: (2025)
Economic Rationality under Specialization: Evidence of Decision Bias in AI Agents
di: Wen, ShuiDe
Pubblicazione: (2025)
di: Wen, ShuiDe
Pubblicazione: (2025)
Poster: ClawdGo: Endogenous Security Awareness Training for Autonomous AI Agents
di: Li, Jiaqi, et al.
Pubblicazione: (2026)
di: Li, Jiaqi, et al.
Pubblicazione: (2026)
Aligning Logits Generatively for Principled Black-Box Knowledge Distillation
di: Ma, Jing, et al.
Pubblicazione: (2022)
di: Ma, Jing, et al.
Pubblicazione: (2022)
Make Any Collection Navigable: Methods for Constructing and Evaluating Hypergraph of Text
di: Alvarez, Dean E., et al.
Pubblicazione: (2026)
di: Alvarez, Dean E., et al.
Pubblicazione: (2026)
Large Language Models for Relevance Judgment in Product Search
di: Mehrdad, Navid, et al.
Pubblicazione: (2024)
di: Mehrdad, Navid, et al.
Pubblicazione: (2024)
Enhancing Decision-Making for LLM Agents via Step-Level Q-Value Models
di: Zhai, Yuanzhao, et al.
Pubblicazione: (2024)
di: Zhai, Yuanzhao, et al.
Pubblicazione: (2024)
Token Economics for LLM Agents: A Dual-View Study from Computing and Economics
di: Chen, Yuxi, et al.
Pubblicazione: (2026)
di: Chen, Yuxi, et al.
Pubblicazione: (2026)
PRACT: Optimizing Principled Reasoning and Acting of LLM Agent
di: Liu, Zhiwei, et al.
Pubblicazione: (2024)
di: Liu, Zhiwei, et al.
Pubblicazione: (2024)
Principles for Responsible AI Consciousness Research
di: Butlin, Patrick, et al.
Pubblicazione: (2025)
di: Butlin, Patrick, et al.
Pubblicazione: (2025)
Ten Challenging Problems in Federated Foundation Models
di: Fan, Tao, et al.
Pubblicazione: (2025)
di: Fan, Tao, et al.
Pubblicazione: (2025)
Modeling AI-Driven Production and Competitiveness A Multi-Agent Economic Simulation of China and the United States
di: Qian, Yuxinyue, et al.
Pubblicazione: (2025)
di: Qian, Yuxinyue, et al.
Pubblicazione: (2025)
AI Governance in Higher Education: Case Studies of Guidance at Big Ten Universities
di: Wu, Chuhao, et al.
Pubblicazione: (2024)
di: Wu, Chuhao, et al.
Pubblicazione: (2024)
Structural Enforcement of Goal Integrity in AI Agents via Separation-of-Powers Architecture
di: Xiang, Rong
Pubblicazione: (2026)
di: Xiang, Rong
Pubblicazione: (2026)
AgentWard: A Lifecycle Security Architecture for Autonomous AI Agents
di: Zhang, Yixiang, et al.
Pubblicazione: (2026)
di: Zhang, Yixiang, et al.
Pubblicazione: (2026)
Building AI Agents for Autonomous Clouds: Challenges and Design Principles
di: Shetty, Manish, et al.
Pubblicazione: (2024)
di: Shetty, Manish, et al.
Pubblicazione: (2024)
Security of AI Agents
di: He, Yifeng, et al.
Pubblicazione: (2024)
di: He, Yifeng, et al.
Pubblicazione: (2024)
AESP: A Human-Sovereign Economic Protocol for AI Agents with Privacy-Preserving Settlement
di: Wang, Jian Sheng
Pubblicazione: (2026)
di: Wang, Jian Sheng
Pubblicazione: (2026)
Reason for Future, Act for Now: A Principled Framework for Autonomous LLM Agents with Provable Sample Efficiency
di: Liu, Zhihan, et al.
Pubblicazione: (2023)
di: Liu, Zhihan, et al.
Pubblicazione: (2023)
Beyond Benchmarks: The Economics of AI Inference
di: Zhuang, Boqin, et al.
Pubblicazione: (2025)
di: Zhuang, Boqin, et al.
Pubblicazione: (2025)
UBio-MolFM: A Universal Molecular Foundation Model for Bio-Systems
di: Huang, Lin, et al.
Pubblicazione: (2026)
di: Huang, Lin, et al.
Pubblicazione: (2026)
Computational Challenges in Token Economics: Bridging Economic Theory and AI System Design
di: Wu, Ou, et al.
Pubblicazione: (2026)
di: Wu, Ou, et al.
Pubblicazione: (2026)
SentinelAgent: Graph-based Anomaly Detection in Multi-Agent Systems
di: He, Xu, et al.
Pubblicazione: (2025)
di: He, Xu, et al.
Pubblicazione: (2025)
Skilled AI Agents for Embedded and IoT Systems Development
di: Li, Yiming, et al.
Pubblicazione: (2026)
di: Li, Yiming, et al.
Pubblicazione: (2026)
Documenti analoghi
-
TinyHelen's First Curriculum: Training and Evaluating Tiny Language Models in a Simpler Language Environment
di: Yang, Ke, et al.
Pubblicazione: (2024) -
The Indispensable Role of User Simulation in the Pursuit of AGI
di: Balog, Krisztian, et al.
Pubblicazione: (2025) -
User Simulation in the Era of Generative AI: User Modeling, Synthetic Data Generation, and System Evaluation
di: Balog, Krisztian, et al.
Pubblicazione: (2025) -
An Axiomatic Benchmark for Evaluation of Scientific Novelty Metrics
di: Liu, Miri, et al.
Pubblicazione: (2026) -
User Simulation for Evaluating Information Access Systems
di: Balog, Krisztian, et al.
Pubblicazione: (2023)