:: Library Catalog

Copertina

Salvato in:

Dettagli Bibliografici
Autori principali:	Kon, Patrick Tser Jern, Liu, Jiachen, Zhu, Xinyi, Ding, Qiuyi, Peng, Jingjia, Xing, Jiarong, Huang, Yibo, Qiu, Yiming, Srinivasa, Jayanth, Lee, Myungjin, Chowdhury, Mosharaf, Zaharia, Matei, Chen, Ang
Natura:	Preprint
Pubblicazione:	2025
Soggetti:	Artificial Intelligence
Accesso online:	https://arxiv.org/abs/2505.24785
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Documenti analoghi

Curie: Toward Rigorous and Automated Scientific Experimentation with AI Agents
di: Kon, Patrick Tser Jern, et al.
Pubblicazione: (2025)

Cloud Infrastructure Management in the Age of AI Agents
di: Yang, Zhenning, et al.
Pubblicazione: (2025)

Experiment-as-Code Labs: A Declarative Stack for AI-Driven Scientific Discovery
di: Yang, Zhenning, et al.
Pubblicazione: (2026)

Ambig-IaC: Multi-level Disambiguation for Interactive Cloud Infrastructure-as-Code Synthesis
di: Yang, Zhenning, et al.
Pubblicazione: (2026)

SWE-Protégé: Learning to Selectively Collaborate With an Expert Unlocks Small Language Models as Software Engineering Agents
di: Kon, Patrick Tser Jern, et al.
Pubblicazione: (2026)

Andes: Defining and Enhancing Quality-of-Experience in LLM-Based Text Streaming Services
di: Liu, Jiachen, et al.
Pubblicazione: (2024)

Software-Defined Agentic Serving
di: Agarwal, Saurabh, et al.
Pubblicazione: (2026)

Dora: QoE-Aware Hybrid Parallelism for Distributed Edge AI
di: Jin, Jianli, et al.
Pubblicazione: (2025)

Toward Cross-Layer Energy Optimizations in AI Systems
di: Chung, Jae-Won, et al.
Pubblicazione: (2024)

FedTrans: Efficient Federated Learning via Multi-Model Transformation
di: Zhu, Yuxuan, et al.
Pubblicazione: (2024)

RAG over Thinking Traces Can Improve Reasoning Tasks
di: Arabzadeh, Negar, et al.
Pubblicazione: (2026)

Can QPP Choose the Right Query Variant? Evaluating Query Variant Selection for RAG Pipelines
di: Arabzadeh, Negar, et al.
Pubblicazione: (2026)

Model-Based Diagnosis: Automating End-to-End Diagnosis of Network Failures
di: Wu, Changrong, et al.
Pubblicazione: (2025)

Nalar: An agent serving framework
di: Laju, Marco, et al.
Pubblicazione: (2026)

Addressing Variable Heterogeneity in Distributed Multimodal Training with Entrain
di: Jang, Insu, et al.
Pubblicazione: (2026)

Venn: Resource Management for Collaborative Learning Jobs
di: Liu, Jiachen, et al.
Pubblicazione: (2023)

Efficient Distributed MLLM Training with Cornstarch
di: Jang, Insu, et al.
Pubblicazione: (2025)

Cornserve: A Distributed Serving System for Any-to-Any Multimodal Models
di: Chung, Jae-Won, et al.
Pubblicazione: (2026)

Reasoning Models Can Be Effective Without Thinking
di: Ma, Wenjie, et al.
Pubblicazione: (2025)

Networks of Networks: Complexity Class Principles Applied to Compound AI Systems Design
di: Davis, Jared Quincy, et al.
Pubblicazione: (2024)

AI-Driven Research for Databases
di: Cheng, Audrey, et al.
Pubblicazione: (2026)

I Can Embrace and Avoid Vagueness Myself: Supporting the Design Process by Balancing Vagueness through Text-to-Image Generative AI
di: Kim, Myungjin, et al.
Pubblicazione: (2024)

Optimizing Model Selection for Compound AI Systems
di: Chen, Lingjiao, et al.
Pubblicazione: (2025)

Disaggregating Embedding Recommendation Systems with FlexEMR
di: Huang, Yibo, et al.
Pubblicazione: (2024)

Can Agentic AI Match the Performance of Human Data Scientists?
di: Luo, An, et al.
Pubblicazione: (2025)

SIEVE: Sample-Efficient Parametric Learning from Natural Language
di: Asawa, Parth, et al.
Pubblicazione: (2026)

Semantic Operators: A Declarative Model for Rich, AI-based Data Processing
di: Patel, Liana, et al.
Pubblicazione: (2024)

Can GenAI Move from Individual Use to Collaborative Work? Experiences, Challenges, and Opportunities of Coordinating GenAI into Collaborative Newswork
di: Xiao, Qing, et al.
Pubblicazione: (2025)

Let the Barbarians In: How AI Can Accelerate Systems Performance Research
di: Cheng, Audrey, et al.
Pubblicazione: (2025)

DeepScholar-Bench: A Live Benchmark and Automated Evaluation for Generative Research Synthesis
di: Patel, Liana, et al.
Pubblicazione: (2025)

Cornfigurator: Automated Planning for Any-to-Any Multimodal Model Serving
di: Ma, Jeff J., et al.
Pubblicazione: (2025)

KAIROS: Stateful, Context-Aware Power-Efficient Agentic Inference Serving
di: Yuan, Yichao, et al.
Pubblicazione: (2026)

Mordal: Automated Pretrained Model Selection for Vision Language Models
di: He, Shiqi, et al.
Pubblicazione: (2025)

ACORN: Performant and Predicate-Agnostic Search Over Vector Embeddings and Structured Data
di: Patel, Liana, et al.
Pubblicazione: (2024)

World Model on Million-Length Video And Language With Blockwise RingAttention
di: Liu, Hao, et al.
Pubblicazione: (2024)

Text2SQL is Not Enough: Unifying AI and Databases with TAG
di: Biswal, Asim, et al.
Pubblicazione: (2024)

OpenG2G: A Simulation Platform for AI Datacenter-Grid Runtime Coordination
di: Chung, Jae-Won, et al.
Pubblicazione: (2026)

Characterizing Truthfulness in Large Language Model Generations with Local Intrinsic Dimension
di: Yin, Fan, et al.
Pubblicazione: (2024)

RAW: A Robust and Agile Plug-and-Play Watermark Framework for AI-Generated Images with Provable Guarantees
di: Xian, Xun, et al.
Pubblicazione: (2024)

Kareus: Joint Reduction of Dynamic and Static Energy in Large Model Training
di: Wu, Ruofan, et al.
Pubblicazione: (2026)