Salvato in:
| Autori principali: | Kon, Patrick Tser Jern, Liu, Jiachen, Zhu, Xinyi, Ding, Qiuyi, Peng, Jingjia, Xing, Jiarong, Huang, Yibo, Qiu, Yiming, Srinivasa, Jayanth, Lee, Myungjin, Chowdhury, Mosharaf, Zaharia, Matei, Chen, Ang |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2025
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2505.24785 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
Curie: Toward Rigorous and Automated Scientific Experimentation with AI Agents
di: Kon, Patrick Tser Jern, et al.
Pubblicazione: (2025)
di: Kon, Patrick Tser Jern, et al.
Pubblicazione: (2025)
Cloud Infrastructure Management in the Age of AI Agents
di: Yang, Zhenning, et al.
Pubblicazione: (2025)
di: Yang, Zhenning, et al.
Pubblicazione: (2025)
Experiment-as-Code Labs: A Declarative Stack for AI-Driven Scientific Discovery
di: Yang, Zhenning, et al.
Pubblicazione: (2026)
di: Yang, Zhenning, et al.
Pubblicazione: (2026)
Ambig-IaC: Multi-level Disambiguation for Interactive Cloud Infrastructure-as-Code Synthesis
di: Yang, Zhenning, et al.
Pubblicazione: (2026)
di: Yang, Zhenning, et al.
Pubblicazione: (2026)
SWE-Protégé: Learning to Selectively Collaborate With an Expert Unlocks Small Language Models as Software Engineering Agents
di: Kon, Patrick Tser Jern, et al.
Pubblicazione: (2026)
di: Kon, Patrick Tser Jern, et al.
Pubblicazione: (2026)
Andes: Defining and Enhancing Quality-of-Experience in LLM-Based Text Streaming Services
di: Liu, Jiachen, et al.
Pubblicazione: (2024)
di: Liu, Jiachen, et al.
Pubblicazione: (2024)
Software-Defined Agentic Serving
di: Agarwal, Saurabh, et al.
Pubblicazione: (2026)
di: Agarwal, Saurabh, et al.
Pubblicazione: (2026)
Dora: QoE-Aware Hybrid Parallelism for Distributed Edge AI
di: Jin, Jianli, et al.
Pubblicazione: (2025)
di: Jin, Jianli, et al.
Pubblicazione: (2025)
Toward Cross-Layer Energy Optimizations in AI Systems
di: Chung, Jae-Won, et al.
Pubblicazione: (2024)
di: Chung, Jae-Won, et al.
Pubblicazione: (2024)
FedTrans: Efficient Federated Learning via Multi-Model Transformation
di: Zhu, Yuxuan, et al.
Pubblicazione: (2024)
di: Zhu, Yuxuan, et al.
Pubblicazione: (2024)
RAG over Thinking Traces Can Improve Reasoning Tasks
di: Arabzadeh, Negar, et al.
Pubblicazione: (2026)
di: Arabzadeh, Negar, et al.
Pubblicazione: (2026)
Can QPP Choose the Right Query Variant? Evaluating Query Variant Selection for RAG Pipelines
di: Arabzadeh, Negar, et al.
Pubblicazione: (2026)
di: Arabzadeh, Negar, et al.
Pubblicazione: (2026)
Model-Based Diagnosis: Automating End-to-End Diagnosis of Network Failures
di: Wu, Changrong, et al.
Pubblicazione: (2025)
di: Wu, Changrong, et al.
Pubblicazione: (2025)
Nalar: An agent serving framework
di: Laju, Marco, et al.
Pubblicazione: (2026)
di: Laju, Marco, et al.
Pubblicazione: (2026)
Addressing Variable Heterogeneity in Distributed Multimodal Training with Entrain
di: Jang, Insu, et al.
Pubblicazione: (2026)
di: Jang, Insu, et al.
Pubblicazione: (2026)
Venn: Resource Management for Collaborative Learning Jobs
di: Liu, Jiachen, et al.
Pubblicazione: (2023)
di: Liu, Jiachen, et al.
Pubblicazione: (2023)
Efficient Distributed MLLM Training with Cornstarch
di: Jang, Insu, et al.
Pubblicazione: (2025)
di: Jang, Insu, et al.
Pubblicazione: (2025)
Cornserve: A Distributed Serving System for Any-to-Any Multimodal Models
di: Chung, Jae-Won, et al.
Pubblicazione: (2026)
di: Chung, Jae-Won, et al.
Pubblicazione: (2026)
Reasoning Models Can Be Effective Without Thinking
di: Ma, Wenjie, et al.
Pubblicazione: (2025)
di: Ma, Wenjie, et al.
Pubblicazione: (2025)
Networks of Networks: Complexity Class Principles Applied to Compound AI Systems Design
di: Davis, Jared Quincy, et al.
Pubblicazione: (2024)
di: Davis, Jared Quincy, et al.
Pubblicazione: (2024)
AI-Driven Research for Databases
di: Cheng, Audrey, et al.
Pubblicazione: (2026)
di: Cheng, Audrey, et al.
Pubblicazione: (2026)
I Can Embrace and Avoid Vagueness Myself: Supporting the Design Process by Balancing Vagueness through Text-to-Image Generative AI
di: Kim, Myungjin, et al.
Pubblicazione: (2024)
di: Kim, Myungjin, et al.
Pubblicazione: (2024)
Optimizing Model Selection for Compound AI Systems
di: Chen, Lingjiao, et al.
Pubblicazione: (2025)
di: Chen, Lingjiao, et al.
Pubblicazione: (2025)
Disaggregating Embedding Recommendation Systems with FlexEMR
di: Huang, Yibo, et al.
Pubblicazione: (2024)
di: Huang, Yibo, et al.
Pubblicazione: (2024)
Can Agentic AI Match the Performance of Human Data Scientists?
di: Luo, An, et al.
Pubblicazione: (2025)
di: Luo, An, et al.
Pubblicazione: (2025)
SIEVE: Sample-Efficient Parametric Learning from Natural Language
di: Asawa, Parth, et al.
Pubblicazione: (2026)
di: Asawa, Parth, et al.
Pubblicazione: (2026)
Semantic Operators: A Declarative Model for Rich, AI-based Data Processing
di: Patel, Liana, et al.
Pubblicazione: (2024)
di: Patel, Liana, et al.
Pubblicazione: (2024)
Can GenAI Move from Individual Use to Collaborative Work? Experiences, Challenges, and Opportunities of Coordinating GenAI into Collaborative Newswork
di: Xiao, Qing, et al.
Pubblicazione: (2025)
di: Xiao, Qing, et al.
Pubblicazione: (2025)
Let the Barbarians In: How AI Can Accelerate Systems Performance Research
di: Cheng, Audrey, et al.
Pubblicazione: (2025)
di: Cheng, Audrey, et al.
Pubblicazione: (2025)
DeepScholar-Bench: A Live Benchmark and Automated Evaluation for Generative Research Synthesis
di: Patel, Liana, et al.
Pubblicazione: (2025)
di: Patel, Liana, et al.
Pubblicazione: (2025)
Cornfigurator: Automated Planning for Any-to-Any Multimodal Model Serving
di: Ma, Jeff J., et al.
Pubblicazione: (2025)
di: Ma, Jeff J., et al.
Pubblicazione: (2025)
KAIROS: Stateful, Context-Aware Power-Efficient Agentic Inference Serving
di: Yuan, Yichao, et al.
Pubblicazione: (2026)
di: Yuan, Yichao, et al.
Pubblicazione: (2026)
Mordal: Automated Pretrained Model Selection for Vision Language Models
di: He, Shiqi, et al.
Pubblicazione: (2025)
di: He, Shiqi, et al.
Pubblicazione: (2025)
ACORN: Performant and Predicate-Agnostic Search Over Vector Embeddings and Structured Data
di: Patel, Liana, et al.
Pubblicazione: (2024)
di: Patel, Liana, et al.
Pubblicazione: (2024)
World Model on Million-Length Video And Language With Blockwise RingAttention
di: Liu, Hao, et al.
Pubblicazione: (2024)
di: Liu, Hao, et al.
Pubblicazione: (2024)
Text2SQL is Not Enough: Unifying AI and Databases with TAG
di: Biswal, Asim, et al.
Pubblicazione: (2024)
di: Biswal, Asim, et al.
Pubblicazione: (2024)
OpenG2G: A Simulation Platform for AI Datacenter-Grid Runtime Coordination
di: Chung, Jae-Won, et al.
Pubblicazione: (2026)
di: Chung, Jae-Won, et al.
Pubblicazione: (2026)
Characterizing Truthfulness in Large Language Model Generations with Local Intrinsic Dimension
di: Yin, Fan, et al.
Pubblicazione: (2024)
di: Yin, Fan, et al.
Pubblicazione: (2024)
RAW: A Robust and Agile Plug-and-Play Watermark Framework for AI-Generated Images with Provable Guarantees
di: Xian, Xun, et al.
Pubblicazione: (2024)
di: Xian, Xun, et al.
Pubblicazione: (2024)
Kareus: Joint Reduction of Dynamic and Static Energy in Large Model Training
di: Wu, Ruofan, et al.
Pubblicazione: (2026)
di: Wu, Ruofan, et al.
Pubblicazione: (2026)
Documenti analoghi
-
Curie: Toward Rigorous and Automated Scientific Experimentation with AI Agents
di: Kon, Patrick Tser Jern, et al.
Pubblicazione: (2025) -
Cloud Infrastructure Management in the Age of AI Agents
di: Yang, Zhenning, et al.
Pubblicazione: (2025) -
Experiment-as-Code Labs: A Declarative Stack for AI-Driven Scientific Discovery
di: Yang, Zhenning, et al.
Pubblicazione: (2026) -
Ambig-IaC: Multi-level Disambiguation for Interactive Cloud Infrastructure-as-Code Synthesis
di: Yang, Zhenning, et al.
Pubblicazione: (2026) -
SWE-Protégé: Learning to Selectively Collaborate With an Expert Unlocks Small Language Models as Software Engineering Agents
di: Kon, Patrick Tser Jern, et al.
Pubblicazione: (2026)