Gespeichert in:
| Hauptverfasser: | Wu, Haoran, Xiao, Can, Nie, Jiayi, Guo, Xuan, Lou, Binglei, Wong, Jeffrey T. H., Mo, Zhiwen, Zhang, Cheng, Forys, Przemyslaw, Ai, Chengyang, Adeniran, Timi, Luk, Wayne, Fan, Hongxiang, Cheng, Jianyi, Jones, Timothy M., Antonova, Rika, Mullins, Robert, Zhao, Aaron |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2025
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2509.09505 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
MemExplorer: Navigating the Heterogeneous Memory Design Space for Agentic Inference NPUs
von: Wu, Haoran, et al.
Veröffentlicht: (2026)
von: Wu, Haoran, et al.
Veröffentlicht: (2026)
KernelCraft: Benchmarking for Agentic Close-to-Metal Kernel Generation on Emerging Hardware
von: Nie, Jiayi, et al.
Veröffentlicht: (2026)
von: Nie, Jiayi, et al.
Veröffentlicht: (2026)
NPU Design for Diffusion Language Model Inference
von: Lou, Binglei, et al.
Veröffentlicht: (2026)
von: Lou, Binglei, et al.
Veröffentlicht: (2026)
ASPO: Constraint-Aware Bayesian Optimization for FPGA-based Soft Processors
von: Wu, Haoran, et al.
Veröffentlicht: (2025)
von: Wu, Haoran, et al.
Veröffentlicht: (2025)
FastTTS: Accelerating Test-Time Scaling for Edge LLM Reasoning
von: Chen, Hao Mark, et al.
Veröffentlicht: (2025)
von: Chen, Hao Mark, et al.
Veröffentlicht: (2025)
DiffCloud: Real-to-Sim from Point Clouds with Differentiable Simulation and Rendering of Deformable Objects
von: Sundaresan, Priya, et al.
Veröffentlicht: (2022)
von: Sundaresan, Priya, et al.
Veröffentlicht: (2022)
Enhancing LLM-based Quantum Code Generation with Multi-Agent Optimization and Quantum Error Correction
von: Campbell, Charlie, et al.
Veröffentlicht: (2025)
von: Campbell, Charlie, et al.
Veröffentlicht: (2025)
Dynamic Expert Sharing: Decoupling Memory from Parallelism in Mixture-of-Experts Diffusion LLMs
von: Chen, Hao Mark, et al.
Veröffentlicht: (2026)
von: Chen, Hao Mark, et al.
Veröffentlicht: (2026)
Deep Kernel Fusion for Transformers
von: Zhang, Zixi, et al.
Veröffentlicht: (2026)
von: Zhang, Zixi, et al.
Veröffentlicht: (2026)
Low-Latency FPGA Control System for Real-Time Neural Network Processing in CCD-Based Trapped-Ion Qubit Measurement
von: Lou, Binglei, et al.
Veröffentlicht: (2025)
von: Lou, Binglei, et al.
Veröffentlicht: (2025)
Accelerating MRI Uncertainty Estimation with Mask-based Bayesian Neural Network
von: Zhang, Zehuan, et al.
Veröffentlicht: (2024)
von: Zhang, Zehuan, et al.
Veröffentlicht: (2024)
Refining Datapath for Microscaling ViTs
von: Xiao, Can, et al.
Veröffentlicht: (2025)
von: Xiao, Can, et al.
Veröffentlicht: (2025)
Group Policy Gradient
von: Chen, Junhua, et al.
Veröffentlicht: (2025)
von: Chen, Junhua, et al.
Veröffentlicht: (2025)
Enhancing Trustworthiness with Mixed Precision: Benchmarks, Opportunities, and Challenges
von: Lu, Guanxi, et al.
Veröffentlicht: (2025)
von: Lu, Guanxi, et al.
Veröffentlicht: (2025)
Hardware-Aware Neural Dropout Search for Reliable Uncertainty Prediction on FPGA
von: Zhang, Zehuan, et al.
Veröffentlicht: (2024)
von: Zhang, Zehuan, et al.
Veröffentlicht: (2024)
Enhancing LUT-based Deep Neural Networks Inference through Architecture and Connectivity Optimization
von: Lou, Binglei, et al.
Veröffentlicht: (2026)
von: Lou, Binglei, et al.
Veröffentlicht: (2026)
SparseLUT: Sparse Connectivity Optimization for Lookup Table-based Deep Neural Networks
von: Lou, Binglei, et al.
Veröffentlicht: (2025)
von: Lou, Binglei, et al.
Veröffentlicht: (2025)
Information Literacy Program for Student Athletes at the University of Iowa.
von: Forys, Marsha, et al.
Veröffentlicht: (2000)
von: Forys, Marsha, et al.
Veröffentlicht: (2000)
DeepStack: Scalable and Accurate Design Space Exploration for Distributed 3D-Stacked AI Accelerators
von: Mo, Zhiwen, et al.
Veröffentlicht: (2026)
von: Mo, Zhiwen, et al.
Veröffentlicht: (2026)
TriAxialKV: Toward Extreme Low-Precision KV-Cache Quantization for Agentic Inference Tasks
von: Shen, Hanzhang, et al.
Veröffentlicht: (2026)
von: Shen, Hanzhang, et al.
Veröffentlicht: (2026)
FW-Merging: Scaling Model Merging with Frank-Wolfe Optimization
von: Chen, Hao Mark, et al.
Veröffentlicht: (2025)
von: Chen, Hao Mark, et al.
Veröffentlicht: (2025)
MetaML-Pro: Cross-Stage Design Flow Automation for Efficient Deep Learning Acceleration
von: Que, Zhiqiang, et al.
Veröffentlicht: (2025)
von: Que, Zhiqiang, et al.
Veröffentlicht: (2025)
Enthuse: Efficient Adaptable High-throughput Streaming Aggregation Engines
von: Papaphilippou, Philippos, et al.
Veröffentlicht: (2024)
von: Papaphilippou, Philippos, et al.
Veröffentlicht: (2024)
Deformable Cargo Transport in Microgravity with Astrobee
von: Morton, Daniel, et al.
Veröffentlicht: (2025)
von: Morton, Daniel, et al.
Veröffentlicht: (2025)
A anquilose tíbio-társica e sua importância na insuficiência venosa crônica
von: Jorge Ribas Timi
Veröffentlicht: (2009)
von: Jorge Ribas Timi
Veröffentlicht: (2009)
BGC_DB
von: Wang, Binglei
Veröffentlicht: (2026)
von: Wang, Binglei
Veröffentlicht: (2026)
Maize root metagenome project part4
von: Wang, Binglei
Veröffentlicht: (2025)
von: Wang, Binglei
Veröffentlicht: (2025)
Versatile Cross-platform Compilation Toolchain for Schrödinger-style Quantum Circuit Simulation
von: Lu, Yuncheng, et al.
Veröffentlicht: (2025)
von: Lu, Yuncheng, et al.
Veröffentlicht: (2025)
fSEAD: a Composable FPGA-based Streaming Ensemble Anomaly Detection Library
von: Lou, Binglei, et al.
Veröffentlicht: (2024)
von: Lou, Binglei, et al.
Veröffentlicht: (2024)
Children of the Creator's Words: The Great Mystery
von: Akinlembola, Adeniran
Veröffentlicht: (2026)
von: Akinlembola, Adeniran
Veröffentlicht: (2026)
Simplified model of immunotherapy for glioblastoma multiforme: cancer stem cells hypothesis perspective
von: Jochymczyk, Wiktor, et al.
Veröffentlicht: (2025)
von: Jochymczyk, Wiktor, et al.
Veröffentlicht: (2025)
Enhancing Dropout-based Bayesian Neural Networks with Multi-Exit on FPGA
von: Chen, Hao Mark, et al.
Veröffentlicht: (2024)
von: Chen, Hao Mark, et al.
Veröffentlicht: (2024)
Persistência da artéria hipoglossa: relato de caso
von: Jorge Rufino Ribas Timi
Veröffentlicht: (2014)
von: Jorge Rufino Ribas Timi
Veröffentlicht: (2014)
The Algorithm of Affluence: Digital Media, Spectacular Wealth, and the Transformation of Work Ethic in Nigeria's Public Sphere
von: Dr Oyindoubra Timi-Wood
Veröffentlicht: (2026)
von: Dr Oyindoubra Timi-Wood
Veröffentlicht: (2026)
Bounded ribbonlength for knot families and multi-twist Möbius bands
von: Denne, Elizabeth, et al.
Veröffentlicht: (2025)
von: Denne, Elizabeth, et al.
Veröffentlicht: (2025)
A importância do uso dos descritores nas publicações médicas
von: Jorge R. Ribas Timi
Veröffentlicht: (2005)
von: Jorge R. Ribas Timi
Veröffentlicht: (2005)
Cirurgia de varizes dos membros inferiores em pacientes receptores de transplante hepático: relato de caso
von: Jorge R. Ribas Timi
Veröffentlicht: (2009)
von: Jorge R. Ribas Timi
Veröffentlicht: (2009)
Mobi-$π$: Mobilizing Your Robot Learning Policy
von: Yang, Jingyun, et al.
Veröffentlicht: (2025)
von: Yang, Jingyun, et al.
Veröffentlicht: (2025)
EquivAct: SIM(3)-Equivariant Visuomotor Policies beyond Rigid Object Manipulation
von: Yang, Jingyun, et al.
Veröffentlicht: (2023)
von: Yang, Jingyun, et al.
Veröffentlicht: (2023)
Metric mean dimension of irregular sets for maps with shadowing
von: Foryś-Krawiec, Magdalena, et al.
Veröffentlicht: (2022)
von: Foryś-Krawiec, Magdalena, et al.
Veröffentlicht: (2022)
Ähnliche Einträge
-
MemExplorer: Navigating the Heterogeneous Memory Design Space for Agentic Inference NPUs
von: Wu, Haoran, et al.
Veröffentlicht: (2026) -
KernelCraft: Benchmarking for Agentic Close-to-Metal Kernel Generation on Emerging Hardware
von: Nie, Jiayi, et al.
Veröffentlicht: (2026) -
NPU Design for Diffusion Language Model Inference
von: Lou, Binglei, et al.
Veröffentlicht: (2026) -
ASPO: Constraint-Aware Bayesian Optimization for FPGA-based Soft Processors
von: Wu, Haoran, et al.
Veröffentlicht: (2025) -
FastTTS: Accelerating Test-Time Scaling for Edge LLM Reasoning
von: Chen, Hao Mark, et al.
Veröffentlicht: (2025)