Salvato in:
| Autori principali: | Haghi, Pouya, Guo, Anqi, Geng, Tong, Skjellum, Anthony, Herbordt, Martin |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2025
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2501.18749 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
FEATHER: A Reconfigurable Accelerator with Data Reordering Support for Low-Cost On-Chip Dataflow Switching
di: Tong, Jianming, et al.
Pubblicazione: (2024)
di: Tong, Jianming, et al.
Pubblicazione: (2024)
Enabling Efficient Hardware Acceleration of Hybrid Vision Transformer (ViT) Networks at the Edge
di: Dumoulin, Joren, et al.
Pubblicazione: (2025)
di: Dumoulin, Joren, et al.
Pubblicazione: (2025)
Shared-PIM: Enabling Concurrent Computation and Data Flow for Faster Processing-in-DRAM
di: Mamdouh, Ahmed, et al.
Pubblicazione: (2024)
di: Mamdouh, Ahmed, et al.
Pubblicazione: (2024)
Stream: Design Space Exploration of Layer-Fused DNNs on Heterogeneous Dataflow Accelerators
di: Symons, Arne, et al.
Pubblicazione: (2022)
di: Symons, Arne, et al.
Pubblicazione: (2022)
Pack my weights and run! Minimizing overheads for in-memory computing accelerators
di: Houshmand, Pouya, et al.
Pubblicazione: (2024)
di: Houshmand, Pouya, et al.
Pubblicazione: (2024)
SPAC: Automating FPGA-based Network Switches with Protocol Adaptive Customization
di: Li, Guoyu, et al.
Pubblicazione: (2026)
di: Li, Guoyu, et al.
Pubblicazione: (2026)
Different Perspectives of Memory System Simulation
di: Esmaili-Dokht, Pouya, et al.
Pubblicazione: (2026)
di: Esmaili-Dokht, Pouya, et al.
Pubblicazione: (2026)
Fletch: File-System Metadata Caching in Programmable Switches
di: Liu, Qingxiu, et al.
Pubblicazione: (2025)
di: Liu, Qingxiu, et al.
Pubblicazione: (2025)
Ultra Low-Power SDM-based Circuit-Switching for Networks-on-Chip
di: Zaeemi, Meysam, et al.
Pubblicazione: (2026)
di: Zaeemi, Meysam, et al.
Pubblicazione: (2026)
A Switch-Centric In-Network Architecture for Accelerating LLM Inference in Shared-Memory Network
di: Jiang, Aojie, et al.
Pubblicazione: (2026)
di: Jiang, Aojie, et al.
Pubblicazione: (2026)
In-place Switch: Reprogramming based SLC Cache Design for Hybrid 3D SSDs
di: Yang, Xufeng, et al.
Pubblicazione: (2024)
di: Yang, Xufeng, et al.
Pubblicazione: (2024)
Performance and Energy Benefits of MRDIMMs
di: Díaz, Pau, et al.
Pubblicazione: (2026)
di: Díaz, Pau, et al.
Pubblicazione: (2026)
Switch-Less Dragonfly on Wafers: A Scalable Interconnection Architecture based on Wafer-Scale Integration
di: Feng, Yinxiao, et al.
Pubblicazione: (2024)
di: Feng, Yinxiao, et al.
Pubblicazione: (2024)
PIFS-Rec: Process-In-Fabric-Switch for Large-Scale Recommendation System Inferences
di: Huo, Pingyi, et al.
Pubblicazione: (2024)
di: Huo, Pingyi, et al.
Pubblicazione: (2024)
SpecMamba: Accelerating Mamba Inference on FPGA with Speculative Decoding
di: Zhong, Linfeng, et al.
Pubblicazione: (2025)
di: Zhong, Linfeng, et al.
Pubblicazione: (2025)
GCoD: Graph Convolutional Network Acceleration via Dedicated Algorithm and Accelerator Co-Design
di: You, Haoran, et al.
Pubblicazione: (2021)
di: You, Haoran, et al.
Pubblicazione: (2021)
Splatonic: Architecture Support for 3D Gaussian Splatting SLAM via Sparse Processing
di: Huang, Xiaotong, et al.
Pubblicazione: (2025)
di: Huang, Xiaotong, et al.
Pubblicazione: (2025)
FlatAttention: Dataflow and Fabric Collectives Co-Optimization for Large Attention-Based Model Inference on Tile-Based Accelerators
di: Zhang, Chi, et al.
Pubblicazione: (2026)
di: Zhang, Chi, et al.
Pubblicazione: (2026)
FERIVer: An FPGA-assisted Emulated Framework for RTL Verification of RISC-V Processors
di: Qin, Kun, et al.
Pubblicazione: (2025)
di: Qin, Kun, et al.
Pubblicazione: (2025)
FlatAttention: Dataflow and Fabric Collectives Co-Optimization for Efficient Multi-Head Attention on Tile-Based Many-PE Accelerators
di: Zhang, Chi, et al.
Pubblicazione: (2025)
di: Zhang, Chi, et al.
Pubblicazione: (2025)
PIMSYN: Synthesizing Processing-in-memory CNN Accelerators
di: Li, Wanqian, et al.
Pubblicazione: (2024)
di: Li, Wanqian, et al.
Pubblicazione: (2024)
Open-source Stand-Alone Versatile Tensor Accelerator
di: Faure-Gignoux, Anthony, et al.
Pubblicazione: (2025)
di: Faure-Gignoux, Anthony, et al.
Pubblicazione: (2025)
Compilation and Execution of an Embeddable YOLO-NAS on the VTA
di: Faure-Gignoux, Anthony, et al.
Pubblicazione: (2026)
di: Faure-Gignoux, Anthony, et al.
Pubblicazione: (2026)
Flexible In-NAND Cryptographic Processing for Secure Flash Storage
di: Noh, Seock-Hwan, et al.
Pubblicazione: (2025)
di: Noh, Seock-Hwan, et al.
Pubblicazione: (2025)
Containerized In-Storage Processing and Computing-Enabled SSD Disaggregation
di: Kwon, Miryeong, et al.
Pubblicazione: (2025)
di: Kwon, Miryeong, et al.
Pubblicazione: (2025)
RTGPU: Real-Time Computing with Graphics Processing Units
di: Gheibi-Fetrat, Atiyeh, et al.
Pubblicazione: (2025)
di: Gheibi-Fetrat, Atiyeh, et al.
Pubblicazione: (2025)
FPPS: An FPGA-Based Point Cloud Processing System
di: Zhou, Xiaofeng, et al.
Pubblicazione: (2026)
di: Zhou, Xiaofeng, et al.
Pubblicazione: (2026)
ATiM: Autotuning Tensor Programs for Processing-in-DRAM
di: Shin, Yongwon, et al.
Pubblicazione: (2024)
di: Shin, Yongwon, et al.
Pubblicazione: (2024)
VerilogCL: A Contrastive Learning Framework for Robust LLM-Based Verilog Generation
di: Tan, Yan, et al.
Pubblicazione: (2026)
di: Tan, Yan, et al.
Pubblicazione: (2026)
The Quest for Reliable AI Accelerators: Cross-Layer Evaluation and Design Optimization
di: Li, Meng, et al.
Pubblicazione: (2026)
di: Li, Meng, et al.
Pubblicazione: (2026)
DRIFT: Harnessing Inherent Fault Tolerance for Efficient and Reliable Diffusion Model Inference
di: Wen, Jinqi, et al.
Pubblicazione: (2026)
di: Wen, Jinqi, et al.
Pubblicazione: (2026)
Mapping Space Exploration for Multi-Chiplet Accelerators Targeting LLM Inference Serving Workloads
di: Li, Boyu, et al.
Pubblicazione: (2025)
di: Li, Boyu, et al.
Pubblicazione: (2025)
Linear Complexity Fermionic Simulation on Quantum Devices with Hardware Connectivity Constraints
di: Gao, Xiangyu, et al.
Pubblicazione: (2026)
di: Gao, Xiangyu, et al.
Pubblicazione: (2026)
Lost and Found in Speculation: Hybrid Speculative Vulnerability Detection
di: Rostami, Mohamadreza, et al.
Pubblicazione: (2024)
di: Rostami, Mohamadreza, et al.
Pubblicazione: (2024)
DL-PIM: Improving Data Locality in Processing-in-Memory Systems
di: Tian, Parker Hao, et al.
Pubblicazione: (2025)
di: Tian, Parker Hao, et al.
Pubblicazione: (2025)
ReGate: Enabling Power Gating in Neural Processing Units
di: Xue, Yuqi, et al.
Pubblicazione: (2025)
di: Xue, Yuqi, et al.
Pubblicazione: (2025)
Enabling Efficient Transaction Processing on CXL-Based Memory Sharing
di: Wang, Zhao, et al.
Pubblicazione: (2025)
di: Wang, Zhao, et al.
Pubblicazione: (2025)
Allspark: Workload Orchestration for Visual Transformers on Processing In-Memory Systems
di: Ge, Mengke, et al.
Pubblicazione: (2024)
di: Ge, Mengke, et al.
Pubblicazione: (2024)
PIMCOMP: An End-to-End DNN Compiler for Processing-In-Memory Accelerators
di: Sun, Xiaotian, et al.
Pubblicazione: (2024)
di: Sun, Xiaotian, et al.
Pubblicazione: (2024)
Morphlux: Transforming Torus Fabrics for Efficient Multi-tenant ML
di: Kumar, Abhishek Vijaya, et al.
Pubblicazione: (2025)
di: Kumar, Abhishek Vijaya, et al.
Pubblicazione: (2025)
Documenti analoghi
-
FEATHER: A Reconfigurable Accelerator with Data Reordering Support for Low-Cost On-Chip Dataflow Switching
di: Tong, Jianming, et al.
Pubblicazione: (2024) -
Enabling Efficient Hardware Acceleration of Hybrid Vision Transformer (ViT) Networks at the Edge
di: Dumoulin, Joren, et al.
Pubblicazione: (2025) -
Shared-PIM: Enabling Concurrent Computation and Data Flow for Faster Processing-in-DRAM
di: Mamdouh, Ahmed, et al.
Pubblicazione: (2024) -
Stream: Design Space Exploration of Layer-Fused DNNs on Heterogeneous Dataflow Accelerators
di: Symons, Arne, et al.
Pubblicazione: (2022) -
Pack my weights and run! Minimizing overheads for in-memory computing accelerators
di: Houshmand, Pouya, et al.
Pubblicazione: (2024)