:: Library Catalog

Copertina

Salvato in:

Dettagli Bibliografici
Autori principali:	Haghi, Pouya, Guo, Anqi, Geng, Tong, Skjellum, Anthony, Herbordt, Martin
Natura:	Preprint
Pubblicazione:	2025
Soggetti:	Hardware Architecture
Accesso online:	https://arxiv.org/abs/2501.18749
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Documenti analoghi

FEATHER: A Reconfigurable Accelerator with Data Reordering Support for Low-Cost On-Chip Dataflow Switching
di: Tong, Jianming, et al.
Pubblicazione: (2024)

Enabling Efficient Hardware Acceleration of Hybrid Vision Transformer (ViT) Networks at the Edge
di: Dumoulin, Joren, et al.
Pubblicazione: (2025)

Shared-PIM: Enabling Concurrent Computation and Data Flow for Faster Processing-in-DRAM
di: Mamdouh, Ahmed, et al.
Pubblicazione: (2024)

Stream: Design Space Exploration of Layer-Fused DNNs on Heterogeneous Dataflow Accelerators
di: Symons, Arne, et al.
Pubblicazione: (2022)

Pack my weights and run! Minimizing overheads for in-memory computing accelerators
di: Houshmand, Pouya, et al.
Pubblicazione: (2024)

SPAC: Automating FPGA-based Network Switches with Protocol Adaptive Customization
di: Li, Guoyu, et al.
Pubblicazione: (2026)

Different Perspectives of Memory System Simulation
di: Esmaili-Dokht, Pouya, et al.
Pubblicazione: (2026)

Fletch: File-System Metadata Caching in Programmable Switches
di: Liu, Qingxiu, et al.
Pubblicazione: (2025)

Ultra Low-Power SDM-based Circuit-Switching for Networks-on-Chip
di: Zaeemi, Meysam, et al.
Pubblicazione: (2026)

A Switch-Centric In-Network Architecture for Accelerating LLM Inference in Shared-Memory Network
di: Jiang, Aojie, et al.
Pubblicazione: (2026)

In-place Switch: Reprogramming based SLC Cache Design for Hybrid 3D SSDs
di: Yang, Xufeng, et al.
Pubblicazione: (2024)

Performance and Energy Benefits of MRDIMMs
di: Díaz, Pau, et al.
Pubblicazione: (2026)

Switch-Less Dragonfly on Wafers: A Scalable Interconnection Architecture based on Wafer-Scale Integration
di: Feng, Yinxiao, et al.
Pubblicazione: (2024)

PIFS-Rec: Process-In-Fabric-Switch for Large-Scale Recommendation System Inferences
di: Huo, Pingyi, et al.
Pubblicazione: (2024)

SpecMamba: Accelerating Mamba Inference on FPGA with Speculative Decoding
di: Zhong, Linfeng, et al.
Pubblicazione: (2025)

GCoD: Graph Convolutional Network Acceleration via Dedicated Algorithm and Accelerator Co-Design
di: You, Haoran, et al.
Pubblicazione: (2021)

Splatonic: Architecture Support for 3D Gaussian Splatting SLAM via Sparse Processing
di: Huang, Xiaotong, et al.
Pubblicazione: (2025)

FlatAttention: Dataflow and Fabric Collectives Co-Optimization for Large Attention-Based Model Inference on Tile-Based Accelerators
di: Zhang, Chi, et al.
Pubblicazione: (2026)

FERIVer: An FPGA-assisted Emulated Framework for RTL Verification of RISC-V Processors
di: Qin, Kun, et al.
Pubblicazione: (2025)

FlatAttention: Dataflow and Fabric Collectives Co-Optimization for Efficient Multi-Head Attention on Tile-Based Many-PE Accelerators
di: Zhang, Chi, et al.
Pubblicazione: (2025)

PIMSYN: Synthesizing Processing-in-memory CNN Accelerators
di: Li, Wanqian, et al.
Pubblicazione: (2024)

Open-source Stand-Alone Versatile Tensor Accelerator
di: Faure-Gignoux, Anthony, et al.
Pubblicazione: (2025)

Compilation and Execution of an Embeddable YOLO-NAS on the VTA
di: Faure-Gignoux, Anthony, et al.
Pubblicazione: (2026)

Flexible In-NAND Cryptographic Processing for Secure Flash Storage
di: Noh, Seock-Hwan, et al.
Pubblicazione: (2025)

Containerized In-Storage Processing and Computing-Enabled SSD Disaggregation
di: Kwon, Miryeong, et al.
Pubblicazione: (2025)

RTGPU: Real-Time Computing with Graphics Processing Units
di: Gheibi-Fetrat, Atiyeh, et al.
Pubblicazione: (2025)

FPPS: An FPGA-Based Point Cloud Processing System
di: Zhou, Xiaofeng, et al.
Pubblicazione: (2026)

ATiM: Autotuning Tensor Programs for Processing-in-DRAM
di: Shin, Yongwon, et al.
Pubblicazione: (2024)

VerilogCL: A Contrastive Learning Framework for Robust LLM-Based Verilog Generation
di: Tan, Yan, et al.
Pubblicazione: (2026)

The Quest for Reliable AI Accelerators: Cross-Layer Evaluation and Design Optimization
di: Li, Meng, et al.
Pubblicazione: (2026)

DRIFT: Harnessing Inherent Fault Tolerance for Efficient and Reliable Diffusion Model Inference
di: Wen, Jinqi, et al.
Pubblicazione: (2026)

Mapping Space Exploration for Multi-Chiplet Accelerators Targeting LLM Inference Serving Workloads
di: Li, Boyu, et al.
Pubblicazione: (2025)

Linear Complexity Fermionic Simulation on Quantum Devices with Hardware Connectivity Constraints
di: Gao, Xiangyu, et al.
Pubblicazione: (2026)

Lost and Found in Speculation: Hybrid Speculative Vulnerability Detection
di: Rostami, Mohamadreza, et al.
Pubblicazione: (2024)

DL-PIM: Improving Data Locality in Processing-in-Memory Systems
di: Tian, Parker Hao, et al.
Pubblicazione: (2025)

ReGate: Enabling Power Gating in Neural Processing Units
di: Xue, Yuqi, et al.
Pubblicazione: (2025)

Enabling Efficient Transaction Processing on CXL-Based Memory Sharing
di: Wang, Zhao, et al.
Pubblicazione: (2025)

Allspark: Workload Orchestration for Visual Transformers on Processing In-Memory Systems
di: Ge, Mengke, et al.
Pubblicazione: (2024)

PIMCOMP: An End-to-End DNN Compiler for Processing-In-Memory Accelerators
di: Sun, Xiaotian, et al.
Pubblicazione: (2024)

Morphlux: Transforming Torus Fabrics for Efficient Multi-tenant ML
di: Kumar, Abhishek Vijaya, et al.
Pubblicazione: (2025)