Salvato in:
| Autori principali: | Ferry, Corentin, Derumigny, Nicolas, Derrien, Steven, Rajopadhye, Sanjay |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2024
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2401.12071 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
Pushing up to the Limit of Memory Bandwidth and Capacity Utilization for Efficient LLM Decoding on Embedded FPGA
di: Li, Jindong, et al.
Pubblicazione: (2025)
di: Li, Jindong, et al.
Pubblicazione: (2025)
Holistic Optimization Framework for FPGA Accelerators
di: Pouget, Stéphane, et al.
Pubblicazione: (2025)
di: Pouget, Stéphane, et al.
Pubblicazione: (2025)
always_comm: An FPGA-based Hardware Accelerator for Audio/Video Compression and Transmission
di: Parthasarathy, Rishab, et al.
Pubblicazione: (2025)
di: Parthasarathy, Rishab, et al.
Pubblicazione: (2025)
Mitigating the Bandwidth Wall via Data-Streaming System-Accelerator Co-Design
di: Liu, Qunyou, et al.
Pubblicazione: (2026)
di: Liu, Qunyou, et al.
Pubblicazione: (2026)
LEAPS: Topological-Layout-Adaptable Multi-Die FPGA Placement for Super Long Line Minimization
di: Di, Zhixiong, et al.
Pubblicazione: (2023)
di: Di, Zhixiong, et al.
Pubblicazione: (2023)
SIRA: Scaled-Integer Range Analysis for Optimizing FPGA Dataflow Neural Network Accelerators
di: Umuroglu, Yaman, et al.
Pubblicazione: (2025)
di: Umuroglu, Yaman, et al.
Pubblicazione: (2025)
FPGA-Optimized Hardware Accelerator for Fast Fourier Transform and Singular Value Decomposition in AI
di: Ding, Hong, et al.
Pubblicazione: (2025)
di: Ding, Hong, et al.
Pubblicazione: (2025)
Bombyx: OpenCilk Compilation for FPGA Hardware Acceleration
di: Shahawy, Mohamed, et al.
Pubblicazione: (2025)
di: Shahawy, Mohamed, et al.
Pubblicazione: (2025)
Implementation and Analysis of Thermometer Encoding in DWN FPGA Accelerators
di: Mecik, Michael, et al.
Pubblicazione: (2025)
di: Mecik, Michael, et al.
Pubblicazione: (2025)
A Scalable FPGA Architecture With Adaptive Memory Utilization for GEMM-Based Operations
di: Petropoulos, Anastasios, et al.
Pubblicazione: (2025)
di: Petropoulos, Anastasios, et al.
Pubblicazione: (2025)
An Optimizing Framework on MLIR for Efficient FPGA-based Accelerator Generation
di: Zhang, Weichuang, et al.
Pubblicazione: (2024)
di: Zhang, Weichuang, et al.
Pubblicazione: (2024)
SpecMamba: Accelerating Mamba Inference on FPGA with Speculative Decoding
di: Zhong, Linfeng, et al.
Pubblicazione: (2025)
di: Zhong, Linfeng, et al.
Pubblicazione: (2025)
A Reconfigurable Framework for AI-FPGA Agent Integration and Acceleration
di: Yunusoglu, Aybars, et al.
Pubblicazione: (2026)
di: Yunusoglu, Aybars, et al.
Pubblicazione: (2026)
A Novel FPGA-based CNN Hardware Accelerator: Optimization for Convolutional Layers using Karatsuba Ofman Multiplier
di: Sarkar, Amit
Pubblicazione: (2024)
di: Sarkar, Amit
Pubblicazione: (2024)
TRACE: Unlocking Effective CXL Bandwidth via Lossless Compression and Precision Scaling
di: Xie, Rui, et al.
Pubblicazione: (2025)
di: Xie, Rui, et al.
Pubblicazione: (2025)
IBEX: Internal Bandwidth-Efficient Compression Architecture for Scalable CXL Memory Expansion
di: Ko, Younghoon, et al.
Pubblicazione: (2026)
di: Ko, Younghoon, et al.
Pubblicazione: (2026)
Utilizing Layout Effects for Analog Logic Locking
di: Aljafar, Muayad J., et al.
Pubblicazione: (2024)
di: Aljafar, Muayad J., et al.
Pubblicazione: (2024)
A High-Throughput FPGA Accelerator for Lightweight CNNs With Balanced Dataflow
di: Zhao, Zhiyuan, et al.
Pubblicazione: (2024)
di: Zhao, Zhiyuan, et al.
Pubblicazione: (2024)
TurboFuzz: FPGA Accelerated Hardware Fuzzing for Processor Agile Verification
di: Zhong, Yang, et al.
Pubblicazione: (2025)
di: Zhong, Yang, et al.
Pubblicazione: (2025)
SuperUROP: An FPGA-Based Spatial Accelerator for Sparse Matrix Operations
di: Parthasarathy, Rishab
Pubblicazione: (2025)
di: Parthasarathy, Rishab
Pubblicazione: (2025)
Ecco: Improving Memory Bandwidth and Capacity for LLMs via Entropy-aware Cache Compression
di: Cheng, Feng, et al.
Pubblicazione: (2025)
di: Cheng, Feng, et al.
Pubblicazione: (2025)
FastFlow in FPGA Stacks of Data Centers
di: Paul, Rourab, et al.
Pubblicazione: (2024)
di: Paul, Rourab, et al.
Pubblicazione: (2024)
Swift: A Multi-FPGA Framework for Scaling Up Accelerated Graph Analytics
di: Jaiyeoba, Oluwole, et al.
Pubblicazione: (2024)
di: Jaiyeoba, Oluwole, et al.
Pubblicazione: (2024)
Hummingbird: A Smaller and Faster Large Language Model Accelerator on Embedded FPGA
di: Li, Jindong, et al.
Pubblicazione: (2025)
di: Li, Jindong, et al.
Pubblicazione: (2025)
FAST-Prefill: FPGA Accelerated Sparse Attention for Long Context LLM Prefill
di: Jayanth, Rakshith, et al.
Pubblicazione: (2026)
di: Jayanth, Rakshith, et al.
Pubblicazione: (2026)
Facial Expression Recognition System Using DNN Accelerator with Multi-threading on FPGA
di: Ando, Takuto, et al.
Pubblicazione: (2025)
di: Ando, Takuto, et al.
Pubblicazione: (2025)
SpeedLLM: An FPGA Co-design of Large Language Model Inference Accelerator
di: Wang, Peipei, et al.
Pubblicazione: (2025)
di: Wang, Peipei, et al.
Pubblicazione: (2025)
BOLT: Bandwidth-Optimized Lightning-Fast Oblivious Map powered by Secure HBM Accelerators
di: Guo, Yitong, et al.
Pubblicazione: (2025)
di: Guo, Yitong, et al.
Pubblicazione: (2025)
Graphitron: A Domain Specific Language for FPGA-based Graph Processing Accelerator Generation
di: Zhang, Xinmiao, et al.
Pubblicazione: (2024)
di: Zhang, Xinmiao, et al.
Pubblicazione: (2024)
Late Breaking Result: FPGA-Based Emulation and Fault Injection for CNN Inference Accelerators
di: Masar, Filip, et al.
Pubblicazione: (2025)
di: Masar, Filip, et al.
Pubblicazione: (2025)
Systolic Sparse Tensor Slices: FPGA Building Blocks for Sparse and Dense AI Acceleration
di: Taka, Endri, et al.
Pubblicazione: (2025)
di: Taka, Endri, et al.
Pubblicazione: (2025)
Towards Employing FPGA and ASIP Acceleration to Enable Onboard AI/ML in Space Applications
di: Leon, Vasileios, et al.
Pubblicazione: (2025)
di: Leon, Vasileios, et al.
Pubblicazione: (2025)
ZynqParrot: A Scale-Down Approach to Cycle-Accurate, FPGA-Accelerated Co-Emulation
di: Ruelas-Petrisko, Daniel, et al.
Pubblicazione: (2025)
di: Ruelas-Petrisko, Daniel, et al.
Pubblicazione: (2025)
FireFly-P: FPGA-Accelerated Spiking Neural Network Plasticity for Robust Adaptive Control
di: Li, Tenglong, et al.
Pubblicazione: (2026)
di: Li, Tenglong, et al.
Pubblicazione: (2026)
ISAAC: Intelligent, Scalable, Agile, and Accelerated CPU Verification via LLM-aided FPGA Parallelism
di: Sun, Jialin, et al.
Pubblicazione: (2025)
di: Sun, Jialin, et al.
Pubblicazione: (2025)
Generalized Ping-Pong: Off-Chip Memory Bandwidth Centric Pipelining Strategy for Processing-In-Memory Accelerators
di: Wang, Ruibao, et al.
Pubblicazione: (2024)
di: Wang, Ruibao, et al.
Pubblicazione: (2024)
REDACTOR: eFPGA Redaction for DNN Accelerator Security
di: Baddour, Yazan, et al.
Pubblicazione: (2025)
di: Baddour, Yazan, et al.
Pubblicazione: (2025)
Pushing the Memory Bandwidth Wall with CXL-enabled Idle I/O Bandwidth Harvesting
di: Kadiyala, Divya Kiran, et al.
Pubblicazione: (2025)
di: Kadiyala, Divya Kiran, et al.
Pubblicazione: (2025)
EdgeLLM: A Highly Efficient CPU-FPGA Heterogeneous Edge Accelerator for Large Language Models
di: Huang, Mingqiang, et al.
Pubblicazione: (2024)
di: Huang, Mingqiang, et al.
Pubblicazione: (2024)
FPGA-Accelerated Correspondence-free Point Cloud Registration with PointNet Features
di: Sugiura, Keisuke, et al.
Pubblicazione: (2024)
di: Sugiura, Keisuke, et al.
Pubblicazione: (2024)
Documenti analoghi
-
Pushing up to the Limit of Memory Bandwidth and Capacity Utilization for Efficient LLM Decoding on Embedded FPGA
di: Li, Jindong, et al.
Pubblicazione: (2025) -
Holistic Optimization Framework for FPGA Accelerators
di: Pouget, Stéphane, et al.
Pubblicazione: (2025) -
always_comm: An FPGA-based Hardware Accelerator for Audio/Video Compression and Transmission
di: Parthasarathy, Rishab, et al.
Pubblicazione: (2025) -
Mitigating the Bandwidth Wall via Data-Streaming System-Accelerator Co-Design
di: Liu, Qunyou, et al.
Pubblicazione: (2026) -
LEAPS: Topological-Layout-Adaptable Multi-Die FPGA Placement for Super Long Line Minimization
di: Di, Zhixiong, et al.
Pubblicazione: (2023)