Gespeichert in:
| Hauptverfasser: | Herbst, Jonathan, Pellauer, Michael, Reda, Sherief |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2025
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2512.12847 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
FlexLLM: Composable HLS Library for Flexible Hybrid LLM Accelerator Design
von: Zhang, Jiahao, et al.
Veröffentlicht: (2026)
von: Zhang, Jiahao, et al.
Veröffentlicht: (2026)
MAx-DNN: Multi-Level Arithmetic Approximation for Energy-Efficient DNN Hardware Accelerators
von: Leon, Vasileios, et al.
Veröffentlicht: (2025)
von: Leon, Vasileios, et al.
Veröffentlicht: (2025)
PQA: Exploring the Potential of Product Quantization in DNN Hardware Acceleration
von: AbouElhamayed, Ahmed F., et al.
Veröffentlicht: (2023)
von: AbouElhamayed, Ahmed F., et al.
Veröffentlicht: (2023)
HASS: Hardware-Aware Sparsity Search for Dataflow DNN Accelerator
von: Yu, Zhewen, et al.
Veröffentlicht: (2024)
von: Yu, Zhewen, et al.
Veröffentlicht: (2024)
DOSA: Differentiable Model-Based One-Loop Search for DNN Accelerators
von: Hong, Charles, et al.
Veröffentlicht: (2025)
von: Hong, Charles, et al.
Veröffentlicht: (2025)
Leveraging Highly Approximated Multipliers in DNN Inference
von: Zervakis, Georgios, et al.
Veröffentlicht: (2024)
von: Zervakis, Georgios, et al.
Veröffentlicht: (2024)
Exploration of Activation Fault Reliability in Quantized Systolic Array-Based DNN Accelerators
von: Taheri, Mahdi, et al.
Veröffentlicht: (2024)
von: Taheri, Mahdi, et al.
Veröffentlicht: (2024)
DAISM: Digital Approximate In-SRAM Multiplier-based Accelerator for DNN Training and Inference
von: Sonnino, Lorenzo, et al.
Veröffentlicht: (2023)
von: Sonnino, Lorenzo, et al.
Veröffentlicht: (2023)
FRED: Flexible REduction-Distribution Interconnect and Communication Implementation for Wafer-Scale Distributed Training of DNN Models
von: Rashidi, Saeed, et al.
Veröffentlicht: (2024)
von: Rashidi, Saeed, et al.
Veröffentlicht: (2024)
FLAASH: Flexible Accelerator Architecture for Sparse High-Order Tensor Contraction
von: Kulp, Gabriel, et al.
Veröffentlicht: (2024)
von: Kulp, Gabriel, et al.
Veröffentlicht: (2024)
TrainDeeploy: Hardware-Accelerated Parameter-Efficient Fine-Tuning of Small Transformer Models at the Extreme Edge
von: Wang, Run, et al.
Veröffentlicht: (2026)
von: Wang, Run, et al.
Veröffentlicht: (2026)
Mirage: An RNS-Based Photonic Accelerator for DNN Training
von: Demirkiran, Cansu, et al.
Veröffentlicht: (2023)
von: Demirkiran, Cansu, et al.
Veröffentlicht: (2023)
MaRVIn: A Cross-Layer Mixed-Precision RISC-V Framework for DNN Inference, from ISA Extension to Hardware Acceleration
von: Armeniakos, Giorgos, et al.
Veröffentlicht: (2025)
von: Armeniakos, Giorgos, et al.
Veröffentlicht: (2025)
Thales: Formulating and Estimating Architectural Vulnerability Factors for DNN Accelerators
von: Tyagi, Abhishek, et al.
Veröffentlicht: (2022)
von: Tyagi, Abhishek, et al.
Veröffentlicht: (2022)
MetRex: A Benchmark for Verilog Code Metric Reasoning Using LLMs
von: Abdelatty, Manar, et al.
Veröffentlicht: (2024)
von: Abdelatty, Manar, et al.
Veröffentlicht: (2024)
AdAM: Adaptive Fault-Tolerant Approximate Multiplier for Edge DNN Accelerators
von: Taheri, Mahdi, et al.
Veröffentlicht: (2024)
von: Taheri, Mahdi, et al.
Veröffentlicht: (2024)
SAFFIRA: a Framework for Assessing the Reliability of Systolic-Array-Based DNN Accelerators
von: Taheri, Mahdi, et al.
Veröffentlicht: (2024)
von: Taheri, Mahdi, et al.
Veröffentlicht: (2024)
FORTALESA: Fault-Tolerant Reconfigurable Systolic Array for DNN Inference
von: Cherezova, Natalia, et al.
Veröffentlicht: (2025)
von: Cherezova, Natalia, et al.
Veröffentlicht: (2025)
'1'-bit Count-based Sorting Unit to Reduce Link Power in DNN Accelerators
von: Han, Ruichi, et al.
Veröffentlicht: (2026)
von: Han, Ruichi, et al.
Veröffentlicht: (2026)
NeFT: Negative Feedback Training to Improve Robustness of Compute-In-Memory DNN Accelerators
von: Qin, Yifan, et al.
Veröffentlicht: (2023)
von: Qin, Yifan, et al.
Veröffentlicht: (2023)
Performance Analysis of DNN Inference/Training with Convolution and non-Convolution Operations
von: Esmaeilzadeh, Hadi, et al.
Veröffentlicht: (2023)
von: Esmaeilzadeh, Hadi, et al.
Veröffentlicht: (2023)
A Precision-Scalable RISC-V DNN Processor with On-Device Learning Capability at the Extreme Edge
von: Huang, Longwei, et al.
Veröffentlicht: (2023)
von: Huang, Longwei, et al.
Veröffentlicht: (2023)
SigmaQuant: Hardware-Aware Heterogeneous Quantization Method for Edge DNN Inference
von: Liu, Qunyou, et al.
Veröffentlicht: (2026)
von: Liu, Qunyou, et al.
Veröffentlicht: (2026)
vMCU: Coordinated Memory Management and Kernel Optimization for DNN Inference on MCUs
von: Zheng, Size, et al.
Veröffentlicht: (2024)
von: Zheng, Size, et al.
Veröffentlicht: (2024)
AxMoE: Characterizing the Impact of Approximate Multipliers on Mixture-of-Experts DNN Architectures
von: Shende, Omkar B, et al.
Veröffentlicht: (2026)
von: Shende, Omkar B, et al.
Veröffentlicht: (2026)
Dynamic Co-Optimization Compiler: Leveraging Multi-Agent Reinforcement Learning for Enhanced DNN Accelerator Performance
von: Fayyazi, Arya, et al.
Veröffentlicht: (2024)
von: Fayyazi, Arya, et al.
Veröffentlicht: (2024)
TeAAL: A Declarative Framework for Modeling Sparse Tensor Accelerators
von: Nayak, Nandeeka, et al.
Veröffentlicht: (2023)
von: Nayak, Nandeeka, et al.
Veröffentlicht: (2023)
Hardware-Aware Fine-Tuning of Spiking Q-Networks on the SpiNNaker2 Neuromorphic Platform
von: Arfa, Sirine, et al.
Veröffentlicht: (2025)
von: Arfa, Sirine, et al.
Veröffentlicht: (2025)
CNN-Based Equalization for Communications: Achieving Gigabit Throughput with a Flexible FPGA Hardware Architecture
von: Ney, Jonas, et al.
Veröffentlicht: (2024)
von: Ney, Jonas, et al.
Veröffentlicht: (2024)
FGMP: Fine-Grained Mixed-Precision Weight and Activation Quantization for Hardware-Accelerated LLM Inference
von: Hooper, Coleman, et al.
Veröffentlicht: (2025)
von: Hooper, Coleman, et al.
Veröffentlicht: (2025)
FuseMax: Leveraging Extended Einsums to Optimize Attention Accelerator Design
von: Nayak, Nandeeka, et al.
Veröffentlicht: (2024)
von: Nayak, Nandeeka, et al.
Veröffentlicht: (2024)
TurboAttention: Efficient Attention Approximation For High Throughputs LLMs
von: Kang, Hao, et al.
Veröffentlicht: (2024)
von: Kang, Hao, et al.
Veröffentlicht: (2024)
FILCO: Flexible Composing Architecture with Real-Time Reconfigurability for DNN Acceleration
von: Chen, Xingzhen, et al.
Veröffentlicht: (2026)
von: Chen, Xingzhen, et al.
Veröffentlicht: (2026)
Neural Network Acceleration on MPSoC board: Integrating SLAC's SNL, Rogue Software and Auto-SNL
von: Rahali, Hamza Ezzaoui, et al.
Veröffentlicht: (2025)
von: Rahali, Hamza Ezzaoui, et al.
Veröffentlicht: (2025)
Accelerating LLM Inference with Flexible N:M Sparsity via A Fully Digital Compute-in-Memory Accelerator
von: Ramachandran, Akshat, et al.
Veröffentlicht: (2025)
von: Ramachandran, Akshat, et al.
Veröffentlicht: (2025)
Full-Stack Optimization for CAM-Only DNN Inference
von: de Lima, João Paulo C., et al.
Veröffentlicht: (2024)
von: de Lima, João Paulo C., et al.
Veröffentlicht: (2024)
TroLLoc: Logic Locking and Layout Hardening for IC Security Closure against Hardware Trojans
von: Wang, Fangzhou, et al.
Veröffentlicht: (2024)
von: Wang, Fangzhou, et al.
Veröffentlicht: (2024)
FAMOUS: Flexible Accelerator for the Attention Mechanism of Transformer on UltraScale+ FPGAs
von: Kabir, Ehsan, et al.
Veröffentlicht: (2024)
von: Kabir, Ehsan, et al.
Veröffentlicht: (2024)
FASQ: Flexible Accelerated Subspace Quantization for Calibration-Free LLM Compression
von: Qiao, Ye, et al.
Veröffentlicht: (2026)
von: Qiao, Ye, et al.
Veröffentlicht: (2026)
InTAR: Inter-Task Auto-Reconfigurable Accelerator Design for High Data Volume Variation in DNNs
von: He, Zifan, et al.
Veröffentlicht: (2025)
von: He, Zifan, et al.
Veröffentlicht: (2025)
Ähnliche Einträge
-
FlexLLM: Composable HLS Library for Flexible Hybrid LLM Accelerator Design
von: Zhang, Jiahao, et al.
Veröffentlicht: (2026) -
MAx-DNN: Multi-Level Arithmetic Approximation for Energy-Efficient DNN Hardware Accelerators
von: Leon, Vasileios, et al.
Veröffentlicht: (2025) -
PQA: Exploring the Potential of Product Quantization in DNN Hardware Acceleration
von: AbouElhamayed, Ahmed F., et al.
Veröffentlicht: (2023) -
HASS: Hardware-Aware Sparsity Search for Dataflow DNN Accelerator
von: Yu, Zhewen, et al.
Veröffentlicht: (2024) -
DOSA: Differentiable Model-Based One-Loop Search for DNN Accelerators
von: Hong, Charles, et al.
Veröffentlicht: (2025)