:: Library Catalog

Buchumschlag

Gespeichert in:

Bibliographische Detailangaben
Hauptverfasser:	Herbst, Jonathan, Pellauer, Michael, Reda, Sherief
Format:	Preprint
Veröffentlicht:	2025
Schlagworte:	Hardware Architecture Machine Learning
Online-Zugang:	https://arxiv.org/abs/2512.12847
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Ähnliche Einträge

FlexLLM: Composable HLS Library for Flexible Hybrid LLM Accelerator Design
von: Zhang, Jiahao, et al.
Veröffentlicht: (2026)

MAx-DNN: Multi-Level Arithmetic Approximation for Energy-Efficient DNN Hardware Accelerators
von: Leon, Vasileios, et al.
Veröffentlicht: (2025)

PQA: Exploring the Potential of Product Quantization in DNN Hardware Acceleration
von: AbouElhamayed, Ahmed F., et al.
Veröffentlicht: (2023)

HASS: Hardware-Aware Sparsity Search for Dataflow DNN Accelerator
von: Yu, Zhewen, et al.
Veröffentlicht: (2024)

DOSA: Differentiable Model-Based One-Loop Search for DNN Accelerators
von: Hong, Charles, et al.
Veröffentlicht: (2025)

Leveraging Highly Approximated Multipliers in DNN Inference
von: Zervakis, Georgios, et al.
Veröffentlicht: (2024)

Exploration of Activation Fault Reliability in Quantized Systolic Array-Based DNN Accelerators
von: Taheri, Mahdi, et al.
Veröffentlicht: (2024)

DAISM: Digital Approximate In-SRAM Multiplier-based Accelerator for DNN Training and Inference
von: Sonnino, Lorenzo, et al.
Veröffentlicht: (2023)

FRED: Flexible REduction-Distribution Interconnect and Communication Implementation for Wafer-Scale Distributed Training of DNN Models
von: Rashidi, Saeed, et al.
Veröffentlicht: (2024)

FLAASH: Flexible Accelerator Architecture for Sparse High-Order Tensor Contraction
von: Kulp, Gabriel, et al.
Veröffentlicht: (2024)

TrainDeeploy: Hardware-Accelerated Parameter-Efficient Fine-Tuning of Small Transformer Models at the Extreme Edge
von: Wang, Run, et al.
Veröffentlicht: (2026)

Mirage: An RNS-Based Photonic Accelerator for DNN Training
von: Demirkiran, Cansu, et al.
Veröffentlicht: (2023)

MaRVIn: A Cross-Layer Mixed-Precision RISC-V Framework for DNN Inference, from ISA Extension to Hardware Acceleration
von: Armeniakos, Giorgos, et al.
Veröffentlicht: (2025)

Thales: Formulating and Estimating Architectural Vulnerability Factors for DNN Accelerators
von: Tyagi, Abhishek, et al.
Veröffentlicht: (2022)

MetRex: A Benchmark for Verilog Code Metric Reasoning Using LLMs
von: Abdelatty, Manar, et al.
Veröffentlicht: (2024)

AdAM: Adaptive Fault-Tolerant Approximate Multiplier for Edge DNN Accelerators
von: Taheri, Mahdi, et al.
Veröffentlicht: (2024)

SAFFIRA: a Framework for Assessing the Reliability of Systolic-Array-Based DNN Accelerators
von: Taheri, Mahdi, et al.
Veröffentlicht: (2024)

FORTALESA: Fault-Tolerant Reconfigurable Systolic Array for DNN Inference
von: Cherezova, Natalia, et al.
Veröffentlicht: (2025)

'1'-bit Count-based Sorting Unit to Reduce Link Power in DNN Accelerators
von: Han, Ruichi, et al.
Veröffentlicht: (2026)

NeFT: Negative Feedback Training to Improve Robustness of Compute-In-Memory DNN Accelerators
von: Qin, Yifan, et al.
Veröffentlicht: (2023)

Performance Analysis of DNN Inference/Training with Convolution and non-Convolution Operations
von: Esmaeilzadeh, Hadi, et al.
Veröffentlicht: (2023)

A Precision-Scalable RISC-V DNN Processor with On-Device Learning Capability at the Extreme Edge
von: Huang, Longwei, et al.
Veröffentlicht: (2023)

SigmaQuant: Hardware-Aware Heterogeneous Quantization Method for Edge DNN Inference
von: Liu, Qunyou, et al.
Veröffentlicht: (2026)

vMCU: Coordinated Memory Management and Kernel Optimization for DNN Inference on MCUs
von: Zheng, Size, et al.
Veröffentlicht: (2024)

AxMoE: Characterizing the Impact of Approximate Multipliers on Mixture-of-Experts DNN Architectures
von: Shende, Omkar B, et al.
Veröffentlicht: (2026)

Dynamic Co-Optimization Compiler: Leveraging Multi-Agent Reinforcement Learning for Enhanced DNN Accelerator Performance
von: Fayyazi, Arya, et al.
Veröffentlicht: (2024)

TeAAL: A Declarative Framework for Modeling Sparse Tensor Accelerators
von: Nayak, Nandeeka, et al.
Veröffentlicht: (2023)

Hardware-Aware Fine-Tuning of Spiking Q-Networks on the SpiNNaker2 Neuromorphic Platform
von: Arfa, Sirine, et al.
Veröffentlicht: (2025)

CNN-Based Equalization for Communications: Achieving Gigabit Throughput with a Flexible FPGA Hardware Architecture
von: Ney, Jonas, et al.
Veröffentlicht: (2024)

FGMP: Fine-Grained Mixed-Precision Weight and Activation Quantization for Hardware-Accelerated LLM Inference
von: Hooper, Coleman, et al.
Veröffentlicht: (2025)

FuseMax: Leveraging Extended Einsums to Optimize Attention Accelerator Design
von: Nayak, Nandeeka, et al.
Veröffentlicht: (2024)

TurboAttention: Efficient Attention Approximation For High Throughputs LLMs
von: Kang, Hao, et al.
Veröffentlicht: (2024)

FILCO: Flexible Composing Architecture with Real-Time Reconfigurability for DNN Acceleration
von: Chen, Xingzhen, et al.
Veröffentlicht: (2026)

Neural Network Acceleration on MPSoC board: Integrating SLAC's SNL, Rogue Software and Auto-SNL
von: Rahali, Hamza Ezzaoui, et al.
Veröffentlicht: (2025)

Accelerating LLM Inference with Flexible N:M Sparsity via A Fully Digital Compute-in-Memory Accelerator
von: Ramachandran, Akshat, et al.
Veröffentlicht: (2025)

Full-Stack Optimization for CAM-Only DNN Inference
von: de Lima, João Paulo C., et al.
Veröffentlicht: (2024)

TroLLoc: Logic Locking and Layout Hardening for IC Security Closure against Hardware Trojans
von: Wang, Fangzhou, et al.
Veröffentlicht: (2024)

FAMOUS: Flexible Accelerator for the Attention Mechanism of Transformer on UltraScale+ FPGAs
von: Kabir, Ehsan, et al.
Veröffentlicht: (2024)

FASQ: Flexible Accelerated Subspace Quantization for Calibration-Free LLM Compression
von: Qiao, Ye, et al.
Veröffentlicht: (2026)

InTAR: Inter-Task Auto-Reconfigurable Accelerator Design for High Data Volume Variation in DNNs
von: He, Zifan, et al.
Veröffentlicht: (2025)