:: Library Catalog

Copertina

Salvato in:

Dettagli Bibliografici
Autori principali:	Huang, Jiechen, Yu, Wenjian
Natura:	Preprint
Pubblicazione:	2025
Soggetti:	Hardware Architecture Numerical Analysis
Accesso online:	https://arxiv.org/abs/2507.09730
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Documenti analoghi

Design and accuracy trade-offs in Computational Statistics
di: Xu, Tiancheng, et al.
Pubblicazione: (2025)

CapBench: A Multi-PDK Dataset for Machine-Learning-Based Post-Layout Capacitance Extraction
di: Rodriguez, Hector R., et al.
Pubblicazione: (2026)

Hawkeye: Reproducing GPU-Level Non-Determinism
di: Badash, Erez, et al.
Pubblicazione: (2026)

Bit-Accurate Modeling of GPU Matrix Multiply-Accumulate Units: Demystifying Numerical Discrepancy and Accuracy
di: Xie, Peichen, et al.
Pubblicazione: (2025)

Accurate Models of NVIDIA Tensor Cores
di: Khattak, Faizan A., et al.
Pubblicazione: (2025)

Accurate Block Quantization in LLMs with Outliers
di: Trukhanov, Nikita, et al.
Pubblicazione: (2024)

MATLAB Simulator of Level-Index Arithmetic
di: Mikaitis, Mantas
Pubblicazione: (2024)

Mixed-precision finite element kernels and assembly: Rounding error analysis and hardware acceleration
di: Croci, M., et al.
Pubblicazione: (2024)

Efficient Hardware Accelerator Based on Medium Granularity Dataflow for SpTRSV
di: Chen, Qian, et al.
Pubblicazione: (2024)

A low-rank balanced truncation approach for large-scale RLCk model order reduction based on extended Krylov subspace and a frequency-aware convergence criterion
di: Giamouzis, Christos, et al.
Pubblicazione: (2024)

MORCIC: Model Order Reduction Techniques for Electromagnetic Models of Integrated Circuits
di: Garyfallou, Dimitrios, et al.
Pubblicazione: (2023)

eXmY: A Data Type and Technique for Arbitrary Bit Precision Quantization
di: Agrawal, Aditya, et al.
Pubblicazione: (2024)

An Open-Source Framework for Efficient Numerically-Tailored Computations
di: Ledoux, Louis, et al.
Pubblicazione: (2024)

TREA: Low-precision Time-Multiplexed, Resource-Efficient Edge Accelerator for Object Detection and Classification
di: Sharma, Vijay Pratap, et al.
Pubblicazione: (2026)

SHIELD8-UAV: Sequential 8-bit Hardware Implementation of a Precision-Aware 1D-F-CNN for Low-Energy UAV Acoustic Detection and Temporal Tracking
di: Ghanta, Susmita, et al.
Pubblicazione: (2026)

EULER-ADAS: Energy-Efficient & SIMD-Unified Logarithmic-Posit Engine for Precision-Reconfigurable Approximate ADAS Acceleration
di: Lokhande, Mukul, et al.
Pubblicazione: (2026)

SRAM-PG: Power Delivery Network Benchmarks from SRAM Circuits
di: Shen, Shan, et al.
Pubblicazione: (2024)

Ultra8T: A Sub-Threshold 8T SRAM with Leakage Detection
di: Shen, Shan, et al.
Pubblicazione: (2023)

An SMT Formalization of Mixed-Precision Matrix Multiplication: Modeling Three Generations of Tensor Cores
di: Valpey, Benjamin, et al.
Pubblicazione: (2025)

Regular mixed-radix DFT matrix factorization for in-place FFT accelerators
di: Salishev, Sergey
Pubblicazione: (2025)

NAS-Cap: Deep-Learning Driven 3-D Capacitance Extraction with Neural Architecture Search and Data Augmentation
di: Li, Haoyuan, et al.
Pubblicazione: (2024)

Efficient CMOS Invertible Logic Using Stochastic Computing
di: Smithson, Sean C., et al.
Pubblicazione: (2026)

Transitive Array: An Efficient GEMM Accelerator with Result Reuse
di: Guo, Cong, et al.
Pubblicazione: (2025)

Memory-efficient Sketch Acceleration for Handling Large Network Flows on FPGAs
di: Han, Zhaoyang, et al.
Pubblicazione: (2025)

HYLU: Hybrid Parallel Sparse LU Factorization
di: Chen, Xiaoming
Pubblicazione: (2025)

vCLIC: Towards Fast Interrupt Handling in Virtualized RISC-V Mixed-criticality Systems
di: Zelioli, Enrico, et al.
Pubblicazione: (2024)

CPU Simulation Using Two-Phase Stratified Sampling
di: Ekman, Magnus
Pubblicazione: (2026)

Arcus: SLO Management for Accelerators in the Cloud with Traffic Shaping
di: Zhao, Jiechen, et al.
Pubblicazione: (2024)

Enhancing Realism in Holographic Augmented Reality Displays through Occlusion Handling
di: Han, Woongseob, et al.
Pubblicazione: (2025)

CompAir: Synergizing Complementary PIMs and In-Transit NoC Computation for Efficient LLM Acceleration
di: Li, Hongyi, et al.
Pubblicazione: (2025)

Energy-Efficient FPGA Framework for Non-Quantized Convolutional Neural Networks
di: Athanasiadis, Angelos, et al.
Pubblicazione: (2025)

Architectural Limits of Cloud TPUs in Finite-Field Cryptography
di: Dang, Hung, et al.
Pubblicazione: (2026)

AnalogSAGE: Self-evolving Analog Design Multi-Agents with Stratified Memory and Grounded Experience
di: Wang, Zining, et al.
Pubblicazione: (2025)

EdgeLLM: A Highly Efficient CPU-FPGA Heterogeneous Edge Accelerator for Large Language Models
di: Huang, Mingqiang, et al.
Pubblicazione: (2024)

NL-DPE: An Analog In-memory Non-Linear Dot Product Engine for Efficient CNN and LLM Inference
di: Zhao, Lei, et al.
Pubblicazione: (2025)

M-ANT: Efficient Low-bit Group Quantization for LLMs via Mathematically Adaptive Numerical Type
di: Hu, Weiming, et al.
Pubblicazione: (2025)

Memory-Efficient FPGA Implementation of Stochastic Simulated Annealing
di: Shin, Duckgyu, et al.
Pubblicazione: (2026)

ITERA-LLM: Boosting Sub-8-Bit Large Language Model Inference via Iterative Tensor Decomposition
di: Zheng, Keran, et al.
Pubblicazione: (2025)

Different Perspectives of Memory System Simulation
di: Esmaili-Dokht, Pouya, et al.
Pubblicazione: (2026)

Accelerating Time Series Analysis via Processing using Non-Volatile Memories
di: Fernandez, Ivan, et al.
Pubblicazione: (2022)