Salvato in:
| Autori principali: | Huang, Jiechen, Yu, Wenjian |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2025
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2507.09730 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
Design and accuracy trade-offs in Computational Statistics
di: Xu, Tiancheng, et al.
Pubblicazione: (2025)
di: Xu, Tiancheng, et al.
Pubblicazione: (2025)
CapBench: A Multi-PDK Dataset for Machine-Learning-Based Post-Layout Capacitance Extraction
di: Rodriguez, Hector R., et al.
Pubblicazione: (2026)
di: Rodriguez, Hector R., et al.
Pubblicazione: (2026)
Hawkeye: Reproducing GPU-Level Non-Determinism
di: Badash, Erez, et al.
Pubblicazione: (2026)
di: Badash, Erez, et al.
Pubblicazione: (2026)
Bit-Accurate Modeling of GPU Matrix Multiply-Accumulate Units: Demystifying Numerical Discrepancy and Accuracy
di: Xie, Peichen, et al.
Pubblicazione: (2025)
di: Xie, Peichen, et al.
Pubblicazione: (2025)
Accurate Models of NVIDIA Tensor Cores
di: Khattak, Faizan A., et al.
Pubblicazione: (2025)
di: Khattak, Faizan A., et al.
Pubblicazione: (2025)
Accurate Block Quantization in LLMs with Outliers
di: Trukhanov, Nikita, et al.
Pubblicazione: (2024)
di: Trukhanov, Nikita, et al.
Pubblicazione: (2024)
MATLAB Simulator of Level-Index Arithmetic
di: Mikaitis, Mantas
Pubblicazione: (2024)
di: Mikaitis, Mantas
Pubblicazione: (2024)
Mixed-precision finite element kernels and assembly: Rounding error analysis and hardware acceleration
di: Croci, M., et al.
Pubblicazione: (2024)
di: Croci, M., et al.
Pubblicazione: (2024)
Efficient Hardware Accelerator Based on Medium Granularity Dataflow for SpTRSV
di: Chen, Qian, et al.
Pubblicazione: (2024)
di: Chen, Qian, et al.
Pubblicazione: (2024)
A low-rank balanced truncation approach for large-scale RLCk model order reduction based on extended Krylov subspace and a frequency-aware convergence criterion
di: Giamouzis, Christos, et al.
Pubblicazione: (2024)
di: Giamouzis, Christos, et al.
Pubblicazione: (2024)
MORCIC: Model Order Reduction Techniques for Electromagnetic Models of Integrated Circuits
di: Garyfallou, Dimitrios, et al.
Pubblicazione: (2023)
di: Garyfallou, Dimitrios, et al.
Pubblicazione: (2023)
eXmY: A Data Type and Technique for Arbitrary Bit Precision Quantization
di: Agrawal, Aditya, et al.
Pubblicazione: (2024)
di: Agrawal, Aditya, et al.
Pubblicazione: (2024)
An Open-Source Framework for Efficient Numerically-Tailored Computations
di: Ledoux, Louis, et al.
Pubblicazione: (2024)
di: Ledoux, Louis, et al.
Pubblicazione: (2024)
TREA: Low-precision Time-Multiplexed, Resource-Efficient Edge Accelerator for Object Detection and Classification
di: Sharma, Vijay Pratap, et al.
Pubblicazione: (2026)
di: Sharma, Vijay Pratap, et al.
Pubblicazione: (2026)
SHIELD8-UAV: Sequential 8-bit Hardware Implementation of a Precision-Aware 1D-F-CNN for Low-Energy UAV Acoustic Detection and Temporal Tracking
di: Ghanta, Susmita, et al.
Pubblicazione: (2026)
di: Ghanta, Susmita, et al.
Pubblicazione: (2026)
EULER-ADAS: Energy-Efficient & SIMD-Unified Logarithmic-Posit Engine for Precision-Reconfigurable Approximate ADAS Acceleration
di: Lokhande, Mukul, et al.
Pubblicazione: (2026)
di: Lokhande, Mukul, et al.
Pubblicazione: (2026)
SRAM-PG: Power Delivery Network Benchmarks from SRAM Circuits
di: Shen, Shan, et al.
Pubblicazione: (2024)
di: Shen, Shan, et al.
Pubblicazione: (2024)
Ultra8T: A Sub-Threshold 8T SRAM with Leakage Detection
di: Shen, Shan, et al.
Pubblicazione: (2023)
di: Shen, Shan, et al.
Pubblicazione: (2023)
An SMT Formalization of Mixed-Precision Matrix Multiplication: Modeling Three Generations of Tensor Cores
di: Valpey, Benjamin, et al.
Pubblicazione: (2025)
di: Valpey, Benjamin, et al.
Pubblicazione: (2025)
Regular mixed-radix DFT matrix factorization for in-place FFT accelerators
di: Salishev, Sergey
Pubblicazione: (2025)
di: Salishev, Sergey
Pubblicazione: (2025)
NAS-Cap: Deep-Learning Driven 3-D Capacitance Extraction with Neural Architecture Search and Data Augmentation
di: Li, Haoyuan, et al.
Pubblicazione: (2024)
di: Li, Haoyuan, et al.
Pubblicazione: (2024)
Efficient CMOS Invertible Logic Using Stochastic Computing
di: Smithson, Sean C., et al.
Pubblicazione: (2026)
di: Smithson, Sean C., et al.
Pubblicazione: (2026)
Transitive Array: An Efficient GEMM Accelerator with Result Reuse
di: Guo, Cong, et al.
Pubblicazione: (2025)
di: Guo, Cong, et al.
Pubblicazione: (2025)
Memory-efficient Sketch Acceleration for Handling Large Network Flows on FPGAs
di: Han, Zhaoyang, et al.
Pubblicazione: (2025)
di: Han, Zhaoyang, et al.
Pubblicazione: (2025)
HYLU: Hybrid Parallel Sparse LU Factorization
di: Chen, Xiaoming
Pubblicazione: (2025)
di: Chen, Xiaoming
Pubblicazione: (2025)
vCLIC: Towards Fast Interrupt Handling in Virtualized RISC-V Mixed-criticality Systems
di: Zelioli, Enrico, et al.
Pubblicazione: (2024)
di: Zelioli, Enrico, et al.
Pubblicazione: (2024)
CPU Simulation Using Two-Phase Stratified Sampling
di: Ekman, Magnus
Pubblicazione: (2026)
di: Ekman, Magnus
Pubblicazione: (2026)
Arcus: SLO Management for Accelerators in the Cloud with Traffic Shaping
di: Zhao, Jiechen, et al.
Pubblicazione: (2024)
di: Zhao, Jiechen, et al.
Pubblicazione: (2024)
Enhancing Realism in Holographic Augmented Reality Displays through Occlusion Handling
di: Han, Woongseob, et al.
Pubblicazione: (2025)
di: Han, Woongseob, et al.
Pubblicazione: (2025)
CompAir: Synergizing Complementary PIMs and In-Transit NoC Computation for Efficient LLM Acceleration
di: Li, Hongyi, et al.
Pubblicazione: (2025)
di: Li, Hongyi, et al.
Pubblicazione: (2025)
Energy-Efficient FPGA Framework for Non-Quantized Convolutional Neural Networks
di: Athanasiadis, Angelos, et al.
Pubblicazione: (2025)
di: Athanasiadis, Angelos, et al.
Pubblicazione: (2025)
Architectural Limits of Cloud TPUs in Finite-Field Cryptography
di: Dang, Hung, et al.
Pubblicazione: (2026)
di: Dang, Hung, et al.
Pubblicazione: (2026)
AnalogSAGE: Self-evolving Analog Design Multi-Agents with Stratified Memory and Grounded Experience
di: Wang, Zining, et al.
Pubblicazione: (2025)
di: Wang, Zining, et al.
Pubblicazione: (2025)
EdgeLLM: A Highly Efficient CPU-FPGA Heterogeneous Edge Accelerator for Large Language Models
di: Huang, Mingqiang, et al.
Pubblicazione: (2024)
di: Huang, Mingqiang, et al.
Pubblicazione: (2024)
NL-DPE: An Analog In-memory Non-Linear Dot Product Engine for Efficient CNN and LLM Inference
di: Zhao, Lei, et al.
Pubblicazione: (2025)
di: Zhao, Lei, et al.
Pubblicazione: (2025)
M-ANT: Efficient Low-bit Group Quantization for LLMs via Mathematically Adaptive Numerical Type
di: Hu, Weiming, et al.
Pubblicazione: (2025)
di: Hu, Weiming, et al.
Pubblicazione: (2025)
Memory-Efficient FPGA Implementation of Stochastic Simulated Annealing
di: Shin, Duckgyu, et al.
Pubblicazione: (2026)
di: Shin, Duckgyu, et al.
Pubblicazione: (2026)
ITERA-LLM: Boosting Sub-8-Bit Large Language Model Inference via Iterative Tensor Decomposition
di: Zheng, Keran, et al.
Pubblicazione: (2025)
di: Zheng, Keran, et al.
Pubblicazione: (2025)
Different Perspectives of Memory System Simulation
di: Esmaili-Dokht, Pouya, et al.
Pubblicazione: (2026)
di: Esmaili-Dokht, Pouya, et al.
Pubblicazione: (2026)
Accelerating Time Series Analysis via Processing using Non-Volatile Memories
di: Fernandez, Ivan, et al.
Pubblicazione: (2022)
di: Fernandez, Ivan, et al.
Pubblicazione: (2022)
Documenti analoghi
-
Design and accuracy trade-offs in Computational Statistics
di: Xu, Tiancheng, et al.
Pubblicazione: (2025) -
CapBench: A Multi-PDK Dataset for Machine-Learning-Based Post-Layout Capacitance Extraction
di: Rodriguez, Hector R., et al.
Pubblicazione: (2026) -
Hawkeye: Reproducing GPU-Level Non-Determinism
di: Badash, Erez, et al.
Pubblicazione: (2026) -
Bit-Accurate Modeling of GPU Matrix Multiply-Accumulate Units: Demystifying Numerical Discrepancy and Accuracy
di: Xie, Peichen, et al.
Pubblicazione: (2025) -
Accurate Models of NVIDIA Tensor Cores
di: Khattak, Faizan A., et al.
Pubblicazione: (2025)