Збережено в:
| Автори: | Colonnelli, Iacopo, Cantalupo, Barbara, Merelli, Ivan, Aldinucci, Marco |
|---|---|
| Формат: | Preprint |
| Опубліковано: |
2020
|
| Предмети: | |
| Онлайн доступ: | https://arxiv.org/abs/2002.01558 |
| Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
Схожі ресурси
Stream parallel skeleton optimization
за авторством: Aldinucci, Marco, та інші
Опубліковано: (2024)
за авторством: Aldinucci, Marco, та інші
Опубліковано: (2024)
Hybrid Quantum-HPC Middleware Systems for Adaptive Resource, Workload and Task Management
за авторством: Mantha, Pradeep, та інші
Опубліковано: (2026)
за авторством: Mantha, Pradeep, та інші
Опубліковано: (2026)
Fancy Some Chips for Your TeaStore? Modeling the Control of an Adaptable Discrete System
за авторством: Gallone, Anna, та інші
Опубліковано: (2025)
за авторством: Gallone, Anna, та інші
Опубліковано: (2025)
DNA sequence alignment: An assignment for OpenMP, MPI, and CUDA/OpenCL
за авторством: Gonzalez-Escribano, Arturo, та інші
Опубліковано: (2024)
за авторством: Gonzalez-Escribano, Arturo, та інші
Опубліковано: (2024)
Introducing SWIRL: An Intermediate Representation Language for Scientific Workflows
за авторством: Colonnelli, Iacopo, та інші
Опубліковано: (2024)
за авторством: Colonnelli, Iacopo, та інші
Опубліковано: (2024)
Optimizing Fine-Grained Parallelism Through Dynamic Load Balancing on Multi-Socket Many-Core Systems
за авторством: Wang, Wenyi, та інші
Опубліковано: (2025)
за авторством: Wang, Wenyi, та інші
Опубліковано: (2025)
AutoTSMM: An Auto-tuning Framework for Building High-Performance Tall-and-Skinny Matrix-Matrix Multiplication on CPUs
за авторством: Li, Chendi, та інші
Опубліковано: (2022)
за авторством: Li, Chendi, та інші
Опубліковано: (2022)
Enabling Practical Transparent Checkpointing for MPI: A Topological Sort Approach
за авторством: Xu, Yao, та інші
Опубліковано: (2024)
за авторством: Xu, Yao, та інші
Опубліковано: (2024)
A C++17 Thread Pool for High-Performance Scientific Computing
за авторством: Shoshany, Barak
Опубліковано: (2021)
за авторством: Shoshany, Barak
Опубліковано: (2021)
NVLang: Unified Static Typing for Actor-Based Concurrency on the BEAM
за авторством: Guerreiro, Miguel de Oliveira
Опубліковано: (2025)
за авторством: Guerreiro, Miguel de Oliveira
Опубліковано: (2025)
SpaDA: A Spatial Dataflow Architecture Programming Language
за авторством: Gianinazzi, Lukas, та інші
Опубліковано: (2025)
за авторством: Gianinazzi, Lukas, та інші
Опубліковано: (2025)
Challenging Portability Paradigms: FPGA Acceleration Using SYCL and OpenCL
за авторством: de Castro, Manuel, та інші
Опубліковано: (2024)
за авторством: de Castro, Manuel, та інші
Опубліковано: (2024)
Scheduler-Driven Job Atomization
за авторством: Konopa, Michal, та інші
Опубліковано: (2025)
за авторством: Konopa, Michal, та інші
Опубліковано: (2025)
JASDA: Introducing Job-Aware Scheduling in Scheduler-Driven Job Atomization
за авторством: Konopa, Michal, та інші
Опубліковано: (2025)
за авторством: Konopa, Michal, та інші
Опубліковано: (2025)
VeriFx: Correct Replicated Data Types for the Masses
за авторством: De Porre, Kevin, та інші
Опубліковано: (2022)
за авторством: De Porre, Kevin, та інші
Опубліковано: (2022)
Utilizing Sparsity in the GPU-accelerated Assembly of Schur Complement Matrices in Domain Decomposition Methods
за авторством: Homola, Jakub, та інші
Опубліковано: (2025)
за авторством: Homola, Jakub, та інші
Опубліковано: (2025)
GPU-centric Communication Schemes for HPC and ML Applications
за авторством: Namashivayam, Naveen
Опубліковано: (2025)
за авторством: Namashivayam, Naveen
Опубліковано: (2025)
CUNQA: a Distributed Quantum Computing emulator for HPC
за авторством: Vázquez-Pérez, Jorge, та інші
Опубліковано: (2025)
за авторством: Vázquez-Pérez, Jorge, та інші
Опубліковано: (2025)
Sharded Elimination and Combining for Highly-Efficient Concurrent Stacks
за авторством: Singh, Ajay, та інші
Опубліковано: (2026)
за авторством: Singh, Ajay, та інші
Опубліковано: (2026)
NM-SpMM: Accelerating Matrix Multiplication Using N:M Sparsity with GPGPU
за авторством: Ma, Cong, та інші
Опубліковано: (2025)
за авторством: Ma, Cong, та інші
Опубліковано: (2025)
Minimum Cost Loop Nests for Contraction of a Sparse Tensor with a Tensor Network
за авторством: Kanakagiri, Raghavendra, та інші
Опубліковано: (2023)
за авторством: Kanakagiri, Raghavendra, та інші
Опубліковано: (2023)
TC-GS: A Faster Gaussian Splatting Module Utilizing Tensor Cores
за авторством: Liao, Zimu, та інші
Опубліковано: (2025)
за авторством: Liao, Zimu, та інші
Опубліковано: (2025)
PIM-STM: Software Transactional Memory for Processing-In-Memory Systems
за авторством: Lopes, André, та інші
Опубліковано: (2024)
за авторством: Lopes, André, та інші
Опубліковано: (2024)
cfdSCOPE: A Fluid-Dynamics Proxy App for Teaching Performance Engineering
за авторством: Arzt, Peter, та інші
Опубліковано: (2025)
за авторством: Arzt, Peter, та інші
Опубліковано: (2025)
Categorical Message Passing Language (CaMPL) for programmers
за авторством: Hashimoto, Daniel Kiyoshi, та інші
Опубліковано: (2026)
за авторством: Hashimoto, Daniel Kiyoshi, та інші
Опубліковано: (2026)
Dynamic Memory Management on GPUs with SYCL
за авторством: Standish, Russell K.
Опубліковано: (2025)
за авторством: Standish, Russell K.
Опубліковано: (2025)
Breaking (Global) Barriers in Parallel Stochastic Optimization with Wait-Avoiding Group Averaging
за авторством: Li, Shigang, та інші
Опубліковано: (2020)
за авторством: Li, Shigang, та інші
Опубліковано: (2020)
Construction of a Byzantine Linearizable SWMR Atomic Register from SWSR Atomic Registers
за авторством: Kshemkalyani, Ajay D., та інші
Опубліковано: (2024)
за авторством: Kshemkalyani, Ajay D., та інші
Опубліковано: (2024)
Scalable Concurrent Queues for GPU
за авторством: Shetty, Pratheek Prakash, та інші
Опубліковано: (2026)
за авторством: Shetty, Pratheek Prakash, та інші
Опубліковано: (2026)
PoCL-R: An Open Standard Based Offloading Layer for Heterogeneous Multi-Access Edge Computing with Server Side Scalability
за авторством: Solanti, Jan, та інші
Опубліковано: (2023)
за авторством: Solanti, Jan, та інші
Опубліковано: (2023)
How to Relax Instantly: Elastic Relaxation of Concurrent Data Structures
за авторством: von Geijer, Kåre, та інші
Опубліковано: (2024)
за авторством: von Geijer, Kåre, та інші
Опубліковано: (2024)
An Evaluation of Massively Parallel Algorithms for DFA Minimization
за авторством: Martens, Jan, та інші
Опубліковано: (2024)
за авторством: Martens, Jan, та інші
Опубліковано: (2024)
VSS Challenge Problem: Verifying the Correctness of AllReduce Algorithms in the MPICH Implementation of MPI
за авторством: Hovland, Paul D.
Опубліковано: (2025)
за авторством: Hovland, Paul D.
Опубліковано: (2025)
Exploring the Design Space for Message-Driven Systems for Dynamic Graph Processing using CCA
за авторством: Chandio, Bibrak Qamar, та інші
Опубліковано: (2024)
за авторством: Chandio, Bibrak Qamar, та інші
Опубліковано: (2024)
Joint Training on AMD and NVIDIA GPUs
за авторством: Hu, Jon, та інші
Опубліковано: (2026)
за авторством: Hu, Jon, та інші
Опубліковано: (2026)
Rhizomes and Diffusions for Processing Highly Skewed Graphs on Fine-Grain Message-Driven Systems
за авторством: Chandio, Bibrak Qamar, та інші
Опубліковано: (2024)
за авторством: Chandio, Bibrak Qamar, та інші
Опубліковано: (2024)
MATCH: Model-Aware TVM-based Compilation for Heterogeneous Edge Devices
за авторством: Hamdi, Mohamed Amine, та інші
Опубліковано: (2024)
за авторством: Hamdi, Mohamed Amine, та інші
Опубліковано: (2024)
Accelerating Gravitational $N$-Body Simulations Using the RISC-V-Based Tenstorrent Wormhole
за авторством: Almerol, Jenny Lynn, та інші
Опубліковано: (2025)
за авторством: Almerol, Jenny Lynn, та інші
Опубліковано: (2025)
Static Batching of Irregular Workloads on GPUs: Framework and Application to Efficient MoE Model Inference
за авторством: Li, Yinghan, та інші
Опубліковано: (2025)
за авторством: Li, Yinghan, та інші
Опубліковано: (2025)
Deep Recommender Models Inference: Automatic Asymmetric Data Flow Optimization
за авторством: Ruggeri, Giuseppe, та інші
Опубліковано: (2025)
за авторством: Ruggeri, Giuseppe, та інші
Опубліковано: (2025)
Схожі ресурси
-
Stream parallel skeleton optimization
за авторством: Aldinucci, Marco, та інші
Опубліковано: (2024) -
Hybrid Quantum-HPC Middleware Systems for Adaptive Resource, Workload and Task Management
за авторством: Mantha, Pradeep, та інші
Опубліковано: (2026) -
Fancy Some Chips for Your TeaStore? Modeling the Control of an Adaptable Discrete System
за авторством: Gallone, Anna, та інші
Опубліковано: (2025) -
DNA sequence alignment: An assignment for OpenMP, MPI, and CUDA/OpenCL
за авторством: Gonzalez-Escribano, Arturo, та інші
Опубліковано: (2024) -
Introducing SWIRL: An Intermediate Representation Language for Scientific Workflows
за авторством: Colonnelli, Iacopo, та інші
Опубліковано: (2024)