Salvato in:
| Autori principali: | Veneva, Milena, Imamura, Toshiyuki |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2025
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2501.05938 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
ML-Based Optimum Sub-system Size Heuristic for the GPU Implementation of the Tridiagonal Partition Method
di: Veneva, Milena
Pubblicazione: (2025)
di: Veneva, Milena
Pubblicazione: (2025)
Floating Point Compression of Hierarchical Matrix Formats and its Impact on Matrix-Vector Multiplication
di: Kriemann, Ronald
Pubblicazione: (2024)
di: Kriemann, Ronald
Pubblicazione: (2024)
Parallel Gauss-Jordan Elimination and System Reduction for Efficient Circuit Simulation
di: Noveski, Filip, et al.
Pubblicazione: (2026)
di: Noveski, Filip, et al.
Pubblicazione: (2026)
Mixed-Precision Performance Portability of FFT-Based GPU-Accelerated Algorithms for Block-Triangular Toeplitz Matrices
di: Venkat, Sreeram, et al.
Pubblicazione: (2025)
di: Venkat, Sreeram, et al.
Pubblicazione: (2025)
A Task Parallel Orthonormalization Multigrid Method For Multiphase Elliptic Problems
di: Toprak, Teoman, et al.
Pubblicazione: (2025)
di: Toprak, Teoman, et al.
Pubblicazione: (2025)
Racing to Idle: Energy Efficiency of Matrix Multiplication on Heterogeneous CPU and GPU Architectures
di: Ansari, Mufakir Qamar, et al.
Pubblicazione: (2025)
di: Ansari, Mufakir Qamar, et al.
Pubblicazione: (2025)
RandNet-Parareal: a time-parallel PDE solver using Random Neural Networks
di: Gattiglio, Guglielmo, et al.
Pubblicazione: (2024)
di: Gattiglio, Guglielmo, et al.
Pubblicazione: (2024)
Accelerating Matrix Multiplication: A Performance Comparison Between Multi-Core CPU and GPU
di: Ansari, Mufakir Qamar, et al.
Pubblicazione: (2025)
di: Ansari, Mufakir Qamar, et al.
Pubblicazione: (2025)
Parallelization Strategies for the Randomized Kaczmarz Algorithm on Large-Scale Dense Systems
di: Ferreira, Inês, et al.
Pubblicazione: (2024)
di: Ferreira, Inês, et al.
Pubblicazione: (2024)
CLAIRE: Scalable GPU-Accelerated Algorithms for Diffeomorphic Image Registration in 3D
di: Mang, Andreas
Pubblicazione: (2024)
di: Mang, Andreas
Pubblicazione: (2024)
Scalable Mean-Variance Portfolio Optimization via Subspace Embeddings and GPU-Friendly Nesterov-Accelerated Projected Gradient
di: Niu, Yi-Shuai, et al.
Pubblicazione: (2026)
di: Niu, Yi-Shuai, et al.
Pubblicazione: (2026)
Symbolic Algorithm for Solving SLAEs with Multi-Diagonal Coefficient Matrices
di: Veneva, Milena
Pubblicazione: (2024)
di: Veneva, Milena
Pubblicazione: (2024)
A multigrid reduction framework for domains with symmetries
di: Alsalti-Baldellou, Àdel, et al.
Pubblicazione: (2024)
di: Alsalti-Baldellou, Àdel, et al.
Pubblicazione: (2024)
The Performance of Low-Synchronization Variants of Reorthogonalized Block Classical Gram--Schmidt
di: Carson, Erin, et al.
Pubblicazione: (2025)
di: Carson, Erin, et al.
Pubblicazione: (2025)
Code Generation for Near-Roofline Finite Element Actions on GPUs from Symbolic Variational Forms
di: Kulkarni, Kaushik, et al.
Pubblicazione: (2025)
di: Kulkarni, Kaushik, et al.
Pubblicazione: (2025)
Adaptive time step selection for Spectral Deferred Correction
di: Saupe, Thomas, et al.
Pubblicazione: (2024)
di: Saupe, Thomas, et al.
Pubblicazione: (2024)
Resilience Against Soft Faults through Adaptivity in Spectral Deferred Correction
di: Saupe, Thomas, et al.
Pubblicazione: (2024)
di: Saupe, Thomas, et al.
Pubblicazione: (2024)
nuGPR: GPU-Accelerated Gaussian Process Regression with Iterative Algorithms and Low-Rank Approximations
di: Zhao, Ziqi, et al.
Pubblicazione: (2025)
di: Zhao, Ziqi, et al.
Pubblicazione: (2025)
Nearest Neighbors GParareal: Improving Scalability of Gaussian Processes for Parallel-in-Time Solvers
di: Gattiglio, Guglielmo, et al.
Pubblicazione: (2024)
di: Gattiglio, Guglielmo, et al.
Pubblicazione: (2024)
Parallel performance of shared memory parallel spectral deferred corrections
di: Freese, Philip, et al.
Pubblicazione: (2024)
di: Freese, Philip, et al.
Pubblicazione: (2024)
Parametrization and convergence of a primal-dual block-coordinate approach to linearly-constrained nonsmooth optimization
di: Bilenne, Olivier
Pubblicazione: (2024)
di: Bilenne, Olivier
Pubblicazione: (2024)
Prob-GParareal: A Probabilistic Numerical Parallel-in-Time Solver for Differential Equations
di: Gattiglio, Guglielmo, et al.
Pubblicazione: (2025)
di: Gattiglio, Guglielmo, et al.
Pubblicazione: (2025)
High-performance matrix-free unfitted finite element operator evaluation
di: Bergbauer, Maximilian, et al.
Pubblicazione: (2024)
di: Bergbauer, Maximilian, et al.
Pubblicazione: (2024)
Matrix-Free Evaluation of High-Order Shifted Boundary Finite Element Operators
di: Wichrowski, Michał
Pubblicazione: (2025)
di: Wichrowski, Michał
Pubblicazione: (2025)
Scalable Dual Coordinate Descent for Kernel Methods
di: Shao, Zishan, et al.
Pubblicazione: (2024)
di: Shao, Zishan, et al.
Pubblicazione: (2024)
A Virtual Processor brings back the Free Lunch
di: Kutschbach, Haymo
Pubblicazione: (2026)
di: Kutschbach, Haymo
Pubblicazione: (2026)
M2L Translation Operators for Kernel Independent Fast Multipole Methods on Modern Architectures
di: Kailasa, Srinath, et al.
Pubblicazione: (2024)
di: Kailasa, Srinath, et al.
Pubblicazione: (2024)
A Proximal-Gradient Method for Constrained Optimization
di: Dai, Yutong, et al.
Pubblicazione: (2024)
di: Dai, Yutong, et al.
Pubblicazione: (2024)
Small errors in random zeroth-order optimization are imaginary
di: Jongeneel, Wouter, et al.
Pubblicazione: (2021)
di: Jongeneel, Wouter, et al.
Pubblicazione: (2021)
A Proximal-Gradient Method for Solving Regularized Optimization Problems with General Constraints
di: Curtis, Frank E., et al.
Pubblicazione: (2025)
di: Curtis, Frank E., et al.
Pubblicazione: (2025)
Low-Memory Numerical Certification
di: Breiding, Paul, et al.
Pubblicazione: (2026)
di: Breiding, Paul, et al.
Pubblicazione: (2026)
On the Relationships among GPU-Accelerated First-Order Methods for Solving Linear Programming
di: Chen, Kaihuang, et al.
Pubblicazione: (2025)
di: Chen, Kaihuang, et al.
Pubblicazione: (2025)
Sensor Placement for Tsunami Early Warning via Large-Scale Bayesian Optimal Experimental Design
di: Venkat, Sreeram, et al.
Pubblicazione: (2026)
di: Venkat, Sreeram, et al.
Pubblicazione: (2026)
Accelerated primal dual fixed point algorithm
di: Zhu, Ya-Nan
Pubblicazione: (2025)
di: Zhu, Ya-Nan
Pubblicazione: (2025)
Scaling the memory wall using mixed-precision -- HPG-MxP on an exascale machine
di: Kashi, Aditya, et al.
Pubblicazione: (2025)
di: Kashi, Aditya, et al.
Pubblicazione: (2025)
Bare-Metal Tensor Virtualization: Overcoming the Memory Wall in Edge-AI Inference on ARM64
di: Kilictas, Bugra, et al.
Pubblicazione: (2026)
di: Kilictas, Bugra, et al.
Pubblicazione: (2026)
Memory- and compute-optimized geometric multigrid GMGPolar for curvilinear coordinate representations -- Applications to fusion plasma
di: Litz, Julian, et al.
Pubblicazione: (2025)
di: Litz, Julian, et al.
Pubblicazione: (2025)
A Parareal Algorithm with Low-Rank Coarse Solvers
di: Gander, Martin J., et al.
Pubblicazione: (2025)
di: Gander, Martin J., et al.
Pubblicazione: (2025)
Iterative Methods in GPU-Resident Linear Solvers for Nonlinear Constrained Optimization
di: Świrydowicz, Kasia, et al.
Pubblicazione: (2024)
di: Świrydowicz, Kasia, et al.
Pubblicazione: (2024)
A Continuous Energy Ising Machine Leveraging Difference-of-Convex Programming
di: Banerjee, Debraj, et al.
Pubblicazione: (2025)
di: Banerjee, Debraj, et al.
Pubblicazione: (2025)
Documenti analoghi
-
ML-Based Optimum Sub-system Size Heuristic for the GPU Implementation of the Tridiagonal Partition Method
di: Veneva, Milena
Pubblicazione: (2025) -
Floating Point Compression of Hierarchical Matrix Formats and its Impact on Matrix-Vector Multiplication
di: Kriemann, Ronald
Pubblicazione: (2024) -
Parallel Gauss-Jordan Elimination and System Reduction for Efficient Circuit Simulation
di: Noveski, Filip, et al.
Pubblicazione: (2026) -
Mixed-Precision Performance Portability of FFT-Based GPU-Accelerated Algorithms for Block-Triangular Toeplitz Matrices
di: Venkat, Sreeram, et al.
Pubblicazione: (2025) -
A Task Parallel Orthonormalization Multigrid Method For Multiphase Elliptic Problems
di: Toprak, Teoman, et al.
Pubblicazione: (2025)