Accelerated Thomas Solver for (Quasi-)Block-Tridiagonal Linear Algebraic Equation Systems, Using SSE/AVX Instruction Sets for Vectorizing Dense Block Operations

Barnas Dawid; Bieniasz Leslaw K<sup>*</sup>

doi:10.1142/S021987621750027X

摘要

Streaming SIMD Extensions (SSE) and Advanced Vector Extensions (AVX) are additional processor instruction sets available in contemporary personal computers, designed for vectorized floating point calculations. Unfortunately, in order to utilize the advantages of these instructions, one cannot rely on automatic options of high level language compilers. Instead, handwritten assembly language or intrinsic function call insertions are necessary. By using this idea an accelerated C++ code is devised, for solving (quasi-) block-tridiagonal linear algebraic equation systems by means of an extended Thomas algorithm. Speedups reaching 3.5 and 3 (relative to C++ without using SSE/AVX) are demonstrated for single and double precision calculations, respectively.

出版日期2016-12

全文

访问全文

收藏分享被引(1) 浏览

更新时间：2022-08-11 02:21

Accelerated Thomas Solver for (Quasi-)Block-Tridiagonal Linear Algebraic Equation Systems, Using SSE/AVX Instruction Sets for Vectorizing Dense Block Operations

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友