摘要

图形处理单元(GPU)可以将桌面计算机的计算速度提高1~2个数量级,发展相关的隐式算法非常重要.本研究根据GPU的硬件特点,选择了DP-LUR隐式方法,并对此进行了进一步的改进.根据GPU算法低内存需求,首先对DP-LUR方法右端项相关矩阵运算进行改写,将其变化为具有推广价值的标量形式.这一改进与原始方法完全等价.但形式极为简洁,节省了大量的内存存储与读写需求.随后.进一步将左端项矩阵对角化.从而对内存存储与读写的需求进一步降低,同时降低了单步迭代计算量,但也同时降低了收敛速度,总计算量比前一种方法增加了约20%,以上两种改进相互独立.可以根据需要单独或联合选取.