Fortran程序CUDA并行化总结

作者:段红英
来源:物联网技术, 2015, 5(11): 92-93.
DOI:10.16667/j.issn.2095-1302.2015.11.030

摘要

虽然Fortran常用来进行科学计算,但是面对计算量大的程序仍然很耗时。通常人们用MPI进行粗粒度的并行来提高程序的运行效率,近年来随着GPU计算能力的提高,将程序进行细粒度GPU并行化成为一种趋势。文章基于NVIDIA公司的CUDA框架,就Fortran程序向CUDA移植过程中的一些问题进行总结,并给出了相应的解决方案。

全文