摘要

本发明公开了一种基于CSR存储格式的SpMV实现方法、装置及介质,其中方法包括:将SpMV分成三段操作,三段操作分别为取值操作、乘积操作、求和操作,每段操作对应一种任务;将每种任务划分为多个任务块;将所有的线程划分为多个vector,一个vector包括vector-size个线程,所述vector是任务块的执行单元;设计两个发射队列和一个计数器来记录任务块的就绪状态;每个vector获取并执行处于就绪状态的任务块,在执行后更新任务块的就绪状态;当所有任务块都被执行完后,完成SpMV操作。本发明将取值与乘积划分为固定大小的任务块,提高了GPU内存访问的数据利用率。本发明可广泛应用于高性能数值计算技术领域。