基于龙芯3A5000设计实现一个高效的SPMV(稀疏矩阵乘向量)
龙芯中科技术股份有限公司
针对LoongArch架构,使用多线程,矩阵分块和SIMD等技术,优化实现CSR/CSC格式SPMV(稀疏矩阵乘向量)。具体内容包括:
1) 调研已有的SPMV算法优化技术。 2) 实现基于龙芯3A5000的算法优化,进行测试和调优,生成相应文档。
2023全国大学生操作系统比赛的“OS功能挑战”赛道
- 以小组为单位参赛,最多三人一个小组,且小组成员是来自同一所高校的本科生或研究生
- 如学生参加了多个项目,参赛学生选择一个自己参加的项目参与评奖
- 请遵循“2023全国大学生操作系统比赛”的章程和技术方案要求
- 殷时友
- Email yinshiyou @ loongson.cn
中-高
GPL V3.0.
- 理解SPMV的相关算法优化技术
- 大幅度提升LoongArch平台的SPMV性能
- 以‘SPMV优化’等相关关键字可以检索到很多相关参考论文。
- LoongArch docs。LoongArch相关文档,包括架构手册,ABI, 3A5000 CPU和7A1000桥片手册等。
龙芯可免费提供龙芯开发资源。