OpenBLAS 0.3.9发布,支持Arm Neoverse N1


OpenBLAS 0.3.8是在一个月前发布的,用于这个流行的基本线性代数子程序的实现,而现在OpenBLAS 0.3.9已经取代了它。

OpenBLAS 0.3.9继续优化x86_64和其他CPU架构。在x86_64前端有一些长期存在的错误/bug修复,修复了Goldmont+和Ice Lake的CPU检测代码,修复了MinGW上的Skylake-X编译,并继续了AVX的工作。最新的先进矢量扩展方面是改进AVX-512 GEMM3M代码,一个用于STRMM的AVX-512内核,并改进AVX2 GEMM内核的性能。

随着性能更高的芯片进入市场,ARM的支持已经见证了OpenBLAS工作的不断增长。OpenBLAS 0.3.9现在支持Arm Neoverse N1、Ampere的eMAG 8180、blas_lock代码的更好性能、TSV110服务器的性能修复,以及对旧的ARMv7支持的一些修复。

OpenBLAS 0.3.9由MIPS64和POWER的修复完成。OpenBLAS 0.3.9的完整更改列表请通过GitHub查看。

linuxboy的RSS地址:https://www.linuxboy.net/rssFeed.aspx

本文永久更新链接地址:https://www.linuxboy.net/Linux/2020-03/162489.htm

相关内容