POCL 1.5-RC1 发布,可移植OpenCL实现


POCL 1.5即将在4月发布,这是自去年9月的上一个版本以来对这个可移植OpenCL实现的第一个特性更新。

对于那些不了解POCL的人来说,它是一个可移植的OpenCL实现,可以在各种架构的cpu上运行。除此之外,由于构建了LLVM的Clang,这个OpenCL 1.2~2.0实现还获得了在CUDA之上的NVIDIA gpu上运行OpenCL、通过HSA在AMD gpu上运行OpenCL以及其他加速器目标的支持。

POCL 1.5-RC1提供了对新发布的LLVM/Clang 10.0编译器、convert_T() OpenCL函数的重构和其他跟踪/分析改进的支持。

POCL 1.5的convert_T更好地符合LLVM的自动向量化标准,并且可以使SIMD ISA在Arm之类的cpu上得到更好的使用,在紧密循环中可以看到高达5.5倍的改进。

希望在任何受支持的目标上尝试POCL 1.5-RC1的用户可以通过GitHub获取最新的代码。想要了解更多关于这个开源项目的信息,可以登录PortableCL.org。

linuxboy的RSS地址:https://www.linuxboy.net/rssFeed.aspx

本文永久更新链接地址:https://www.linuxboy.net/Linux/2020-03/162731.htm

 

相关内容