NVIDIA 宣布 CUDA 10.2 将是支持 macOS 的最后一个版本


NVIDIA上周宣布发布CUDA 10.2。这是macOS支持开发CUDA应用程序的最新版本,并将在下一版本中完全删除。其他更新包括libcu++,新的互操作性API等。

CUDA 10.2中的主要更新

CUDA 10.2的常规更新

  • 新的API:CUDA 10.2随CUDA虚拟内存管理API一起提供。添加了新的互操作性API,用于缓冲区分配,同步和流传输。但是,这些都是beta版,在将来的发行版中可能会更改。
  • 对新操作系统的支持:此版本增加了对一些新操作系统的支持,包括Fedora 29,红帽企业Linux(RHEL)7.x和8.x,OpenSUSE 15.x,SUSE SLES 12.4和SLES 15.x,Ubuntu 16.04.6 LTS和Ubuntu 18.04.3 LTS。在CUDA 10.2中,不建议使用RHEL 6.x,并且在下一版CUDA中将不再提供支持。
  • 增加了Maxwell + GPU的纹理大小限制:CUDA中Maxwell + GPU的1D线性纹理大小限制现在增加到2^28。

CUDA工具中的更新

  • Nvidia CUDA编译器(NVCC)现在支持将Clang 8.0和Xcode 10.2作为主机编译器。
  • 有一个新的-forward-unknown-to-host-compiler选项,该选项允许将NVCC无法识别的选项转发到主机编译器。
  • 现在,Visual Profiler和NVProf允许在台式机平台上为非root用户和非管理员用户提供跟踪功能。事件和指标分析仍然仅限于非root用户和非管理员用户。
  • 同样,从CUDA 10.2开始,Visual Profiler和NVProf使用动态/共享CUPTI库。在启动Visual Profiler和NVProf之前,要求用户设置CUPTI库的路径。

CUDA库中的更新

  • cuBLAS:cuBLAS库是标准基本线性代数子例程(BLAS)的快速GPU加速实现。在CUDA 10.2中,由于内部工作区尺寸的增加,在某些大尺寸和其他GEMM尺寸上的性能进一步提高。
  • cuSOLVER:该库包含一组直接求解器,可为计算机视觉,CFD和线性优化应用程序提供显着的加速。在此版本中,引入了新的Tensor Cores加速迭代优化求解器(TCAIRS)。 cusolverMg库包含“ cusolverMgGetrf”和“ cusolverMgGetrs”,以支持多GPU LU。
  • cuFFT:该库提供GPU加速的FFT实现,其执行速度比仅CPU的替代方案快10倍。该版本在以下用例中具有改进的性能和可伸缩性:多GPU非2转换能力,R2C和Z2D奇数转换,具有小尺寸和大批处理数量的2D转换

这些是CUDA 10.2中的一些更新。阅读官方发行说明,以了解此发行版还附带了什么。

Ubuntu 18.04 N卡驱动安装+CUDA10.0+cuDNN7.5+Anaconda+Tensorflow-GPU  https://www.linuxboy.net/Linux/2019-06/158951.htm

linuxboy的RSS地址:https://www.linuxboy.net/rssFeed.aspx

本文永久更新链接地址:https://www.linuxboy.net/Linux/2019-11/161574.htm

 

相关内容