【IT168 资讯】最高提升性能达300%。英伟达™(NVIDIA®)CUDA Toolkit 3.2正式版(Production Release)包含诸多改进的全新数学库,性能最高可达最新MKL的30倍。
2010年11月17日 – 美国加利福尼亚州圣克拉拉市 –英伟达™(NVIDIA®)正式发布英伟达™(NVIDIA®)CUDA Toolkit 3.2正式版(Production release)。该版本软件可实现大幅的性能提升、包含全新的数学库以及先进的集群管理特性,适合这些开发新一代GPU加速应用程序的开发者使用。
英伟达™(NVIDIA®)CUDA Toolkit包含了开发者开发CUDA C/C++应用程序所需的所有工具、库以及文档。同时,这款软件也是诸多其它GPU计算语言解决方案的基础。3.2版本中的全新特性和重大性能增强内容如下:
• 在英伟达™(NVIDIA®)CUDA BLAS (CUBLAS) 库例程上,最高可实现300%的性能提升。因而比最新的Intel MKL (数学内核库)快8倍之多。
• 与最新的MKL相比,英伟达™(NVIDIA®)CUDA FFT (CUFFT) 库的优化可实现2 – 20倍性能提升。
• 与最新的MKL相比,用于随机生成数字的全新CURAND库可实现10-20倍速度提升。
• 与最新的MKL相比,稀疏矩阵例程的全新CUSPARSE库可实现6-30倍速度提升。
• 在GPU调试以及性能分析工具方面也实现了诸多改进。
此外,全新的英伟达™(NVIDIA®)CUDA Toolkit 3.2版本还包含H.264编/解码功能、全新的Tesla计算集群 (TCC) 集成、集群管理特性以及对新型6GB英伟达™(NVIDIA®)Tesla和Quadro GPU的支持。
英伟达™(NVIDIA®)将于太平洋时间11月23日星期二上午10:00举办一场网络研讨会,对新版本英伟达™(NVIDIA®)CUDA Toolkit中的全新性能增强与功能进行评测。想报名参加这场网络研讨会,敬请访问: https://www2.gotomeeting.com/register/887428835。
如需了解新版本更多亮点以及下载最新版本的英伟达™(NVIDIA®)CUDA Toolkit,敬请访问: www.nvidia.com/getcuda。