亚博_主页

NVIDIA亚博学习 Tensor. Core全面解析(上篇).

2018-10-08 21:42:45  by亚博国际

 NVIDIA亚博学习 Tensor.  Core全面解析(上篇).

亚博体育特消息,不久前,NVIDIA 在SIGGRAPH 2018 上正式发布了新一代GPU 架构——Turing (图灵),黄仁勋称Turing 架构是自2006 年CUDA GPU 发明以来最大的飞跃.Turing 架构的两大重要特性便是集成了用于光线追踪的RT Core 以及用于AI 计算的Tensor Core ,使其成为了全球首款支持实时光线追踪的GPU.

不过说到AI 计算,NVIDIA GPU 成为最好的加速器早已是公认的事实,但将Tensor Core 印上GPU 名片的并不是这次的Turing ,而是他的上任前辈——Volta.

基于Volta 架构的Titan V 是NVIDIA 在计算领域成就的集大成者.学习和神经网络已成为NVIDIA GPU 的背后驱动力,作为最先进的计算加速器,它集成了用于机器学习操作的内置硬件和软件加速,学习能力完全可以被当做Titan V 和Volta 的名片.

Titan V 与初代基于开普勒的GeForce GTX Titan 已经相去甚远,初代Titan 的定位是一款万能显卡,既可作为游戏发烧友的旗舰游戏显卡,也为专业消费者提供全双精度浮点(FP64 )计算能力.在Titan V 诞生之前,Titan 产品线几乎都是基于这种设计方法,一颗巨大的GPU 核心是NVIDIA "高大全" 设计思路的最好代表.

而在Titan V 上,NVIDIA 再次扩展了大核心的上限.Volta 最引人注目的则是其全新的专用处理模块——Tensor Core (张量计算核心),它与Volta 的其他微架构改进,以及支持学习和HPC (高性能计算)的软件/框架集成在一起.

凭借面积达815mm ²的巨大GV100 核心,Titan 这一产品线变得比以往任何时候都更接近工作站级,Titan V 在拥有世界最强图形渲染性能的同时,学习和高性能计算方面的性能都有了极大的提升,当然它的价格也达到了工作站级的3000 美元.

强化算力,重造Titan

除了学习和通用计算之外,Titan 品牌的这次迭代还涉及到其他一些因素. NVIDIA 其实已经不太需要通过Titan 系列为自己树立形象,最初的GTX Titan 已经通过NVIDIA K20Xs 为Oak Ridge 国家实验室的Titan 超级计算机提供计算力.况且,Titan 系列在产品价格和性能方面也没有任何特别的竞争压力.

尽管Titan V 的非ECC HBM2 显存和GeForce 驱动程序堆栈都更加面向消费者,但该卡仍可直接受益于框架和API 的软件支持,这是NVIDIA 学习开发整体工作的一部分. 鉴于单路Titan V 并不会对服务器计算卡Quadro GV100 产生什么影响,NVIDIA 在Titan V 上只砍掉了针对服务器多路互联设计的NVLink 高速总线,而主要的计算能力(FP64/FP16/Tensor Core )都被完整保留.


与Pascal 及更早期的产品均使用面向PC 设计的GPU 以及常规GDDR5 (x )显存不同,NVIDIA 这次选择了一颗规模巨大、产量和良品率都不高的服务器级芯片