基于 Pascal 架构,NVIDIA 针对类神经网路运算市场推出新的 Tesla 运算卡。
Tesla P40 与 Tesla P4,是 NVIDIA 在北京 GTC 公佈的两款新品;从产品定位来看,两款新的运算卡分别将替代过 Maxwell 架构的 Tesla M40 与 Tesla M4。
类神经网路(Neural Network),或者是深度学习(Deep Learning)是 NVIDIA 目前重心。
主要是透过 GPU 运算,其表现能够比 FPGA 或者是 CPU 要有更佳的表现,而这部分可以透过 NVIDIA 的简报得知。就 Intel E5-2690v4 这颗 14 核心的处理器来说,执行运算需要 260ms,但使用 Tesla P4 降到 11ms,而使用 Tesla P40 仅仅用了 6ms,这中间的差异相当明显。
不过,这部分是搭配 NVIDIA TensorRT 资料库与 DeepStream SDK。
NVIDIA TensorRT 与 DeepStream SDK 是搭配 Tesla P40 与 Tesla P4 一併推出的产品。TensorRT 在这之前为 GPU Inference Engine(G.I.E),而 DeeoStream SDK 则是影像处理资料库,曾在 GTC 2016 上提到。
由于走的是纯运算,因此两款运算卡都是被动式散热,其中 Tesla P40 为 GP102,而 Tesla P4 为 GP104,均使用 GDDR5 记忆体。
NVIDIA Tesla P40 會率先在 10 月出貨,至於 NVIDIA Tesla P4 則會晚一個月,也就是 11 月才會供貨給合作夥伴。