针对类神经网路运算，NVIDIA Tesla P40 与 P

基于 Pascal 架构，NVIDIA 针对类神经网路运算市场推出新的 Tesla 运算卡。

Tesla P40 与 Tesla P4，是 NVIDIA 在北京 GTC 公佈的两款新品；从产品定位来看，两款新的运算卡分别将替代过 Maxwell 架构的 Tesla M40 与 Tesla M4。

类神经网路（Neural Network），或者是深度学习（Deep Learning）是 NVIDIA 目前重心。

主要是透过 GPU 运算，其表现能够比 FPGA 或者是 CPU 要有更佳的表现，而这部分可以透过 NVIDIA 的简报得知。就 Intel E5-2690v4 这颗 14 核心的处理器来说，执行运算需要 260ms，但使用 Tesla P4 降到 11ms，而使用 Tesla P40 仅仅用了 6ms，这中间的差异相当明显。

不过，这部分是搭配 NVIDIA TensorRT 资料库与 DeepStream SDK。

NVIDIA TensorRT 与 DeepStream SDK 是搭配 Tesla P40 与 Tesla P4 一併推出的产品。TensorRT 在这之前为 GPU Inference Engine（G.I.E），而 DeeoStream SDK 则是影像处理资料库，曾在 GTC 2016 上提到。

由于走的是纯运算，因此两款运算卡都是被动式散热，其中 Tesla P40 为 GP102，而 Tesla P4 为 GP104，均使用 GDDR5 记忆体。