0
点赞
收藏
分享

微信扫一扫

NVIDIA NVLink扩展战略—突破PCIE的极限​

NV Link是NVIDIA于2014年度的GTC大会中发布的一个全新概念技术,对于GPU及并行运算相关领域的技术人员和科研工作者来说,GTC大会带给他们的也许是获得技术信息的满足感和充实的幸福,而NVIDIA提供的这项全新技术具备的魅力和潜力,恐怕才是真正吸引人的。

NVLink—数据传输的桥梁

NVLink是一项全新概念的技术,甚至可以说是一项新理念。它并不是一个真的Link,而是一个能横跨在GPU和CPU之间,或者是GPU和GPU之间的快速互联机制,同时可以提供恐怖的高速带宽实现交互通讯,大幅度提高交互效率。它可以让不同类型或者是相同的处理器以巨大的规模连接为一个整体。

在解析NVLink技术之前,简明的总览介绍是必须的。简单来说,这是一个能够在GPU-GPU以及GPU-CPU之间实现高速大带宽直连通讯的快速互联机制。NVIDIA NVLink扩展战略—突破PCIE的极限​_并行运算​​ NVIDIA NVLink扩展战略—突破PCIE的极限​_并行运算_02​高性能计算新革命技术—NVLink

承载着未来超级计算机之变革的技术

而NVLink与“帕斯卡”(Pascal)架构一从发布的时候就已经被各大行业的人士一度认可,他们都认为这项技术可能是改变未来大规模并行运算体系的革命性技术。NVLink之所以如此受众好评,那是因为它不仅可以依据不同需求完成GPU-GPU节点内部的高速互联,同时还能在GPU-CPU甚至CPU-CPU之间形成高速互联。汇聚PCIE和QPI共同优势,提供给GPU几乎无上限并行互联的可能。因此那些价值数亿美元的Tesla超级计算机集群整体都可以通过NVLink受益。因为NVLink就是一个新概念的SLI技术,它桥接了未来和现在的技术变革。

NVIDIA NVLink扩展战略—突破PCIE的极限​_服务器_03

如果说到NVLink最强的地方,无外乎是它几乎可以让CPU直连的特性。让CPU和GPU真正实现直连,这样的技术不仅可以让NVIDIA与英特尔以及IBM的CPU部分进行最高等级的合作,而且还可以让自家的Denver架构以及GPU架构进行完美结合。充当NV异构计算架构内部高速总线的备选互联方案。

本身的机制类似于统一虚拟寻址。同时高速的通讯带宽以及直连特性几乎让它具备优秀的适应能力。可以说是NVIDIA属于自己的异构计算体系。甚至有可能代替当今主板上的PCIE总线。

NVIDIA NVLink扩展战略—突破PCIE的极限​_服务器_04​​ NVIDIA NVLink扩展战略—突破PCIE的极限​_并行运算_05

NVLink的目的将CPU和GPU融合为虚拟整体并代替传统PCIE

NVLink存在的理由—逾越存储之障壁,突破PCIE的极限

NVLink如此来看确实是一个超乎想象的强大技术,NVIDIA之所以和IBM费尽周折开发这样一个东西自然不是没目的的,更不是来试水的。这项技术无外乎是弥补高性能并行运算中最大的一个弱点:那就是“单节点本地内存不足”该问题在GPU大规模并行运算非常常见,无论NVIDIA的Tesla还是Intel的PHI都无法解决这个恼人的问题。    如果遇到了这个问题,通常对GPU不太了解至深的人会首先想到扩大带宽,无脑的撑带宽数量,那就是依靠最新研发的HBM技术通过堆叠式显存3D memory实现最大带宽。很多人认为这样的方式才能承载极限的环境。然而这样的思维无疑是外行的,就算我们能让一个节点的带宽做到数千GB/s。就如同HBM技术演示中提到的那样完美。但我们每个节点实际能得到的有效带宽仍旧是根据PCIE总线的带宽。所以存储的障壁即使是HBM能提供数百GB/s的庞大带宽也是无法让一个节点突破障壁。而NVIDIA开发的NVLink确实有越过这样障壁的潜力。这是因为它足以代替目前的PCIE总线,突破PCIE的极限与上限。才能彻底的越过障壁。    所以NVLink被开发出来最大的一个价值,那就是逾越“存储墙这样的高性能运算之障壁”。它的诞生也预示着NVIDIA和IBM的充分合作,在未来超级计算机以及高性能运算领域取得重大突破。它所以才会被该领域的专业人士广泛看好,目前已成为新一代技术。

NVIDIA NVLink扩展战略—突破PCIE的极限​_服务器_06

思腾合力(SITONHOLY)是AI服务器与HPC基础架构解决方案商,专注人工智能服务器领域,拥有自主品牌AI服务器及通用X86服务器,公司为NVIDIA产品官方授权经销商,主营深思IW系列GPU服务器产品可支持1~20颗GPU,适用于深度学习训练及推理等场景,覆盖服务器、静音工作站等多种产品形态,能够满足客户全场景需求。公司扎根高性能计算领域多年,已经打造出了一套完全自主的软硬件结合的产品生态。公司现在有自己的机房,可支持托管服务和设备租赁服务。

举报

相关推荐

数列的极限

0 条评论