利用Nvidia Tesla V100 GPU进行AI和HPC工作负载

2019-10-06 14:37:23 来源：作者：

微软正在为其云数据中心配备来自Nvidia的新型高性能GPU，使客户对其人工智能和高性能计算计划抱有更大的野心。

GPU希望满足使用机器学习和其他技术为其智能应用程序和服务提供动力的企业的AI工作负载，在云计算公司中风靡一时。Amazon Web Services，Google和IBM都提供基于GPU的云实例。

微软也提供了一系列GPU云计算选择，每种选择都有自己的价格，性能和成本特征。微软Azure计算主管Corey Sanders表示，很快，客户将可以选择一种更高的高性能选项。

在接下来的几周内，该公司将启动NCv3的Beta版，NCv3是基于GPU制造商Nvidia的Tesla V100硬件的Azure虚拟机(VM)系列。

NCv3系列虚拟机将使用Nvidia的Tesla V100 GPU，这是Nvidia的最新GPU。像我们以前的GPU尺寸一样，Azure是唯一具有专用InfiniBand互连的云，以实现难以置信的快速多VM计算。”一个11月13日公布。“我们的GPU尺寸还提供PCIe配置，并直接支持Azure高级存储。”

Nvidia的数据中心级Tesla V100 GPU在5月的GPU技术大会上首次亮相，该公司基于该公司的Volta GPU架构。第七代GPU芯片架构包含210亿个晶体管，经过深度学习工作负载培训后，可以提供100个传统CPU的等效性能。

对NCv3系列实例的预览访问将首先在弗吉尼亚州的美国东部Azure地区提供。微软在这里接受注册。

当然，微软并不是唯一基于Nvidia Tesla V100的云实例的提供商。10月25日，亚马逊推出了新的EC2实例，该实例具有多达8个GPU，128GB GPU内存，64个虚拟CPU和488GB主内存。

Nvidia Volta GPU在公共云和服务器市场上都在不断发展。

阿里巴巴，亚马逊网络服务，百度，甲骨文，腾讯以及微软当然都宣布了基于Volta的云产品。在服务器制造商中，戴尔EMC，惠普企业(HPE)，华为，IBM和联想都采用了该技术。

同时，桑德斯说，另外两个基于GPU的Azure虚拟机系列将很快退出其预览状态并接受生产工作负载。12月1日，Azure NCv2和ND系列虚拟机将在美国，欧洲和亚洲全面上市。

NCv2虚拟机最多使用四个Nvidia Tesla P100 GPU和低延迟网络技术InfiniBand来加速高性能计算(HPC)工作负载。ND系列最多使用四个Nvidia Tesla P40 GPU和24GB GPU内存来训练AI模型并执行深度学习。

桑德斯确信，微软预先配置的数据科学虚拟机(基于云的大数据分析产品)的用户将不会落伍。该公司正在更新服务的图像，以便用户可以利用新GPU提供的改进性能。

郑重声明：本文版权归原作者所有，转载文章仅为传播更多信息之目的，如作者信息标记有误，请第一时间联系我们修改或删除，多谢。

相关推荐