NVIDIA A100登陆AWS，开启加速云计算的下一个十年

责任编辑：田小梦 2020.11.03 10:51 来源：通信世界网

NVIDIA

云计算

通信世界网消息（CWW）十年前，AWS（Amazon Web Services）发布了首个采用NVIDIA M2050 GPU的实例。当时，基于CUDA的应用主要专注于加速科学模拟，AI和深度学习还遥遥无期。

自那时起，AWS就不断扩充云端GPU实例阵容，包括K80（p2）、K520（g3）、M60（g4）、V100（p3 / p3dn）和T4（g4）。

现在，已全面上市的全新AWS P4d实例采用最新NVIDIA A100 Tensor Core GPU，开启了加速计算的下一个十年。

全新的P4d实例，为机器学习训练和高性能计算应用提供AWS上性能与成本效益最高的GPU平台。与默认的FP32精度相比，全新实例将FP16机器学习模型的训练时间减少多达3倍，将TF32机器学习模型的训练的时间减少多达6倍。

这些实例还提供出色的推理性能。NVIDIA A100 GPU在最近的MLPerf Inference基准测试中一骑绝尘，实现了比CPU快237倍的性能。

每个P4d实例均内置八个NVIDIA A100 GPU，通过AWS UltraClusters，客户可以利用AWS的Elastic Fabric Adapter（EFA）和Amazon FSx提供的可扩展高性能存储，按需、可扩展地同时访问多达4,000多个GPU。P4d提供400Gbps网络，通过使用NVLink、NVSwitch、NCCL和GPUDirect RDMA等NVIDIA技术，进一步加速深度学习训练的工作负载。EFA上的NVIDIA GPUDirect RDMA在服务器之间可通过GPU传输数据，无需通过CPU和系统内存，从而确保网络的低延迟。

此外，许多AWS服务都支持P4d实例，包括Amazon Elastic Container Services、Amazon Elastic Kubernetes Service、AWS ParallelCluster和Amazon SageMaker。P4d还可使用所有NGC提供的经过优化的容器化软件，包括HPC应用、AI框架、预训练模型、Helm图表以及TensorRT和Triton Inference Server等推理软件。

目前，P4d实例已在美国东部和西部上市，并将很快扩展到其他地区。用户可以通过按需实例（On-Demand）、Savings Plans、预留实例（Reserved Instances）或竞价型实例（Spot Instances）几种不同的方式进行购买。

GPU云计算发展最初的十年，已为市场带来超过100 exaflops的AI计算。随着基于NVIDIA A100 GPU的Amazon EC2 P4d实例的问世，GPU云计算的下一个十年将迎来一个美好的开端。

NVIDIA和AWS不断帮助各种应用突破AI的界限，以便了解客户将如何运用AI强大的性能。

通信世界网版权及免责声明:

1、凡本网注明“来源：通信世界全媒体”及标有原创的所有作品，版权均属于通信世界网。未经允许禁止转载、摘编及镜像，违者必究。对于经过授权可以转载我方内容的单位，也必须保持转载文章、图像、音视频的完整性，并完整标注作者信息和本站来源。
2、凡本网注明“来源：XXX（非通信世界网）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。
3、如因作品内容、版权和其它问题需要同本网联系的，请在相关作品刊发之日起30日内进行。

发表评论请先登录

发表评论

评价

共0条评论

...

热点文章

...

技术文章

...

会议活动