AMD EPYC处理器与全新AMD Instinct MI100加速显卡重新定义HPC和科研计算性能

责任编辑：蒋雅丽 2020.11.18 21:33 来源：通信世界网

通信世界网消息（CWW）在今年的SC20虚拟展会上，AMD（纳斯达克股票代码：AMD）展示了其在高性能计算（HPC）行业的领导地位，并发布了支持ROCm 4.0开源生态系统的AMD Instinct MI100加速显卡，同时还公布了一份正在不断增长的、支持AMD EPYC处理器以及AMD Instinct MI100加速显卡的合作伙伴名单，并强调了与微软Azure在云计算中针对HPC的合作。在预期2021年第一季度公开发布基于“Zen 3”核心架构的第三代EPYC处理器、OEM同步上市之前，AMD将按计划为部分HPC和云计算客户在本季度开始批量供货。

全新AMD Instinct MI100加速显卡为科研工作负载带来了革命性的HPC性能，同时也是首个跨过10万亿次浮点运算（FP64）性能门槛的加速显卡[i]。基于AMD全新CDNA架构的AMD Instinct MI100，在与第二代AMD EPYC处理器搭配使用时可为系统加速HPC和AI工作负载。有了戴尔、技嘉、HPE和Supermicro这些新加速计算平台的支持，并与AMD EPYC处理器和ROCm 4.0开源软件平台相结合，MI100旨在推动百亿亿次级时代到来之前的科学新发现。

AMD高级副总裁兼数据中心和嵌入式解决方案业务总经理Forrest Norrod表示：“在HPC领域，没有哪个客户的需求是相同的，从内部小型机群到云虚拟机，再到百亿亿次级超级计算机，AMD正在开启一条通往代表着当今行业领先技术和能力的道路，这些技术和能力对支持他们的HPC工作负载至关重要。通过将AMD EPYC处理器和Instinct加速显卡与关键应用软件和开发工具相结合，AMD可为HPC工作负载提供业界领先的性能支持。”

AMD与微软Azure赋能云端HPC

Azure正在使用第二代AMD EPYC处理器为其HBv2虚拟机（VMs）提供HPC工作负载性能。相较第一代HB系列虚拟机，新一代虚拟机可提供高达2倍的性能[ii]，支持多达80000核的MPI工作[iii]，并很好地利用了第二代AMD EPYC处理器业内领先的超大内存带宽优势。

HBv2虚拟机拥有众多用户，其中包括伊利诺伊大学厄巴纳-香槟分校的贝克曼高级科学技术研究所，该研究所仅用了86,400核就能构建了过去往往需要领先的超级计算机才能建模的植物病毒，美国海军也通过该虚拟机快速部署并按需进行增强的气候和海洋模型预测。基于第二代AMD EPYC处理器的HBv2虚拟机同样也为微软今年早些时候所宣布的OpenAI环境提供了大部分处理器计算能力。

AMD EPYC处理器还帮助HBv2虚拟机跨越了多个新的云HPC里程碑，例如使用NAMD创下了云MPI扩展结果的新纪录，跻身Graph500排行榜前二十名；以及成为了首个1TB/s云HPC并行文件系统。通过这些记录和其它应用基准测试可以看出，HBv2可以提供比任何现有公有云都领先的扩展性。

除了现有的基于第二代AMD EPYC处理器的HBv2 HPC虚拟机外，Azure还宣布它将在未来支持代号为“Milan”的下一代AMD EPYC处理器，并将用在HB系列HPC虚拟机上。

您可通过此视频与微软全球副总裁Jason Zander与AMD CEO苏姿丰一起了解更多关于AMD和Azure的合作消息。

AMD一直是HPC的绝佳选择

AMD EPYC处理器和Instinct加速显卡具备横跨各种平台、支持大量HPC工作负载的性能和能力。无论从研究中心的小型机群，到商用HPC、外部部署和云计算，再到百亿亿次级计算，AMD将持续不断的为HPC解决方案提供性能和选择。

HPE与CSC芬兰公司以及EuroHPC公司最近推出了一个名为LUMI的次百亿亿次级系统。该系统基于HPE Cray EX超级计算机架构，并将使用下一代AMD EPYC处理器和Instinct加速显卡，预计2021年上线时将可提供552 petaflops的峰值性能，使其成为世界上首屈一指的超级计算机。

除了LUMI之外，基于AMD的HPC系统的名单还在不断增长。自SC19以来，已经有超过15个超算系统宣布使用AMD EPYC处理器或Instinct加速显卡，或两者兼有。主要包括：

· Chicoma – 洛斯阿拉莫斯国家实验室 – 该系统基于HPE Cray EX超级计算机架构，使用了第二代AMD EPYC处理器，并结合300 terabytes的系统内存用于COVID-19的研究工作。

· Corona - 劳伦斯利弗莫尔国家实验室 – 该系统最近得到了来自《冠状病毒援助、救济和经济安全法案》的资助并进行了升级，新增了近1000台AMD Instinct MI50加速显卡，使其最高性能超过11 petaFLOPs。

· Mammoth – 劳伦斯利弗莫尔国家实验室 – “大内存”集群使用了第二代AMD EPYC处理器进行研究COVID-19的科学家们所急需的基因组学分析和图形分析。

· Northern Data – 这是一个位于欧洲的分布式计算系统，通过使用AMD EPYC处理器和Instinct加速显卡进行大规模HPC应用，例如渲染、人工智能和深度学习等。

· Pawsey超算中心 – 通过使用HPE Cray EX超级计算机架构以及未来的AMD EPYC处理器和AMD Instinct加速显卡，届时Pawsey超级计算机将成为澳大利亚顶尖的超级计算机。

此外，AMD还在为以下超级计算机提供支持：Anvil和Bell – 普渡大学，Big Red 200 – 印第安纳大学，Bridges 2 – 匹兹堡超算中心，CERN、欧洲中期气象预报中心、Expanse – 圣地亚哥超算中心，法兰克福大学、IT4Innovations国家超算中心、Jetstream 2 – 印第安纳大学，Mahti – CSC，Manqi – 明尼苏达大学，国家海洋和大气管理局、Red Raider – 德州理工大学，TinkerCliffs – 弗吉尼亚理工大学。

圣地亚哥超算中心主任Michael Normam表示：“通过Expanse超级计算机，我们的目标是让科学家和研究人员能够像云计算一样来访问高性能计算机，而它可以处理从天体物理学到动物学之间的所有事情。第二代AMD EPYC处理器帮助我们实现了非凡的性能，让我们的研究人员可以做到更多的科学研究。我们与AMD也有着良好的合作关系，并一同为AMD HPC客户创建了一个论坛，在那里大家可以分享经验、信息，以便更好地获益于HPC研究。”

为百亿亿次级计算铺平道路

为了帮助研究人员迈向通往百亿亿次级计算的道路，AMD已经向橡树岭国家实验室提供了全新的AMD Instinct MI100加速显卡，它在计算和互连性能上带来了巨大的飞跃。从AMD的高性能计算到AI，Instinct MI100加速显卡实现了一种新型的加速系统，同时还可提供真正的异构计算能力。该加速显卡基于AMD Infinity架构，旨在可以与第二代AMD EPYC处理器进行互补，AMD Instinct MI100为AMD的HPC和AI计算提供了真正的异构计算能力。

橡树岭国家实验室科学主任Bronson Messer表示：“与当今的系统相比，基于AMD的Frontier的计算能力有了巨大的提升，它可以帮助科学家们得到我们过去不可得知的答案。例如其模拟分子运行的能力不只是几百万个原子，而是多达几十亿个原子，它为科学提供了一个更真实的表现，并且能够一次又一次地做到这一点很重要，这将为我们带来很多重大发现。”

无论是帮助研究中心的学生、改善汽车制造商的空气动力学效率，还是为医学突破提供有价值的关键见解，AMD将会继续为今天和未来的HPC工作负载提供所需的性能、能力和规模。点击这里了解更多关于AMD在SC20大会上的信息及HPC能力。

更多资源

· 了解更多关于AMD HPC客户使用AMD产品心得

· 了解更多关于AMD Instinct加速显卡

· 了解更多关于AMD CDNA架构

· 了解更多关于AMD HPC解决方案

· 了解更多关于第二代AMD EPYC处理器

关于AMD

在超过五十年的历史中，AMD（超威）引领了高性能运算、图形，以及可视化技术方面的创新，这些都是游戏、临境感平台以及数据中心的基础。每时每刻，全球数百万的消费者、500强公司，以及尖端科学研究所都依靠AMD技术来改善他们的生活、工作以及娱乐。AMD全球员工致力于打造伟大的产品，努力拓宽技术的极限。成就今日，启迪未来。更多信息，敬请访问AMD公司（NASDAQ：AMD）官网www.amd.com.cn 关注AMD官方微信: AMDChina，关注AMD官方微博@AMD中国。

[i] Calculations conducted by AMD Performance Labs as of Sep 18, 2020 for the AMD Instinct™ MI100 (32GB HBM2 PCIe® card) accelerator at 1,502 MHz peak boost engine clock resulted in 11.54 TFLOPS peak double precision (FP64), 46.1 TFLOPS peak single precision matrix (FP32), 23.1 TFLOPS peak single precision (FP32), 184.6 TFLOPS peak half precision (FP16) peak theoretical, floating-point performance. Published results on the NVidia Ampere A100 (40GB) GPU accelerator resulted in 9.7 TFLOPS peak double precision (FP64). 19.5 TFLOPS peak single precision (FP32), 78 TFLOPS peak half precision (FP16) theoretical, floating-point performance. Server manufacturers may vary configuration offerings yielding different results. MI100-03

[ii] Source: https://azure.microsoft.com/en-us/blog/introducing-the-new-hbv2-azure-virtual-machines-for-high-performance-computing/

[iii] Source: https://azure.microsoft.com/en-us/blog/azure-hbv2-virtual-machines-eclipse-80000-cores-for-mpi-hpc/

通信世界网版权及免责声明:

1、凡本网注明“来源：通信世界全媒体”及标有原创的所有作品，版权均属于通信世界网。未经允许禁止转载、摘编及镜像，违者必究。对于经过授权可以转载我方内容的单位，也必须保持转载文章、图像、音视频的完整性，并完整标注作者信息和本站来源。
2、凡本网注明“来源：XXX（非通信世界网）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。
3、如因作品内容、版权和其它问题需要同本网联系的，请在相关作品刊发之日起30日内进行。

发表评论请先登录

发表评论

评价

共0条评论

...

热点文章

...

技术文章

...

会议活动