寒武纪:独创AI指令集 云、端战略并行

作者:孙永杰 责任编辑:甄清岚 2018.05.14 07:26 来源:通信世界全媒体

2008年,寒武纪的创始团队起初主要是对处理器的架构和人工智能展开交叉研究。2011年,寒武纪与南京大学的LAMDA研究组合作,将人工智能用于对处理器的架构进行优化。2014年,寒武纪与Inria合作并提出首个深度学习处理器的架构DianNao。2015年,寒武纪研发首款深度学习专用处理器芯片。

作为AI芯片领域的独角兽,寒武纪在2016年推出全球第一款商用终端智能处理器IP产品—Cambricon-1A,该产品作为寒武纪的第一代终端智能处理器IP产品已经被应用于包括华为Mate10、P20、荣耀10等千万级智能终端中。去年11月,寒武纪科技发布了三款全新的智能处理器 IP 产品,即面向低功耗场景视觉应用的寒武纪 1H8、拥有更广泛通用性和更高性能的寒武纪 1H16以及可用于终端人工智能产品的寒武纪 1M。

进入到今年,寒武纪发布了第三代终端IP产品 Cambricon 1M。据介绍,1M 采用 TSMC 7nm 工艺生产,8 位运算效能比达 5Tops/watt(每瓦 5 万亿次运算),提供三种尺寸的处理器内核(2Tops/4Tops/8Tops)以满足不同场景下不同量级智能处理的需求,并可通过多核互联进一步提高处理效能。另外,1M不仅延续了前两代IP产品1H/1A的完备性,单个处理器核即可支持 CNN、RNN、SOM 等多种深度学习模型,1M还支持 SVM、k-NN、k-Means、决策树等经典机器学习算法。

人工智能的实现硬件只是一方面,软件与硬件的协同工作也十分关键。为此,寒武纪从 2016 年起逐步推出了寒武纪 NeuWare 软件工具链,该平台终端和云端产品均支持,可以实现对 tensorflow、caffe 和 mxnet 的 API 兼容,同时提供寒武纪专门的高性库,可以方便地进行智能应用的开发,迁移和调优。可以方便地进行智能应用的开发迁移和调优,并通过了千万量级用户大规模商用的检验。

寒武纪的AI芯片发展战略分为三个阶段。第一阶段,首先要使终端具备更为强大的本地处理能力,比如寒武纪1A率先进入麒麟970,1H16和1H8将来也能够提供更好的性能和服务;第二阶段,终端指令集与软硬件兼容的云端智能芯片,寒武纪已经基于这个思路去规划和研发,其终端和云端是指令集一致的,软件平台也是可以无缝移植的;第三阶段,希望能够做到端云协同,为端云应用提供最佳的应用体验。最终寒武纪会克服所有的缺点,比如隐私的泄露风险,在云端和终端之间灵活的调度和分配任务,让整个端云作为一个共同的整体更好的发挥效能。

为达到战略目标,寒武纪将采取两种商业模式,针对终端产品,将复制与华为的合作,依靠IP授权的方式扩张,而针对服务器端,寒武纪则计划推广自有品牌芯片。

2017年,集成了寒武纪技术的华为Kirin970手机芯片和mate10手机全球发布,实测结果表明寒武纪科技与华为的联合研发成果在图片识别速度上超越了搭载A11芯片的iPhone X。

中科曙光推出了基于Cambricon MLU100智能处理卡的服务器产品系列“PHANERON”,它的性能更为强劲,可以支持2~10块寒武纪MLU处理卡,灵活应对不同的智能应用负载。以升级版的PHANERON-10为例,单台服务器可集成10片寒武纪人工智能处理单元,为人工智能训练应用提供832T半精度浮点运算能力,为推理应用提供1.66P整数运算能力,典型场景下的能效提升30倍以上。

来源:《通信世界》杂志2018年第13期

发表评论请先登录
...
CWW视点
暂无内容