您的位置：首页 >评测体验 >

最强算力AI芯片助阵，华为云引燃世界人工智能大会

来源：网络整理 2019-08-29 18:27:00

上周五，华为“周五见”达成了刷屏级的效果。

其实一直关注我们的朋友，或许在此之前就不难推测出，华为如此郑重的“周五之约“，应该是要发布去年HC大会中已经披露定位和规格的昇腾910芯片。

果不其然，华为轮值董事长徐直军在上周五发布了这款属于Ascend-max系列、号称地表最强算力的AI芯片。一时间关于AI、关系芯片的话题又重回大众视野，提振了社会心气。

对于昇腾910这个名字，AI爱好者可能已经不再陌生，那么我们接下来的问题或许应该是，“周五”之后怎样?换句话说，大家都已经从各种信息渠道了解到，这此发布的昇腾910是华为的AI大招，目前世界上最大算力的AI芯片。

但或许大家会好奇，这个大招对产业，对你我有什么价值?它的能力将如何投放给广阔的企业智能市场需求?

所以在“后周五时代”，或许有必要进入昇腾910背后，窥探这片多米诺骨牌的释放，可能会在AI与计算产业中引发连锁反应。首当其冲受到影响的，必然是公有云市场。

昇腾910落地后，AI之风正向何处奔涌，云计算产业会荡起哪些涟漪?这是一个值得花费我们更多时间来思考的话题。

云与AI之变

了解昇腾910的产业价值之前，我们必须回顾云计算产业近几年在遭遇怎样的变化。

我们知道，从2012年到2018年，全球AI算力的需求增长了30万倍。而今天随着AI算力从科研与开发走向产业应用，这个曲线更加笔直地向上攀升。

深度学习为代表的第三次AI崛起，基础技术逻辑是以某一目标训练算法模型，然后进行推理部署，达成所期待的耦合效果。

这就意味AI应用的流程包括训练和推理两大部分。企业想要获取AI技术，要么自己训练，要么使用厂商提供已训练好的AI能力。

而无论是AI的训练、开发，还是能力调用、场景部署，都是建立在计算基础上的。而且AI任务本身需求大吞吐量、高并发、高延展性的算力，所以云计算是AI效率最高、贴合方式最紧密的主要算力提供方案。

这一点带给云计算产业本身以非常强大的变化。过去云计算的价值，更多是对已有互联网任务进行支撑，而现在云计算成为了获取AI能力、开发AI能力的主要载体。从“支撑”到“获取”，这完全改变了公有云对于客户和市场的价值。

于是我们看到，AI开始作为云计算厂商的主要增长点。今天全球云计算市场的主要趋势，是传统老大哥AWS正在增速放缓，今年第二季度其增速有史以来第一次低于40%。而从去年开始大规模重组整合，以一系列AI能力、AI工具，以及部署灵活性为卖点的微软Azure，异军突起以极快的速度成为第二，云+AI成为了微软最赚钱的生意。为了继续巩固这一优势，不久前微软十亿美元投资了OpenAI，意在与谷歌持续竞争未来的AI市场。

而以AI算法能力著称，坐拥TPU和TensorFlow框架的谷歌云成为第三，今年谷歌预计在云计算业务营收超过80亿美金，这将成为谷歌体系的最重要增长点。

而在国内市场，以AI技术著称的百度云、华为云成为了崛起最快的两朵云。不难看出的是，全球公有云市场中，AI正在成为当之无愧的王牌。AI能力的强弱，也在成为云增长的核心能力标准。

那么什么是云+AI的核心能力呢?

从欧美云巨头的发展轨迹看，专项AI算力、框架、能力、开发生态是构成云服务商与企业AI需求结合的四大联接点。

而其中算力与框架，又是整个体系的支撑，是让用户可以自行研发AI模型的基础，价值格外重要。比如谷歌云这两年的快速增长，其实是以其自研的训练用AI芯片TPU为核心战略，再将开发社区和TensoFlow的用户捆绑到自己的云服务中，达成短期快速增长。

而为了应对谷歌树立的AI开发者之墙，微软、Facebook等巨头联手打通旗下开发框架，并发布了ONNX等跨框架工具。

由此可见，专项训练AI算力和开发框架，是如今构筑云计算企业未来增长点的核心。而华为发布昇腾910以及自研框架MindSpore，最直接受惠的当然就是直接应用其价值的华为云。由于业界其他云计算厂商都使用英伟达的板卡作为AI算力来源，所以华为云即将成为谷歌云之外，唯一拥有自研训练芯片和自研框架的云服务厂商。

这意味着芯片和框架这场云+AI的国际顶层竞争里，加入了华为云的坐席。而华为云在昇腾310和边端场景的应用布局，甚至构成了比谷歌云更加完整的全栈AI能力。这一信息背后，预示着此刻已经风起云涌的云计算产业，必将更加不平静。

在明晰了云+AI的产业格局之后，我们需要换个角度，从企业用户的视角看看，昇腾910与华为云的结合，到底将带来什么价值。

针对AI训练的暴力计算，是不可或缺的产业基石

对于AI技术的应用者来说，AI分为两个部分，也就是大家熟知的训练和推理。这二者之间的关系就像培养一个人。训练就像上学接受教育，推理就是开始找工作。

每个人都知道，换下工作比较容易，学校教育上个若干年可就成本很高了。不仅是要磨练学生，更是考验家长和老师。对于AI来说也是如此，企业用户应用AI能力并不难，但是想要自己训练一个专属的深度学习模型，把AI变成自己的专有竞争力，那可就困难了。

其中最困难的一项，就是训练专项算力不足。我们曾经采访过一位科研界的朋友，他设计了一个深度学习应用于生物医疗领域的算法模型。但是用研究所采购的专项算力，申请一次四个月，训练一次两个月，出了错误就重来。这种算力情况，直接导致他到毕业也不可能完成研发。

大型深度学习模型训练，是耗时、耗能、消耗算力最大的AI开发环节，但这一环节也是AI开发与创新的基础。如果企业用户和开发者不能独立训练大型模型，那么AI将永远停留在表层应用，无法产生差异化创新与深度结合行业的应用。

而解决方案也很简单，用徐直军的描述，就是对AI训练进行暴力计算。只用当AI算力强到一定程度，用不讲道理的姿态碾压数据训练，AI才能真正被千行万业应用，成为众智创新的新高地。

目前来看，昇腾910芯片就符合“暴力不讲道理”的这个芯片“人设”。根据公布数据，测试结果表明昇腾910算力达到了半精度 (FP16): 256 Tera-FLOPS;整数精度 (INT8) : 512 Tera-OPS。并且合规算力所需功耗仅有310W。更直接的对比是，运用在实际AI训练任务中，在典型的ResNet-50 网络的训练中，昇腾910与MindSpore配合，与现有主流训练单卡配合TensorFlow相比，显示出接近2倍的性能提升，每秒训练的图片数量从965张提升到1802张。

或许我们可以说得更直白一点，华为所指的主流训练单卡，就是英伟达的V100。事实上，目前能够基于云服务获取的AI训练算力，只能来自谷歌的TPU和英伟达的V100。后者基本要通过亚马逊的AWS来获取。而根据英伟达方面的指摘，TPU2.0仅有V100二分之一的算力，并且限量出租。

于是我们能看到，基于云服务的AI训练算力是十足的稀缺资源，价格昂贵且难以预约。这样的产业条件，显然是无法促进AI行业真正向前发展的。

而现在，昇腾910部署到华为云之后，全球开发者拥有了第三个选择，中国公有云市场迎来了首个全栈云+AI解决方案。加之昇腾910算力比V100更强，华为云始终坚持普惠定价策略和充足能力供给，训练这个天梯，或许真正能够拥抱算力层的解决方案。

云服务+AI训练算力，是一颗名副其实的产业基柱。但是通往这个基柱的走廊，过去非常狭窄——企业和开发者要忍受各种成本限制，当昇腾910接入华为云，这个走廊瞬间被拓宽，甚至打开了一条全新通衢。

从广泛布局企业EI，到昇腾310和ModelArts的应用与生态建设，直到今天迎来昇腾910和MindSpore，华为云的产业智能化赋能能力，也迎来了质的提升。

补完AI重器，华为云凝铸产业赋能三叉戟

顺着昇腾910的产业逻辑再往下看，会发现华为云即将献给市场的差异化能力，是全链条、无兼容成本的AI培育。

AI训练算力对于云服务之所以重要，一方面是因为它本身对应着AI产业发展中的重要需求，另一方面，它也是全栈AI链条中极重要的上游支撑。当昇腾910被应用于华为云体系，华为云也就具备了完全基于达芬奇架构，提供从训练、开发到场景部署和体系化应用的全面支撑。

在AI能力部署领域，华为云已经基于昇腾310芯片，提供图像分析服务、OCR服务、视频分析等服务，有超过50个 API基于昇腾310，日均调用量超过1亿次，并且在快速增长。

在开发者使能领域，华为云基于ModelArts开发平台，为AI开发者提供全流程的模型生产服务，打通、覆盖了从数据获取-模型开发-模型训练-模型部署的全链条，ModelArts已经积累超过3万名AI开发者。

在场景推理部署和简便开发之外，开始补完大规模AI算力，以及模型训练的顶层环节，意味着企业用户即将可以基于华为云，完成从训练-开发-推理-部署的全部生产到应用环节。这一链条的主要受益用户，更多是自身有大量可训练数据，并且要求AI技术满足差异化、行业垂直化需求的企业用户。

如果我们按照这个需求在市场中框定用户，会发现补完昇腾910这个AI重器后，华为云即将向三类客户提供全栈AI赋能：

1、对AI研发有重度需求的互联网企业、高科技企业，以及有AI创新渴望的科研机构、开发者。

2、需要训练大量数据，并进行稳固部署，对AI安全有高度要求的大型政、企、研究机构。

3、对行业AI能力有深度研发、训练需求的传统行业+AI场景，其中尤其以工业场景为重心。

在公有云市场竞争激烈的今天，这三种客户很可能构成接下来华为云的企业智能三叉戟，从而撬动人工智能成为社会生产力，实现真正的普惠AI。

伟大的咖啡机：从全栈AI到普惠AI之路

以上所说，或许可以看作昇腾910芯片与华为云的短期改变与目标。如果我们把视线拉长，或许可以来回答这样一个问题：芯片和框架这些基础设施，挑战如此之多，为什么华为依旧坚持要做?

不知为什么，今天华为云对AI所作的一切，让我想起了一种我们已经习以为常的设备：咖啡机。

千万别小看这台机器，把咖啡从研磨到煮沸、冲泡的全流程，集成在一台设备里，是人类非常伟大的发明。它改变了咖啡原本的制作规则和制作门槛，让咖啡随手可得，咖啡馆开遍大街小巷。

口味更多、等待时间更少、操作更简单，咖啡机让这种饮料真正普惠化了——甚至从一种少数人的贵族雅好，变成提高社交效率和工作效率的生产力工具。

华为云今天在做的，其实就是把研磨、冲泡等各种AI流程，集中在公有云这台设备里。让开发者和应用者不需要去三大街磨咖啡豆，五大街请人帮忙煮咖啡，再回家花三天三夜等待——而集成的前提，是每一项关于AI咖啡的能力必须完整。

这个完整度，也就是华为所说的全栈AI，是指包括芯片、芯片使能、训练和推理框架和应用使能在内的全堆栈方案。具体到软硬件体系，华为全栈AI包括：基于统一、可扩展架构的系列化昇腾芯片和IP;芯片算子库和高度自动化算子开发工具CANN;支持端、边、云独立的和协同的统一训练和推理框架MindSpore;开发者使能工具ModelArts，以及大量多层次API。

当这些能力和技术搭建成了完整可闭环的结构，华为云才可能不断压缩其中的过度与兼容成本，不断迭代和提供更多能力。基于机械化高效率的AI咖啡，最终才能被端到千行万业面前。

或许有人会好奇，在框架诸强林立的情况下，华为为什么要做自己的框架MindSpore。答案在于，MindSpore主要努力方向是开发态友好和运行态高效，并且能适应端、边、云的不同场景。换言之MindSpore是一种强烈指向降低开发成本，提高开发成果可用性的深度学习框架，与华为云为开发者提供ModelArts平台的思路一脉相承。

通过自研芯片降低成本，提升算力;基于开发框架和开发工具降低开发难度，提升应用效率;基于全栈架构降低兼容门槛;基于全云服务提供灵活可控、高集成度的AI基础设施。最终的指向，是尽可能的成本压缩与效率提升，让AI从科研环境下的理论可用，转化为工业生产环境下的产业可行。

徐直军在昇腾910发布会后回答记者时明确，昇腾会像麒麟一样走向“不归路”。换言之，全栈全场景AI能力将会不断迭代滚动发展，这意味着华为云将AI推向普惠的路，也是一条不达目标不会停下的路。

所以说，昇腾910真正指向的目标，是华为云的普惠AI战略，“+智能，见未来”的决心;是用户-云计算-AI能力之间的市场与服务重构;是AI门槛的规则改写。

普惠AI任重路远，山水迢遥自是题中之义。但基于华为的全栈全场景AI创造，云+AI的基础规则已经改变。

人类这种生物，从无在技术和生产力上退后的先例和可能。

郑重声明：本文版权归原作者所有，转载文章仅为传播更多信息之目的，如有侵权行为，请第一时间联系我们修改或删除，多谢。