9月25日,一年一度的云栖大会在杭州云栖小镇开幕。

本届云栖大会以“数·智”为主题,共设110余场峰会和论坛,聚集了世界上几十个国家的上千名科学家、CTO、企业家,以及对技术充满热情的超过6万名从业者和爱好者。

作为阿里巴巴平头哥芯片合作伙伴,云天励飞副总裁李爱军受邀出席平头哥芯片生态专场并发表主题分享,与阿里巴巴集团副总裁戚肖宁、台积电(南京)有限公司总经理罗镇球、新思科技中国董事长兼全球副总裁葛群等行业专家一起探讨5G时代芯片制造和架构设计的新思考与新实践。

李爱军在《高性能 AI 边缘计算芯片架构与应用》的主题演讲中提出, 5AIoT(5G+AI+IoT)时代将会带来海量数据的处理需求,且实时处理的占比大幅提升。实时处理的需求、复杂场景下的边缘计算能力,尤其是基于深度学习的神经网络计算能力,对芯片计算架构提出了新的要求。

针对 5AIoT应用场景的这种需求,云天励飞推出了一款面向视频图像分析应用、适合各种边缘场景下深度学习神经网络推理加速的高性能异构并行计算SoC芯片——DeepEye1000。

异构多核并行计算架构

李爱军表示,DeepEye1000采用异构多核并行计算架构设计,集成阿里平头哥玄铁处理器(CPU)、自主产权神经网络处理器(NNP)、智能算子引擎、视觉数字信号处理器(DSP)、视频编解码器以及图像编码器等多个内核和硬件加速单元。

自主神经网络计算引擎

李爱军进一步指出,云天励飞自主产权神经网络处理器(NNP)采用自研ASIP深度定制指令集,支持灵活可编程计算流;支持高能效混合精度计算,同时保证算法模型精度;通过计算存储深度融合和动态存储调度技术,外部存储访问带宽可大幅降低约77%。

与通用GPU相比,DeepEye1000单位性能提升20倍,单位能效提升100倍,系统时延降低200倍,具有低功耗、高能效、智升级、可编程等特点。

智能任务调度

李爱军介绍,通过自主设计的神经网络处理器以及智能调度机制,DeepEye1000可以高效执行各种算法的推理计算,实现高性能、低功耗的CNN网络模型推理计算加速。

相比中断处理机制,采用智能调度机制使检测算法、跟踪算法、识别算法的执行时间分别减少约25%、35%、40%。

开放工具链

为了方便DeepEye1000的使用,云天励飞为DeepEye1000提供了基于TVM打造的芯片工具链和软件开发包(SDK),支持Caffe、MxNET、TensorFlow、ONNX等深度学习框架,支持一键部署。

“1+1+N”的AI城市综合服务体系

分享最后,李爱军称,云天励飞的目标是构建“1+1+N”的AI城市综合服务体系。将通过5G+AI+IoT的智能感知网络触角得到的数据,经过基于AI OS的城市大脑进行分析、判断和决策,最终应用到城市大脑、新零售、工业检测、机器人、智慧仓储、智能家居等城市综合服务的多种应用场景中。

与阿里平头哥深度合作

此外,在下午举办的媒体见面会上,李爱军强调,DeepEye1000 芯片集成了阿里平头哥的玄铁 810 处理器。利用云天励飞的神经网络处理器设计能力,结合平头哥提供的 CPU 处理器能力,赋能高效、异构多核视觉AI计算,Linux视觉框架助力AI应用极简开发,双方协作,成功打造了云天励飞面向视觉应用的神经网络推理加速芯片。

云天励飞副总裁李爱军(右二)出席媒体见面会

同时,李爱军表示非常认可平头哥“无剑“平台的服务,本地化服务贴心、工具链升级快,对平头哥一直积极打造行业生态非常赞赏。

云栖大会的十年,见证了中国数字经济的大发展,更成为数字经济未来的风向标。未来5G时代,云天励飞将继续与阿里巴巴平头哥进一步加强AI芯片领域的创新合作,为打造“中国芯”共同发力。