我国的工业互联网发展正在从概念的普及进入实践的生根阶段,在这一进程中,数据成为重要的基础性战略资源。大数据的充分挖掘和利用,极大促进了全社会要素资源的网络化共享、集约化整合、协作化开发、高效化利用,推动了中国工业发生重大而深刻的变革,一个全新的大数据时代正在向我们大踏步地走来。

工业数据量激增背景下的数据处理

目前,大数据正处于融合发展和变革创新的重要关口:工业数据量激增,互联网、移动互联网、物联网三大生态顺次发展,使得全球数据总量爆发性增长。到2020年,数据总量将达到44ZB(万亿GB),其中工业数据增速将是其它大数据领域的两倍;软件、网络、装备等各领域间技术频繁发生跨界耦合交融,依托数据的整合作用,推动产品与服务、硬件与软件、应用与平台趋向交融;全球产业格局面临重塑,传统大数据IT企业、自动化企业、制造企业正在成为工业大数据这一新兴领域的领导力量,以融合性技术创新和新兴产业生态体系为标志的产业新格局正在形成中。

工业大数据从来源上主要分为信息管理系统数据、机器设备数据和外部数据。信息管理系统数据是指传统工业自动控制与信息系统中产生的数据,如CRM、ERP、MES等。机器设备数据是来源于工业生产线设备、机器、产品等方面的数据,多由传感器、设备仪器仪表进行采集产生。外部数据是指来源于工厂外部的数据,主要包括来自互联网的市场、环境、客户、政府、供应链等外部环境的信息和数据。

工业大数据的实践落地高度依赖行业经验与人工智能等数据科学的融合,通过将行业知识、经验固化到软件中,实现对工业场景中面临的不确定性实现更加有效地管理,形成数据驱动、快速迭代、持续优化的工业智能系统。

工业智能技术实现的关键步骤

在2015 年通用电气(General Electric)推出GE Digital 时,GE Digital 的CTO Harel Kodesh 就提出过:工业数据不准确、工业智能对风险控制和响应能力的高要求、终端处理能力的限制、复杂模型必须被解释等导致了在数据、算法和模型训练上工业智能所要开辟的一些「新领域」。

天泽智云首席架构师朱武曾在InfoQ刊发过的《海阔凭鱼跃:记一场工业场景下的AI技术实践》一文采访中提到,工业数据的多源性、复杂性和动态性强,比如柴油机气缸排气温度,取决于燃油、燃烧、进气温度、封闭性等等原因,导致工业智能背后数据特征提取、建模等层面的技术挑战。因此,特征提取要求在高背景噪声下必须实现准确且快速的降维。另外,在数据建模及训练层面,工业应用的碎片化、个性化以及结果的专业性,需要建模及训练在整体和个体、通用性和个性化之间取得均衡。

从工程实现的角度,工业智能实现的关键有如下几步:

1. 定义工业场景:正如上文所提及,问题域所涉及工业场景定义的准确性和完备性决定了该问题在多大程度上被解决的可能性;

2. 数据的完备性和质量:工业现场数据一般带有很多噪声,而数据范围和质量决定了后续处理的难易程度和最终结果的准确性;

3. 智能应用支撑环境:工业智能应用本身就具备碎片化、个性化、专业化的特点,如何提供快速有效的应用实施环境,包括数据环境、模型研发实验环境、应用部署环境等,决定了工业智能应用的推广和客户接受速度。

依照美国NSF 智能维护系统中心创始主任李杰教授、天泽智云CTO 刘宗长共同发表的《工业大数据:挖掘“不可见世界”中的价值》一文中的阐述,CPS 是一个具有清晰架构和使用流程的技术体系,针对工业大数据的特点和分析要求所构拟的技术体系,其能够实现对数据进行收集、汇总、解析、排序、分析等全套处理流程,实现对工业数据进行流水线式的实时分析能力,并在分析过程中充分考虑机理逻辑、流程关系、活动目标、商业活动等特征和要求。因此可作为工业大数据分析中的智能化体系的核心。

CPS 的5C 架构

工业大数据正是以行业模型为前提,将面向不同行业、不同场景、不同学科中的工业机理、专家经验、行业知识和最佳实践固化成为数据统计、挖掘和分析模型,将业务问题转化为数据可解的问题;以数据科学为基础,使得深度学习、迁移学习、强化学习等为代表的人工智能算法成为解决工业大数据领域诊断、预测与优化问题的得力工具;以软件服务为目的,形成可落地执行的工业大数据解决方案。

竞赛是推动创新探索、实践指导与人才发展的有效途径。美国早在2008年起开始探索通过竞赛方式促进大数据、人工智能与制造业融合,针对设备健康状态评估、剩余生命周期预测等问题进行方法研究和测试论证,涉及航空发动机、齿轮箱、风机测风仪、半导体、轨道交通等多个工业场景。GE也曾经发起过多次数据竞赛,悬赏解决飞行路径规划、医疗大数据等问题,并获得解决实际问题的具体模型算法和专业人才。

他们如何看待智造时代下的大数据未来

为深度挖掘工业大数据的实际落地场景,探寻我国制造业转型升级的发展趋势,1月13日,我们专程前往由工业和信息化部指导,中国信息通信研究院联合工业互联网产业联盟、华为、富士康、积微物联共同主办“第二届工业大数据创新竞赛”的决赛答辩现场。

在共同见证优胜团队诞生的同时,InfoQ编辑在答辩现场也采访到了中国工程院院士 孙家广、中国信息通信研究院总工程师 余晓辉等重磅技术专家。那么,在新一轮的科技与产业变革中,他们是如何看待智造时代下的大数据未来呢?