不记得从什么时候开始,像无人汽车、城市大脑、智能手机、智能马桶盖等名词慢慢走进了我们的生活,而现在它们已经塞满了我们生活的方方面面,仿佛忽然之间,time changed,我们已经置身于一个崭新的时代——智能时代。制造业作为整个社会物质生产的中流砥柱,也必然会朝着“智能制造”的方向发展,而如何利用工业信息化时代期间累积和生产的工业数据来完成从“传统制造”到“智能制造”的过度升级,正式当今工业领域讨论的重点。
“工业大数据”的概念,由美国通用电气在2012年首次提出,主要关注生产制造过程中由工业设施设备产生的海量数据。同年,麦肯锡在行业报告中指明,工业数据在美国各行业中的蕴含量最大,工业大数据,“大”有可为。
近年来,包括中国在内的各个制造强国、制造大国,都在布局“智能制造”,其中典型代表有德国的“工业 4.0”,美国的“先进制造业战略” ,日本的“工业价值链”以及中国的“中国制造2025”。各国的战略重点略有不同,其本质和内涵都是由数据驱动、充分互联互动的智能制造体系,流动的数据正是该体系的血液。
一问:什么是工业大数据 ?
根据《工信部:2017工业大数据白皮书》的定义,工业大数据是指在工业领域中,围绕典型能制造模式,从客户需求到销售、订单、计划、研发、设计、工艺、制造、采购、供应、库存、发货和交付、售后服务、运维、报废或回收再制造等整个产品全生命周期各个环节所产生的各类数据及相关技术和应用的总称。
通常,工业大数据可以分为以下三类:
1 设备数据
主要指在现代化生产模式下,在生产过程中实时收集到的设备数据(如操作指令、运行工况、环境参数等)和产品的数据(如生产状态、质量状态等)。狭义的工业大数据即为该类数据,也是工业大数据体系中增长最快的数据来源。
2 运营数据
主要指存储于企业信息化软件系统内部的数据资产,包括产品研发、设计、制造类软件、企业资源计划(ERP)、产品生命周期管理(PLM)、供应链管理(SCM)、客户关系管理(CRM)和OA等系统。此类数据含量不大,价值密度颇高。
3 价值链数据
主要指制造企业的客户、供应商、合作伙伴处的相关数据,比如客户处相关的制造设备数据、产品质量数据和客户关系管理数据等。
4 外部数据
主要指宏观经济数据、行业状态数据、竞争对手数据、政策法规数据等相关的外部参考数据。
工业大数据作为大数据生态的一部分,除了大数据的一般性特点(海量数据、类型多样、生产快速、真实性高、价值密度低),还具有其自身特有的特点:
1. 体量最大:当前中国的工业数据量已在EB级别,在各行业中体量最大,且增长势头迅猛。
2. 客观性强:在没有故障的前提之下,设备是不会骗人的。输入参数确定,输出结果也是确定的。因此,只要数据采集全面准确,分析方法合理恰当,就一定能保证当前数据有意义。
3. 耦合性高:现代工业设备发展完善,内置很多专家系统和算法来保证工艺稳定性,外界采集到的大量参数之间存在强关联关系,而且多为非线性关系(材料尺寸、材料成分、压力、温度、湿度、设备预设参数等等)
4. 稳定性低:在实际生产中,“人机料法环”的任一环节出问题均会导致大量无效、错误数据产生,虽然采集到的数据真实客观,但后续数据处理需要仔细甄别这些错误、无效的数据。
二问:为什么提出工业大数据?
在人类文明历史上,工业革命已经发生三次,最近的第3次工业革命距今也有半个多世纪,企业信息化建设已经很完善,生产自动化、运营信息化带来的红利也将消耗殆尽:
1. 全球制造行业增长疲软,传统增长动力逐渐减弱,新兴增长动力尚未形成
2. 各国法律法规对制造业可持续发展和环保相关的要求更加严格
3. 自动化生产线、数字化装备、自动化设备、智能化产品已经普及
4. 工厂、装备、设备、工具等生产资料的的网络化不断成熟,产品的网络化也已很完善
5. 制造企业正逐步从生产标准产品向提供个性化服务转型
工业数据一直是工业生产必备的生产资料,但工业大数据是“旧”生产资料的一种崭“新”使用方式,可以协助制造企业突破原有认知局限,更加全面、深入、有效地分析问题和解决问题:
1. 优化现有业务,提高企业竞争能力
1) 开创全新的管理模式,决策不再完全依赖组织和流程,业务本身可自行决策
2) 提升产品设计研发和生产制造的能力和效率,促进智能工厂、智慧园区的落地
3) 精细客户分析及精准营销推广,改善产品售后服务能力和效率
4) 提高企业信息安全管理能力
2. 助力提升企业创新能力,促进企业转型升级
1) 落实个性化定制生产模式,真正以客户为中心,让用户参与到产品的设计和生产过程中
2) 催生新的生产协作模式,优化供应链配置
3) 协助企业从生产产品向输出服务转型
三问:如何使用工业大数据?
确定性是工业追求的目标,这一点是工业大数据在应用上区别于其他种类大数据的核心。比如说,在电商系统中,基于用户数据的推荐系统给用户推荐了一双用户不喜欢的袜子,这个没有大影响,但是在工业场景下就不同了,如果基于工业数据的分析系统给用户输出了一个错误的参数或者根本原因分析建议,这将导致大量废品的产生及人力物力的浪费。相反,如果该分析系统应用得当,这也将极大程度提高生产问题根本原因分析的效率,降低人力物力的投入,改善产品质量状态。
总的来说,工业数据发展潜力巨大,但现阶段,在具体应用上还有诸多难题:
1 没有全行业通用的标准规范
产品数据是工业数据的核心。在整个制造业领域中,行业类目繁多,产品形态多样,建立一套通用的或行业通用的分类方法及属性明确的数据规范是工业大数据广泛应用的前提。
2 全链路数据集成打通困难
数据的集成打通是数据应用的基础。高端制造设备多为进口,没有数据的读取权限,导致每个设备都形成了一个数据孤岛,无法直接集成;此外,企业内部不同厂商提供的生产系统、运营系统数据格式多种多样,结构化、半结构化、非结构化数据均有存在,这也给数据的集成和使用带来了很大的困难。
针对以上通用问题,《工信部:2017工业大数据白皮书》建议“规范数据格式,搭建国家、行业、企业等不同等级的工业大数据平台,打通工业大数据信息孤岛,充分挖掘工业大数据价值”。
规范数据格式方面,从2015年7月起,全国信息标准化委员会大数据工作组工业大数据专题组已经开展相应的标准建设工作;
平台提供方面,数澜具有天然优势,我们首先需要做的是在数栖平台的基础上拓展出一个(些)行业解决方案,获取工业数据的项目资源,进而整体推进数栖平台和工业大数据的融合,具体可参见如下工业大数据架构图。