《一、国内外产业发展现状》

一、国内外产业发展现状

过去几十年,互联网的影响主要在消费领域, 属于“消费互联网”。我国在消费领域的“互联网 +” 已取得长足进展,电子商务等技术和应用已进入世 界前列,百度网讯科技有限公司、阿里巴巴网络技 术有限公司和腾讯计算机系统有限公司已经成为世 界前十的大型互联网公司。一段时间以来,由于消费互联网在中国产生了极大的影响力,使得人们并 没有重视互联网对产业领域的影响。在德国工业 4.0 战略公布后,国人开始密切关注工业领域与信息领 域高度融合的急迫性和价值。现在,互联网正在向 产业领域发展,被称为“产业互联网”或“工业互 联网”。

工业互联网是构建现代工业生态系统、实现先 进智能化发展的必由之路,是智能制造的关键基础, 是充分发挥工业装备、工艺和材料潜能,提高生产 效率,优化资源配置,创造差异化产品和实现服务 增值的关键 [1]。工业互联网平台是全要素连接的 枢纽,是工业资源配置的核心,呈现出跨领域、跨 地区、全周期的新特性。

美国工业知识经验软件化、平台化能力处于全 球领先地位,通过强化基于平台的网络、数据、软 件、系统集成应用,推动制造与服务的松耦合,催 生网络化、平台化、虚拟化等制造业新形态,孕育 了以 GE Predix 为代表的工业互联网平台。德国工 业积淀深厚,以制造业主导互联网为主流发展路径, 主张利用互联网推进技术、工艺、流程、设备的效 能优化,促进价值链体系重构和持续提升,西门子 MindSpere 工业互联网平台是其中的典型代表。我 国工业互联网发展路径则孕育了众多商业模式的创 新,具有多元化的特色。国内工业互联网平台形成 了以航天云网为代表的协同制造平台、以树根互联 为代表的产品全生命周期管理服务平台和以海尔为 代表的用户定制化平台等多类典型平台。

《二、工业互联网平台面临的生态挑战》

二、工业互联网平台面临的生态挑战

工业互联网生态包括:解决谁来用的问题,即业 务生态;谁来提供应用服务的问题,即开发者生态; 各环节如何打通实现跨界整合的问题,即数据生态。

工业互联网的生态构建是围绕工业企业的行业 领域所涉及的业务展开的,用户对于平台的黏性取 决于平台对于其业务所提供的价值。工业互联网平 台的用户可以分为三类:企业内部用户、产业链上 的企业与终端用户、同行业的其他企业。对于企业 内部用户而言,平台的价值更多在于实现业务本身 的提质增效,主要通过平台上的一系列数据或模型 驱动的分析优化类软件应用来实现,例如,研发效 率提升、能耗降低、周转周期缩短等。对于产业链 上的企业与终端用户,平台的价值通过协同类和服 务类的应用来体现,通过研发协同、供应链协同优 化、制造能力外包、物料集中采购等应用来提升上 游供应商的效率并有效降低采购与生产成本,而对 于下游的用户,价值更多体现在基于产品本身的运 营维护服务以及围绕产品的增值类上,如金融服务、 内容服务等应用。对于同行业的其他企业,尤其是 缺乏信息技术能力和大规模建设资金的中小企业, 工业互联网平台则更多需要扮演一种工业软件、制 造资源、行业知识等能力输出的管道。由此可以看 出,对于用户生态的构建,其挑战更多在于工业软 件即服务(SaaS)的能力。

工业互联网平台的另一方则来自于平台上内容 的提供方,既可以是企业内部的业务部门或软件服 务提供商,也可以是第三方独立的开发者。对于开 发者生态的构建,其重点一方面在于平台本身功能 的完整性、开发的易用性、系统的稳定性;另一方 面与平台的用户生态形成了一种正反馈效应,平台 聚集了越来越多的用户和不断涌现的业务需求,这 也为开发者提供了更多的市场机会。从能够开发工 业类应用和模型的人才技能角度来看,工业 knowhow 是核心,但工业领域人才对于信息化技术的掌 握通常是一个巨大的挑战,因此对于现有的稀缺开 发者资源的争夺更成为了建立工业互联网平台生态 的重中之重。

数据生态的建设是工业互联网平台变“活”的 关键,数据驱动就是要把数据理解为一种自然资源, 既然是资源就要想办法来开采、利用。所以需要梳 理清楚平台的建设者已经拥有什么数据,未来会拥 有什么数据,以及未来要拥有什么数据。数据生态 建设的第一个层次是数据源的整理,这些数据有些 是从企业现有的 IT 系统中来,有些是从企业的机器 中来,有些是从供应链上下游来,有些是从互联网 来。数据生态建设的第二个层次是数据源的打通, 工业企业大数据具有多数据源特点,就决定了数据 会从多个系统采集,需要考虑如何与其他系统同步 数据,如何与其他系统交换数据,如何基于行业领 域模型和其他系统产生关联、集成,包括和业务系 统产生关联、集成。数据生态建设的第三个层次是 数据集的整理,数据如何从源头抽取,以何种方式 存储、分类管理,面向应用特点形成多个可用的数 据集以及相应的数据资源目录和规范化接口。再往上一层是数据的治理,工业数据可能由于设备、环 境、传输等各种环节的原因导致数据缺失、重复、 错误等各类问题,需要通过应用数据画像工具了解 数据的质量,进而在数据清洗工具的辅助下修正存 在质量问题的数据。

《三、工业互联网平台面临的技术挑战》

三、工业互联网平台面临的技术挑战

工业互联网平台的基础设施即服务(IaaS)层 技术发展成熟度高,更新迭代周期短,短短十几年 的时间,已经成长出亚马逊 AWS、微软 Azure、阿 里云、腾讯云和华为云等。当前多数工业平台即服 务(PaaS)在工业 know-how 和专业技术方面积淀 不足,通用 PaaS 并未针对制造与消费领域之间专 业性的巨大差异进行针对性的研发 [2]。因而,在 现有的通用云计算平台上直接构建工业 SaaS,会导 致开发成本高企、易用性差等问题,更容易导致企 业对发展工业互联网战略方向和实施路径的误判。 工业 PaaS 研发与建设的重点应放在面向工业领域 的专业性方向。如图 1 所示的工业互联网平台架 构 [3] 中工业 PaaS 层的两大核心部件是工业大数据 系统与工业数据建模和分析,这两方面的技术因符 合工业数据的数据特性和应用特点,在整体工业互 联网平台的技术体系中有着比较大的挑战 [4,5]。

《图 1》

图 1 工业互联网平台架构

《(一)工业大数据系统关键技术挑战》

(一)工业大数据系统关键技术挑战

1. 多态性数据的采集技术

工业软硬件系统是整体性、封闭性极强的复杂 系统,数据格式、接口协议等标准体制的差异带来 巨大的技术壁垒,甚至同一工厂生产的同一型号的 同一设备也常常因为元件、用材的不同造成其基础 信息或生成信息的内容发生变化。因此,无论对于 工业系统的数据采集与解析,还是数据存储系统对 汇聚的数据进行结构化分解,都潜在着巨大的应用 挑战。由于不同经济实体的本位主义或协议本身的 封闭设计,有时甚至无法实现设备数据的采集;即 便能够获取数据,在一个工业大数据实际项目实施 过程中,往往也需要动辄数月的时间与大量人力资 源的投入,才能开展对数据格式与字段的整理 [5]。 更大的挑战来自于多样化、高可变的复杂非结构化 数据的大量出现。由于工业系统在封闭性、敏感性 和安全性等方面有高标准需求,其中的数据通常只 有特定的软件才能兼容或处理,从而导致整体结构 化信息工作面临更多困难。因此,这类挑战的解决 需要借助系统化思路,通过与工业标准化、数据模 型智能识别或匹配等大数据管理技术的综合运用, 才能得到解决。

2. 高通量数据的接入技术

海量机器数据,特别是时间序列数据被大量接入工业大数据系统。一般而言,大型制造类企业同 时连结、在线接入的设备数量可达数十万台,数据 的吞吐速率也轻松达到惊人的百万数据点 /s ~ 千万 数据点 /s。面对这样的应用需求,大数据平台必须 具备与实时数据库类似的数据接入能力。然而由于 大数据平台需要对数据进行长期、高可靠的存储, 所以,高效的数据压缩编码方法以及低成本的分 布式扩展能力,也是工业大数据系统面临的重大 挑战。另外,为了满足多条件复杂查询及高性能 响应的要求,在数据接入过程中还必须设计完善 的数据组织体系和索引结构,能够实施有效地辅 助预处理和计算,针对高通量数据接入,实现读 写系统的效率优化 [5]。

3. 低价值数据的分析技术

大数据技术需要解决的关键问题之一就是从体 量庞大的低价值数据中提炼高价值的信息,用数量 的大规模弥补信息的低密度。由于工业软硬件系统 对应严格的机理模型,每个变量的定义均具备明确 的物理含义。低质量数据会导致变量间函数关系发 生变化,从而对工业大数据的分析带来灾难性的影 响。事实上,制造业企业由于历史、技术和人为等 因素,其信息系统的数据质量一直存在大量问题。 例如,企业资源计划(ERP)系统中物料就存在“一 物多码”等问题;物联网数据质量也不容乐观,无 效、重名的工况数据,时标错误或不齐,时序紊 乱等数据质量问题在实际应用中的比例可能高达 30 % 以上。这些问题对数据分析的成果和评判造成 巨大干扰,因此在数据分析之前必须对一手数据进 行有效治理。

工业应用中有各种原因(时间 / 空间条件制约、 物理环境工况恶劣等)导致大量关键信息没有被计 量或没有被充分、精确计量,这就要求分析算法能 够在“非完美”“非精确”的数据基础上工作。对 于这个问题的解决思路,可以大力发挥基于工业大 数据分析的“软测量技术”,即通过大数据分析, 建立指标间的关联关系模型,通过易测、能测的计 量参数来测算难以获取的过程量值,完善、补充生 产过程的整体数据基础 [5]。

4. 复杂异构数据的管理技术

工业生产时产生大量多源异构数据,常见的 有结构化业务数据、设备检测产生的时序数据、 各类非结构化的工程数据等。每一种类型的数据 都需要高效的存储解决方案和异构的针对性存储 模型。然而,现有的大数据技术还无法满足全部 要求。以非结构化工程数据为例,各种海量计算 机辅助设计(CAD)文件,测试仿真文件,图 片、文档等小文件,需要按产品的生命周期、项 目名称、层次化组织的物料表单(BOM)等不同 维度进行高效、灵活、快速的组织与排列,同时 需要具备对数据进行批量管理、建模和质控的能 力,这些需求对于目前的分布式文件系统和对象 存储系统均存在技术障碍。另外,从方便使用、 降低开发与学习难度等角度出发,异构数据的内 部处理差异又应当完全透明,确保暴露给用户的 数据模型和查询接口尽可能统一。例如,在物联 网(IoT)数据分析中,需要处理大量传感器部署 信息等静态数据,而这一类操作往往需要将时间 序列数据与结构化数据进行跨库映射,以建立连 接关系,因此需要围绕多模态工业大数据提供一 体化的查询协同优化 [5]。

《(二)工业数据建模和分析关键技术挑战》

(二)工业数据建模和分析关键技术挑战

1. 强关联数据的集成技术

工业大数据分析更加依赖数据基础的“完整 性”,而非仅仅是数据规模。由于“信息烟囱”在 工业生产中大量存在,导致工业大数据的数据源呈 现“空间离散”和“时间异步”两个特点。工业大 数据应用需要实现数据在物理信息、产业链、跨领 域跨行业三个层次的融合 [5]。

物理信息融合:设计研发阶段主要管理数字产 品,而在制造服务阶段主要管理物理产品,因此全 生命周期管理需要融合数字产品与物理产品,从而 构建工业信息与物理产品融合的系统。

产业链融合:在互联网大数据的背景下,以生 产资源重组优化为目标的云制造生产模式得到迅猛 发展,智能产业链必须打通传统企业业务范畴与边 界,实现数据驱动的业务协同融合。

跨领域跨行业融合:在“互联网 +”的产业环 境中,需要实现上下游、周边生态等广域的信息集 成。例如,美国一家农用机器公司将气象动态、水 资源分布、种子情况等农资数据与自身农机产品数 据进行综合利用,从而为农场生产提供更加优质、 高效、精准的服务。这种融合方式更加复杂精密, 因此需要将制造过程、BOM 结构、运行环境等多种类型的工业语意信息统筹起来综合分析,是对工 业大数据更高层次的融合集成。

2. 强专业机理的分析技术

机理是现代工业的基本逻辑与运作原理,工 业生产过程也是“强机理”的严格可控过程,即 通过大量相关领域的专业理论模型,形式化描述 现实世界中的物理、化学和生物等动态变化过程。 另外,还存在大量闭环调节或控制机制,作为参 数配置,使得工业生产过程中可能无限逼近甚至 超过设计目标。传统的数据分析基本遵循“你打 你的,我打我的”的孤立原则,很少结合机理模 型(甚至完全采取数据驱动),也很少考虑闭环控 制 / 调节机制的作用。强机理模型对于数据分析技 术的挑战主要表现在以下三个方面。第一,实现 机理模型与数据模型的有机结合。具体来讲,如 何将机理模型体现在数据模型中(例如,机理模 型为分析模型提供关键特征、分析模型为机理模 型提供后处理支撑或多模型融合预测),又或怎样 把数据模型作为机理模型输入(即提供 parameter calibration)。第二,计算模式融合,机理模型一般 对应计算密集型操作(CPU 多核协同或计算集群 并行化)或内存密集型操作(GPU 并行化),而数 据分析通常是吞吐密集型操作(采用 map-reduce、 parameter server 等机制)。两种计算模式针对主 要矛盾不同,需要分析算法甚至分析软件有针对 性地应对。第三,与领域专家的知识和经验的融 合方法,弥补当前一线工作人员的知识缺陷,实 现过程逻辑的可视化。例如,对于物理变化过程, 需要重点针对知识的“自动化”,而非知识的重新 “发现”。将不同领域的知识进行系统化处理,基 于大数据分析技术开展信息检索与更新的操作优 化;对于相对明确、能够形式化的领域知识,依 托大数据建模工具提供的时空模式描述与解析识 别技术,进行建模,通过海量历史数据开展验证 与提质,不断提炼专家知识形成人工智能 [5]。

《四、结语》

四、结语

工业互联网平台是制造业与云计算、大数据、 人工智能等新一代信息技术高度融合的产物,也是 先进制造业与互联网结合的新事物,需要广大科研 人员和产业工作者在实践中一边摸索一边突破。作 为制造业大国,我国拥有全球最多的工业设备,时 刻产生着海量的工业数据,拥有丰富的互联网生态 以及大量的工业与信息化人才。我们应该充分利用 这一条件,创新管理思想,重构产业生态,提升中 国制造在全球产业链分工中的地位。依托工业互联 网平台,推进工业互联网的深度应用与制造业转型 升级,力争在新工业革命时代实现“换道超车”。