工业数据要素管理中的“人-机-料-法-测-环”

来源:工信头条 | 发布时间:2024-01-26

工业企业在生产制造过程中积累的大量数据,有助于提升生产效率和产品的智能性。但是,由于生产模式和数据的多样性、多源异构性,以及数据质量的不确定性等原因,数据没有得到有效整合,无法有效释放数据价值,并形成持续生产力。这也使得数据要素的管理和运营问题成为了制约工业企业数字化转型的核心因素之一。结合近年来的产业实践,本文尝试从“人-机-料-法-测-环”六个方面对工业数据要素生产管理中的困局和应对之策进行探讨。

数字化进程困境与应对

自《关于构建更加完善的要素市场化配置体制机制的意见》正式提出将数据列为新型生产要素,很多与数据有关的重要政策文件陆续发布,如《“十四五”数字经济发展规划》《关于构建数据基础制度更好发挥数据要素作用的意见》等。最近,国家数据局在《“数据要素×”三年行动计划(2024—2026)》中将创新研发模式、推动协同制造、提升服务能力、强化区域联动、开发使能技术等作为“数据要素x工业制造”的重点行动。这一系列文件明确,基于数据要素的新业态将成为经济增长的新动力,是产业高质量发展的重要驱动力量。越来越多的工业企业也将数据要素视为企业未来的核心竞争力以及业务增长的动力引擎,将数字化作为“十四五”期间的重点战略方向。

从当前情况来看,工业企业在数据要素方面的既有工作主要围绕两点来开展:一方面,通过技术改造,运用传感器、5G等技术,在生产制造、产品后服务等领域采集了大量数据;另一方面,花重金启动了AI中台、数据中台等大平台系统的建设工作。然而,随着相关工作的开展,工业企业发现数据价值表现往往未如预期,数字化进程通常陷入到以下集中典型困境中:数据基础设施投入大,采集了一堆数据,想用的时候还是无法满足业务需要;相信数据能挖出更深价值,但不知道具体能做点什么,从何开始;做了些“橱窗工程”,但没有对现场产生什么价值;平台建设了不少,甚至已经换了好几个版本,但是如何进行数据价值挖掘仍然面临挑战……

在探究问题的根源时,工业企业常将困境归因于数据来源众多、处理复杂,数据量大、存储不易,以及数据标准不足等带来的一致性问题,以及高企的行业门槛带来的分析复杂性等。这些都有其合理性,但好像也不能解释所有问题。数据要素是生产要素的一种,生产要素的管理运营要解决的不仅仅是点上的问题,更需要构建一个完整的体系。有的企业已经认识到这一点,但工业企业长于传统主营业务的体系管理,对于数据要素这类新生事物,无异于跨品类经营,往往感觉无从下手,抓不住重点。

那么,工业企业如何理解和构建适合的数据要素管理体系呢?我们可以将企业数据要素管理工作想象为,将工业数据原料通过数据产线,加工成带有业务价值的数据产品的生产过程。那么,我们就可以像分析工业生产过程一样,从“人”“机”“料”“法”“测”“环”等工业企业熟悉的六个维度,对数据要素的生产过程进行分析,从而找到工业企业数据要素体系建设的破局之法。

工业数据要素生产中的“人”

对工业数据要素生产系统中的“人”,直接的理解就是数据要素产线的操作员,负责数据要素的加工和管理。工业企业的数字化工作往往是从数据系统的建设开始,因此在实践中,往往将操作人简单定义为信息化管理人员。

然而,在工业数据要素的加工和价值挖掘中,在现场拿到的工业数据往往是不全面且不可靠的。比如,设备故障是小概率事件,大部分设备运行数据都是正常工况;很多异常数据没有被有效标记;单纯依靠算法的“盲挖”,不足以指导工业生产的准确性和可靠性,诸如此类。这导致我们在工业数据处理时需要大量的行业知识,包括机理模型,以及专家经验的补充。

因此,一个理想的数据产线操作员,既需要对工业知识、业务场景和价值落地途径足够熟悉,还要掌握机器学习等现代数据的加工分析方法,更要有数据工程化应用的能力,也就是将工业领域知识(OT)、信息化技术(IT)和数据技术(DT)相融合的3T融合能力。当然,这样的全能超人可遇而不可求,对工业企业而言,更务实的做法是培养OT+DT+IT融合的协作团队。将业务专家、数据分析师和数据工程师融入到一个团队,深度结合工业企业自身的产品和生产领域知识,运用数据技术和算法,打造数据产品和服务,显化数据要素价值。

在组织中,还有一个不可或缺但容易被忽略的重要角色:行业数据产品经理。他负责定义数据要素价值释放的场景、构架业务闭环方式、评估价值产出和投入,而将具体的技术细节交由团队其他成员实现。这个角色需要对行业数字化业务有深刻理解和洞察,能够根据业务发展对业务模式、数据用户、业务价值、产品体验等业务核心要素进行规划和定义,能带领团队完成数据产品的研发和市场探索及推广。其往往也会是企业数字化业务创新的领军角色。

工业数据要素生产中的“机”

工业数据要素加工所依赖的“机台”就是数据加工过程中所需的数据采集、存储、管理,以及分析平台与工具。术业有专攻,工业企业通过采购成熟的平台或者工具套件来完成数据要素加工机台的搭建工作,这本身是没有问题的。然而,企业在实践过程中却常面临投入大量资金建好平台之后,发现“不好用”“用不起来”等问题。

造成这类问题的原因有很多,其中一个重要原因是没有认识到“没有最好的平台,只有更适合的平台”。首先,从数据属性角度看,不同企业在不同阶段所处理的数据规模、数据类型都是不同的,从研发图纸、文档等非结构化数据,到生产运行管控中产生的时序数据,再到供应链信息等关系型数据,需要选用不同的技术组件进行存储管理。其次,数据“机台”的选择还需充分考虑数据要素的使用方式,存以致用。同样类型的数据因为使用场景和方式的不同,所采用的技术路线也不尽相同。比如,同样是SCADA运行数据,在交互式分析等场景中因为需要数据秒级返回,往往需要内存数据管理技术进行支持。而在设备劣化分析等批量数据使用场景中,需要分布式存储以支持大量数据的并发读取。最后,往往也是被很多工业企业所忽视的,就是“机台”的维护成本。在工业数据产线的搭建过程中,不是使用的组件类型越多越好、越全越好,而是在满足业务需求的前提下,选择尽可能少的后台组件,将后续的维护成本降到最低。由于数据属性的不同、数据使用场景的差异,以及运营维护投入的区别,工业企业所搭建的平台也具备高度的个性差异。

在评估一个平台是否足够适合的过程中,企业通常会关注一系列的技术指标,如平台有多大的数据容量、有多少算力、有多少种算法模块等。这些指标固然重要,然而经过多年的实践之后,我们更建议工业企业从两个维度对自己所建的平台进行评估:一个是运用数据解决问题时,从问题提出到数据分析模型建立需要多少时间?这考验的是平台在敏捷创新方面的支撑能力;另一个是从数据分析模型建立,到运用真实数据投入实际生产过程中需要多少时间?这考验的是平台在柔性价值释放方面的支撑能力。这两方面是衡量机台是否“适合”企业的重要维度。

工业数据要素生产中的“料”

工业数据要素加工的原料来自工业生产各个阶段所产生的数据。随着物联技术的发展、设备智能化改造等工作的推进,数据原料的获取变得越来越容易,而数据质量和稳定性成为当前工作的重点之一。然而,企业在数据质量管理中存在一个误区,将这部分的工作集中于数据加工的最后一个环节——数据平台,因为数据的质量问题往往是在数据平台的使用分析过程中才暴露的。在这个阶段,企业希望通过清洗和修复来完成数据质量的提升。但对异常数据的修复,无论是采用固定值、插值还是时间序列学习等更为复杂的算法,都存在着很强的假设和不确定性,不恰当的数据清洗甚至可能在后续的数据分析过程中导致错误的结论。

数据质量管理需要放大到整个链路来看,这是一个端到端的过程。以新能源数据质量管理为例,常见的数据链路从设备PLC、场站中控、集中监控中心,再到区域公司,最后到集团公司,从业务视角看,各个环节对数据的质量要求是不一样的。所以,需要顺着链路进行整体治理规划。应该在尽量靠近数据源头的地方进行必要的数据质量管理,避免后续的无效数据治理和分析偏差。

同数据质量一样,数据原料的稳定性在企业做“原料”管理时也需要被重点关注。数据链路上,数据采集和传输的波动,也会对后续的数据加工产生重大影响。例如,某一风电场数据传输不及时,在做该区域统计时,无论是等待该风电场数据完整后再统计导致的不及时问题,还是先统计其他风场数据,等数据完整后再更新导致的不一致问题,都会给后续的分析带来挑战。

工业数据要素生产中的“法”

“法”就是工业数据要素加工的方法,如同工业生产中产品的加工工艺是最核心的内容一样,数据的加工方法在企业数据要素管理中也是非常重要的环节。工业数据加工,本质上是将散乱、无关联、无明显意义的数据原料,加工为有明确业务价值的数据的过程。因为投入的数据物料具有海量、异构、价值密度低的特点,而产成品又需要具备较高的业务价值和精度要求,很难一次性加工到位。因此,企业需要设置多道工序,逐步融入业务知识,将数据提纯,提升数据的价值密度,释放数据价值,最终加工成满足业务要求的数据服务或产品。

从实践中看,工业数据要素加工通常有四道典型工序。第一道是数据集成,即匹配各类工业协议,将多源异构的原生数据,应存尽存到企业数据湖中,完成原始数据积累。第二道工序是数据关联,通过数据标准化规整和关联处理,将湖中的数据整合到统一的数据领域模型中,实现物理对象和虚拟数据的孪生映射,便于后续数据分析应用中能以业务语义进行展开。如使用“风场-风机-发电机-转速”查看数据,而非直接对某个数据库进行访问,从而降低对数据理解和使用的门槛。第三道工序是数据特征萃取,结合业务需求对原始数据特征进行加工,从基础的数据时域或频域分布,到各类业务口径指标,都可以在这个阶段完成精炼,并提供给后续应用或服务做二次开发。第四道工序就是最终的数据场景化分析应用,结合具体场景的领域知识,运用统计分析、机器学习、深度学习等数据技术,实现数据价值的显化和变现。

除了分阶段之外,工业数据要素的另一个工艺特征就是“按需”。很多工业企业在建设好数据产线之后,都希望能对数据进行全量治理分析,毕其功于一役。然而,数据的加工对工业企业而言有存储成本、计算成本、维护成本,而数据的价值显现需要一个逐渐深入的过程。因此,在当前这个阶段,工业企业的数据加工还是建议“按需”开展。比如,一台核电机组采集的数据测点超过2万点,但是在针对气动阀、循环泵等特定设备或者工序进行分析时,所需的数据测点通常只有几十个。因此,结合数据业务的开展,循序渐进地进行数据加工具有较高的性价比。

工业数据要素生产中的“测”

因为当前数据要素的加工充满了创新性、探索性和不确定性,数字化项目的管理和评估也会与传统的信息化项目有所区别。信息化项目因为其具有较明确的项目范围、实施路径和交付物,常采用需求分解、模块开发再到系统集成的瀑布式开发方式。测试评估的作用,更多是在于发现与修复漏洞(Bug),保障上线系统的质量。数字化项目探索与研发并行,与我们研发工业新产品一样,项目可能会“失败”。为了降低“失败”带来的成本风险,需要及时对项目效果进行评估,并进行快速迭代。因此,在这类敏捷开发中,测试和评估将会发挥更加重要的作用。

工业数据要素的生产,需要先以终为始地制定效果验证方式和量化标准,以最小可行产品为单位(MVP,“Minimum Viable Product”),以1~4周的研发周期,进行快速上线发布和业务价值校验,根据用户反馈和量化测试结果,对下一阶段的工作进行评估。对项目执行过程及时进行干预甚至终止,并从“失败”中吸取经验,对下一阶段工作进行调整,最终实现数字化项目的小步快跑、快速迭代,从而提升业务创新的效率,降低成本风险。

工业数据要素生产中的“环”

最后也是最重要的,工业数据要素的生产离不开一个鼓励创新、开放包容的环境。这要求工业企业在推进数字化工作之初,就要同步进行制度和体系的规划和建设。企业需要认识到,数据要素的管理加工不仅仅是一个建设工作,也是一个运营工作。相应的团队不仅仅是一个技术团队,更是一个业务团队。企业需要一手抓建设,一手抓运营。

文化理念是灵魂。如前所述,这是一项从建设到运营都存在大量创新的事业,数据要素管理加工过程中难免遇到各种各样的难题,只有坚定的信念和开放创新的精神,才是克服困难、持续创新的有效手段。企业推动思维方式的转变是文化理念建设的核心。

人才是第一生产力。在数据要素管理运营过程中,人才的重要性摆在突出的位置,平台的建设和运营、技术创新、模式创新都需要大量的复合型人才。工业企业需要突破既有体制,从专职的数字化团队、业务部门内的兼职数字化专员等岗位设置,到数字化思维、工作方法、实践技术的数字化能力培训,进行全方位的人才体系建设。

数字化转型是一项开创性的创新事业,机制的创新才能带来长久持续的生命力。一方面,如何打破传统体制内的分配机制,充分激发内部人员的积极性和创造性?另一方面,如何通过机制创新,凝聚战略合作伙伴,共同推动这项事业的最终成功?这是需要提前考虑的重要问题。

从战略规划到平台的搭建,再到市场的推广、服务的交付、持续优化运营,需要大量的投入和资金支持。尤其在运营阶段,需要不断投入资源以优化和完善平台及服务,持续提升客户体验。保障资金投入、确保事业正常稳步推进是对资金保障提出的要求。

综上所述,工业企业在推进数据要素管理和运营过程中,需要从“以数据的接入、存储、管理、使用为中心”的信息化系统建设思维,转向“工业数据要素的加工生产”能力建设思维。组建3T融合的数字业务团队,建设以敏捷创新和柔性生产为目标的数据加工产线,以高质量的工业数据为原料,运用阶段化逐层提炼的加工方法,小步快跑快速测试价值,营造创新的正向激励环境,构建工业数据要素管理中的“人、机、料、法、测、环”核心能力,从而实现工业数据要素的价值显化和持续增值运营。