机器之心原创

作者:吕海洋

一台风力发电机的叶片上刚刚出现了一处沿展向 0.5 米左右的雷击开裂,风电机组的预测性维护系统马上给风场运维人员发出了损伤和维修警报……

风机叶片是由复合材料制造而成,其结构比其他金属类机械部件更复杂。作为风机最重要的部件之一,它占了总成本的近 20% 左右。叶片雷击损伤开裂,是风机最常见的失效模式之一,在硕大的风机叶片上,一道不足 1 米的浅裂痕可能对风机叶片承载能力和机组安全造成严重的威胁。

这种昂贵设备的故障,在实际运行中虽然并不频繁,但风电叶片在运行过程中会遭遇多种复杂的物理环境,如风、雨、冰、雷电、高低温等。这些复杂的多重的物理环境,与复合材料材料自身的属性的特异性叠加,会产生不同物理效应,以至于很难简单识别(或者判断成本太高)故障是形成的过程,何时会发生显著的损伤,以及如何通过运维策略降低故障率。

打开网易新闻 查看更多图片

传统的工业生产,基于物理或化学的硬机理模型,经过几十甚至百年的生产验证,形成工业规程。在很多工业领域,工人可以根据过往经验人为判断何时需要检修和维护。而在新型工业场景中,数据驱动的工业 AI 模型可以在短时间通过机理融合数据驱动分析,迅速挖掘出导致故障的分析洞察,并且在运行过程中有效地把专家经验固化下来,优化原有模型或者形成新的模型。

风电场大多地处偏远地区,一些风场甚至建在一望无际的大海之中,每次运维都要带着备品备件翻山跨海。且不说出现停机、设备损坏的损失,风场为了保护设备、保证正常运行做的定期维修、维护,就要耗费巨大的人力、交通等成本,相应的设备 Know-How 知识沉淀就变得极有价值。

设备昂贵、损坏无规律、难预测、维护频率低但损坏影响大、维护成本高,是预测性维护的典型应用场景,风电设备可以说完全符合这些特点。

作为工业 AI 在现阶段的头号应用,基于 AI 分析的预测性维护,可以在工业生产流程中实现精准管控,最小化停机、停产时间,大幅减少资源、产能浪费。

然而不同工业场景对数据采集、AI 模型和行业 Know-How 的需求大不相同。在很多场景的维修过程中,只有那些常年奔赴在一线运维现场的老师傅,才能依靠自己的经验找到原因。空有传感器、数据平台和 AI 算法做不出真正落地的工业 AI。

有 Know-How 才有智能

据麦肯锡数据显示中国工业市场体量约有 106 万亿元,人工智能在工业领域的应用可以为工业节省 1% 以上的成本,以 AI 单个项目能为企业创造三倍的价值来计算,人工智能在工业领域的市场也至少有千亿之多。

Markets 的预测报告认为,2025 年人工智能制造市场规模将达 172 亿美元,预测期(2018-2025 年)内的年复合增长率为 49.5%。Automation Technology 则预测到 2035 年,人工智能对制造业增值占比可达 2.2%,排名社会 16 个主要行业之首。

在千亿市场蛋糕的诱惑下,工业智能市场一片繁荣,大大小小的工业技术、AI 技术、IT 技术供应商挤满了这条赛道。截至目前,中国工业互联网产业联盟已有的会员单位超过 1600 家,国内工业智能平台和应用数量在全球范围均占比颇高。

很多企业认为 IoT、大数据、人工智能这些背后的逻辑就是数据分析,To C 也好,To B 也好,工业也好,消费品也好,都是数据驱动技术,只要把数据采集和分析做好,就能得到放之四海皆准的「技术公式」。然而,工业智能与互联网的智能有着本质的区别。

在工业场景中 IT 与 OT,机械与电器、工艺之间,存在很深的鸿沟。例如,工业数据与商业 AI 的大数据不同,大多是模拟信号,并非数字信号,每个信号都有其背后的机理含义,收集数据以后要对数据进行处理才能应用。

「我曾经接触过一个企业,他的核心设备是一个 0.5 秒每次的往复机构,但企业最初建立的大数据系统收集的数据都是以 1 秒为单位的,这样的数据对于工业智能来说很难起到实际作用。」天泽智云 CEO 孙昕说,工业中要做精确的故障诊断往往要用到高频数据,包括声学信号、振动加速度等。通常采样频率足够高了以后,尤其针对旋转类机械部件,才能识别到故障早期的细微变化。而如果故障的早期没有细微变化表现,通常是无法诊断的。这样的场景,只用通用的 AI 分析思路和数据采集方法很难给客户创造实际价值。

此外,对于工业 AI 来说大数据并非需要绝对的「大」。无论是预测性维护还是缺陷检测,只有出现「不正常」情况时的数据才是有效数据,因此工业界应用的大数据常被称为「Big Small Data」。

风机发电机轴承的温度传感器显示温度过高时,工程师不能马上拆机检查;核电设备的主泵、管路振动故障,也很难实现停机深入探查。这意味着,算法建立之初拿到的训练数据,很难有准确而高质量的故障标签。在这些有效数据有限的场景中,就需要更多蕴含机理的数据。「强机理弱标签,弱机理多标签」,工业 AI 训练的过程中,更需要的是结合场景 Know-How,根据目标要识别的故障模式,采集与这些目标故障相关的数据。这些数据可能是高频振动、声音,也可能需要结合工况数据如转速、温度等针对实际问题的多维数据。

为了给风机叶片做一套可行的、可规模化应用的预测性维护系统,作为工业智能公司老板的孙昕就专门招募了一群专注风电领域的产品经理、流体力学博士和叶片设计与运维专家。

在风电专家和算法工程师的共同努力下,天泽智云推出了针对风电行业的智能化健康管理解决方案,并自主研发了融合智能算法的软硬一体化产品「叶片卫士™」。通过外加传感器监测叶片扫风声噪、本体振动、与结构应力数据,经过融合机理特征增强的 AI 分析判断结构开裂、前缘腐蚀、螺栓断裂等风险因子,利用专家知识融合各个因子判断不同故障类型,并及时进行预警。

打开网易新闻 查看更多图片

把风电叶片运维从依靠工人经验去「定性」分析转变成了依靠数据的「定量」分析,包括故障模式、故障等级、设备损耗风险程度等,为用户决策维修时机、制定维修策略提供量化依据,真正打通数据与决策之间的鸿沟,帮助用户降低运维成本。

工艺经验沉淀与智能化升级

优化能源管理是工业人工智能的另一个重点应用领域。据不完全统计,大型工业系统正消耗着全球能源的 54%。冶炼企业是能源消耗大户,也是 AI 能源管理见效最快速的行业。

钢铁联合企业构成非常复杂,能效提升的推动过程会遇到各种困难。典型问题之一是煤气产用不平衡,而且每个工序的突发异常,都将影响整个管网压力的波动。

产用的不均衡可能影响正常的生产运营乃至不必要的浪费。比如说,煤气波动过大时造成燃烧效率降低,即使已投用自动燃烧系统的炉窑也很难达到经济区间。而煤气管网压力过高则导致煤气放散白白浪费,煤气压力过低会造成末端工序因生产条件无法满足而临时停产。这样不仅会造成巨大的经济损失,也会造成环境污染。

为解决这些问题,需要有效地协调煤气跨工序的协同调度,构建煤气智能平衡系统,为管理者提供数字化管理的抓手,为动力调度和一线操作员提供操作辅助决策建议从而提高工作效率。

山东某钢铁企业在工业 AI 技术的实践中,将高炉煤气智能平衡系统部署在各个分厂的集控室中,与生产密切配合。系统可以实时监测管网压力和各设备产用气波动,并通过智能模型的预测和计算,为一线操作员提供实时用气建议,使得各工序煤气的使用既能满足本工序的工艺要求,又能实现跨工序间的用气协同。

当发生异常情况时,系统也可以实时通知动力调度员和管网各工序操作员,实现更敏捷的调度响应。最后,系统也提供了对煤气波动的归因分析,帮助相关部门分析问题原因,持续改善。

煤气管网的智能调度系统利用机器学习算法建立高炉煤气产生的预测模型,可以对未来 4 小时煤气产生量曲线进行预测,同时对减休风(由于炉况异常造成的煤气发生量剧烈下降现象)事件进行预警。

结合对煤气产生量和煤气总管压力的预测,首先保障关键用气工序的生产节拍稳定,如多个热风炉换炉节拍,避免由于生产节拍紊乱造成的管网压力波动。同时对异常的用气情况进行检测,将不按照规范使用煤气的操作在各个操作工序间进行广播,既对此类现象进行了有效地监督,还可以提醒各个工序对此类现象可能对自身生产带来的影响进行评估和预防。

最后,结合管网的压力趋势预测和异常事件的影响分析,对发电锅炉的用气调度指令进行决策建议,最终达到稳定压力的作用。

据估计,高炉煤气智能平衡系统预计将为该企业带来年化经济收益 2300 万元。与此同时,系统的标准化操作建议和异常问题追溯也为能效精细化管理提供了新的抓手,促进了系统与运营能力的持续成长。

「包打天下」的工业 AI 模型

上边讲述的这两个案例,只是工业领域「百业百态,千厂千面」的缩影。

「工业」二字包罗万象,其中包含的分支领域难以计数。每个分支都有各自不同的子场景,这些高度碎片化的场景中蕴含着各种各样完全不同的业务逻辑,每个逻辑又对应企业各自的痛点,不同工业领域之间需求的差异化完美地诠释了「隔行如隔山」。

行业的差异化需求给大量专业领域的小微企业创造了生存空间,但也使得今天的工业互联网行业出现了「平台林立,应用丛生」的景象。

即便是同行业,在不同的生产阶段,不同的工业设备也很难实现智能化平台的统一。以工业大厂的智能制造平台为例,西门子的 MindSphere 更擅长通过数字孪生对工业 PLC 进行优化管理;施耐德的 EcoStruxure 在电气化领域实现了基于主动控制的无人值守和可靠运维管理;ABB 的 Ability 则更擅长自动化设备、边缘端的一体化数字化能力。

每家工业大厂都希望能打造跨行业、跨领域的通用平台,从而扩大自己的客群和市占率。但在用户端,则更关注智能化应用的行业经验及与自身业务的契合度。

辛辛那提大学讲席教授李杰教授主导的美国 NSF 智能维护系统中心(IMS),针对工业人工智能的预测性分析维护提出,在传统的基于专家的规则和机理模型的基础之上,通过数据中蕴含的洞察建立工业 AI 模型。

基于不断累积新的知识,形成可以持续传承、迭代的模型和行业模板,并逐步构建成体系化的工业人工智能系统。利用大量的数据和自动化控制相结合,搭建可以从数据到知识再到执行的闭环。由此,工业智能开发者们正在差异化的行业和设备之间,寻找 AI 模型跨行业复用的可能性。

2020 年疫情期间,天泽智云的几个工程师带着叶片卫士背后声音识别的模型,做了个实验:参加了科大讯飞组织的 AI 开发者大赛。他们用判断风电叶片故障的声音算法中的可迁移模块,改造出了一款能够通过哭声判断婴儿情绪的 AI 模型,并赢得了声音识别算法比赛的第二名。

风电叶片和婴儿啼哭明显是两个天差地别的碎片化场景,虽然工业 AI 应用目前不存在包打天下的产品,但 AI 的算法模型可以通过参数修改和共性组件的迁移在相似的算法学习任务中实现复用。

从风电叶片到婴儿啼哭,其背后的 AI 模型迁移能力来自「模力工场」的 ModelOps 敏捷开发模式,工程师和行业专家可以在同一平台、同一套语言下工作。从了解需求、定义需求出发,构建跨领域、跨部门、跨阶段、跨环境的工业人工智能体系,从数据的采集与管理,到算法的设计、探索、验证,以及部署和监控,形成以模型为驱动的工业人工智能平台。

孙昕认为,「工业 AI 中,还没有出现放之四海皆准的模型,但可以通过大量实践经验抽炼出最高通用性的模型,从而实现跨场景跨行业的适用性。」

AI 模型复用,是结合行业经验,提取不同场景中的相似问题,通过优化调参实现场景间的迁移。就像汽车根据不同地形更换轮胎,切换驾驶模式一样。

这种复用和场景迁移也需要大量的行业知识积累,跨行业应用只是基础,在此之上,工业智能还要具备冷启动的能力。「在切换场景、切换设备、切换位置之后,不需要再去搜集大量的故障数据,算法工程师也不用再重头做模型训练,这样的 AI 才能满足工业应用的落地需求。」孙昕如是说。

生产「工业智能组件」的流水线

工业领域最重要的是懂背景、懂机理,单纯地做采集数据、分析数据是没有意义的,工业应用的研发和实施过程中最大的痛苦是工业和工程的技术整合的过程。

工业应用要结合行业经验,但 IT 工程师和行业专家之间「语言不通」。孙昕认为,「让这些不同领域的团队融合到一起需要经历漫长的化学反应,因此工业智能需要由工业 + 工程双基因驱动的平台实现。」

让专注智能应用的 IT 技术公司把「千厂千面」的工业知识学个遍,这显然不切实际,因此把智能化技术赋能到应用企业中才是最佳方案。

「授人以鱼不如授人以渔,交付产品不是赋能的终点,而是起点。」孙昕认为,工业客户对人工智能的需求不只限于一款应用产品,而是应用 AI 的能力。「我们希望打造一套工业 AI 的基础设施。客户需要 AI,我们可以直接提供成型的 AI,但我们更希望把造 AI 的技术、生产线交给客户,让客户在遇到新的痛点时能自己去造 AI 模型,自己去解决问题。」

上文介绍的高炉煤气智能平衡系统是钢铁行业应用工业 AI 的典型项目,项目上线后的一年中,该山东钢铁企业持续对 AI 技术模型进行研究,采用与煤气平衡系统建设类似的方法论,深入挖掘生产部门需求,在系统上不断丰富功能,开发了更多环保指标监测、加热工艺分析的可视化工具,为各工序主操提供全方位的用气决策辅助。以煤气平衡系统为代表,数字化智能化生产的理念在该企业逐渐生根发芽。

工业智能平台的优势就是随着项目的增多,平台上积累的模型就会逐渐丰富,而这些模型就是工业智能应用中最宝贵的知识资产。随着针对通用设备的模型和算法不断积累,在每个碎片化场景中都能找到可以迁移复用的模型,平台也就更加通用,适应于更广泛的场景,最终根本性的解决碎片化问题,「今天看到的碎片化问题,将来一定没有这么多碎片化。」

目前,天泽智云的大多数工业智能项目,一期工程只需要 4-6 个人的小团队,在 4 个月的时间内就能把一个从零开始的工业智能项目完全落地到企业中。

「虽然我们现在每天都会面对新的场景,但只要结合行业经验,把对的数据采集好,用我们沉淀的行业经验和算法模型去落地,很快就能看到效果。」孙昕说,与用户合作过程中,优先制定清晰的合作框架,确定要解决的问题。通常 AI 项目上线一年创造的价值,就能帮客户收回一期投入的成本。

工业 AI 虽然不像传统 C 端业务那样高速增长,但贵在稳定,且随着技术的逐渐成熟,应用的不断推广,市场将会越来越大。风电行业的后运维市场规模就超过了 300 亿,目前的年复合增长率是 25%,钢铁行业的能耗每年有 600 亿市场,化工也是几百亿。

「我认为坚定走工业 AI 这条路是没有错的。」自 2017 年以来,天泽智云的年平均增长接近 100%,对于工业 AI 市场的未来,孙昕很乐观。