一位穿着红色长裙、黑色外套的时尚女性,正优雅地漫步于夜晚的东京街头,下一刻镜头拉近,给了她精致的妆容一个特写。这是某时尚品牌最新发布的概念短片吗?不,这是由美国人工智能研究公司OpenAI在聊天机器人ChatGPT推出时隔一年后,又发布的新一款视频生成人工智能(AI)大模型——Sora的“作品”。

如果Sora来化工行业“求职”,它能在哪个岗位“上岸”?近日,记者与几位石油和化工、数字化等领域的专家和从业者进行了交流。受访者们认为,就目前来看,Sora或类似Sora的视频生成AI模型在行业中能“应聘”的岗位有限,但在不久的将来,生成式AI的“风”将吹到化工行业。

“上岸”设计岗:建模渲染受青睐

目前,Sora模型本身并未全面对外公开,仅仅凭借几段应用演示就“引爆”了全网,因为使用者只需提供几张图片,或者是输入一段描述性的文字,它就可以制作最多60秒的视频或动画,甚至可以实现多机位拍摄。其强大的理解能力、建模能力和渲染能力,无疑在影视、广告制作和视频等领域掀起了一阵风暴。

东华工程科技股份有限公司信息中心主任任申龙认为,Sora同样将在化工设计与工程方面带来大的变革,其应用可以取代设计过程中的重复性劳动和一些不太需要创造性的工作,例如图例的生成和设计图审查等。

“在民用建筑领域,已经有不少自动画图和自动审图的软件投入使用了,如果能有一个专业的大数据库作为积累,我认为Sora在工业建筑领域也是可以胜任这些工作的。Sora代表了一种全新的数据驱动物理引擎,我们完全可以利用这一技术进行更加创新的设计和开发。”任申龙看中的是Sora强大的文本和数据“理解”能力,“比如我们建筑专业在做设计的时候需要注意很多政府部门的强制性条文,但画图纸的时候很难一点错误都不犯,这就需要审图机构去审核。有可能未来我们只要输入一些设计条件,就能由人工智能帮我们自动生成图纸,而且绝对符合强制性条文要求,效率也会大大提升。”

另一方面,Sora的强大建模和渲染能力也让设计师们非常动心。它采用了OpenAI文生图模型DALL·E3技术,能够通过学习已有的视频,自主对简短的文本描述进行场景构建、光影与材质渲染等工作。在化工工程设计领域,招标时向业主展示模型无疑也比讲解图纸和数据更加直观。但现在化工工程领域还没有成熟的预制化模型软件可以使用,为一张设计图制作一段渲染好的3D建模动画要花费大量人工成本和时间,Sora的出现则能在一定程度解决了这个问题。

“从场景建模和渲染的角度来说,Sora生成的视频跟动画专业的人做的视频区别不大,但效率天差地别。此前做一个模型给业主展示,可能需要一群人1~2个月才能完成。如果用Sora或类似工具快速生成渲染后的模型用于展示宣传,能在前期的经营活动中为我们节省大量成本,大幅提高效率。”任申龙说,“从我们化工行业前端的从业者,包括设计化工厂、建造化工厂等作业人员的角度来说,Sora或类似的工具有不少值得期待的亮点,未来这个方向大有可为。”

落选生产岗:逻辑运算分太低

不同于在前端设计领域受到的期待,Sora在生产领域则遗憾“落选”,原因是它的逻辑性还不够强。

与ChatGPT连续的文字交互形式不同,Sora的交互是“一次性”的,生成视频中所有的逻辑都来自使用者给出的文本描述和AI的“自我发挥”,很难做到毫无破绽。

“现在Sora生成的视频可以用一句话来概括:‘局部合理,整体荒谬’,用于化工行业或其他流程工业的生产还为时尚早。”中化信息技术有限公司专家委员会副主任、华东理工大学讲席教授冯恩波体验了Sora的视频生成能力后这样告诉记者。

在冯恩波看来,这种“荒谬”是由目前Sora的算法技术决定的,其主要原理是把描述中的部分关键字基于像素扩展,然后在时间轴上一帧一帧扩展为动画。这导致Sora做一段精美的模型展示动画尚可,但欠缺在整体上反映物理意义、化学意义或者工业意义、社会意义的能力。

OpenAI公司也公开发文表示,目前Sora受算法局限,可能难以准确模拟复杂场景的物理原理,并且可能无法理解因果关系。该模型还可能混淆提示的空间细节,例如混淆左右;也可能难以精确描述随着时间推移发生的事件,例如遵循特定的相机轨迹运镜,可能会出现人物倒着跑步、凭空多出来小狗等荒谬的画面。

三宁化工智能工厂推进办公室主任杨文华指出,化工等流程工业的生产和控制是多输入多输出的协同调节,并且常常有很多物理变化、化学变化同时发生,需要建立多逻辑、多控制方式的复杂场景大模型。并且,由于化工生产涉及到多路线的原材料,包括工用工程的扰动都可能造成控制逻辑的变化,人工智能在短时间“学会”这些复杂的逻辑还需要探索。

“化工生产中考虑更多的是从微观到介观再到宏观的过程,更注重的是其中的物理逻辑性、化学逻辑性或者设备逻辑性、管理逻辑性,更关心的是生产整体的逻辑性是否合理、从整个生产周期上来说是不是最优。Sora想要用于化工行业的生产,还有很长的路要走。”冯恩波说。

职位“转正”难:专业技能待培训

实际上,类似Sora的生成式AI在化工行业想要“转正”,还需要大量的“岗前培训”。

任申龙指出,AI投入应用首先面临的问题就是如何让它“明白”专业知识。一方面,行业需要建立统一的标准体系,让AI能“读懂”数据;另一方面,数据库内海量数据的积累和收集还涉及到数据所有权以及知识产权的问题,业内公司可能“不愿意教”。

另一个重要问题则在于现在AI的判断能力尚显不足。多位专家表示,化工行业中很多事件的处理并非简单的0和1判断,而是要根据大空间范围、大时间尺度内生产或安全管理的情况来“模糊判断”。

“目前化工行业的生产中还有很多部分无法准确用文本叙述,我们称之为‘know how’,或者说是‘隐形知识’,这部分就是目前AI难以跨越的鸿沟。”冯恩波举例解释说,一组装置传回的温度、流量、压力等数据,外行人可能看不出什么门道,但有经验的工程师和操作工可能就会意识到问题,从而进行对应的调节或应急处理。这个“意识到问题”的过程就是信息通过人的经验被加工为可用知识的过程,也是AI的“短板”。这些基于实际操作经验的隐形知识很难被总结成一个能让AI学习和判断的数据库。目前AI的情感性也有所不足,很难做出合适的“模糊判断”,也就无法在化工安全管理等涉及心理学、行为学、技术、管理等一系列复杂问题的领域实现应用。

不过,多类型AI的融合发展或许将提供AI“上岗”的更多可能性。AVEVA剑维软件AI业务全球主管Jim Chappell此前发文预测,2024年,公众会看到多种多样的聚合型AI,包括不同类型AI之间的融合、AI与其他技术的融合等。或许Sora也将通过与工业机器人或自动驾驶等智能化技术融合,能够胜任更多的岗位,从而完成在化工领域的“入职”。

(来源:中国化工报 版权属原作者 谨致谢意)