打开网易新闻 查看更多图片

原创:谭婧

“图越来越大,大到一定程度以后,计算机算起来就困难了。要想算得快,处理得好,必须有高性能图计算。”

这番话出自于中国工程院院士、清华大学教授、中国计算机学会前理事长郑纬民院士,发表于2021年3月25日的演讲,演讲的主题是《高性能图计算——新战略制高点》。

他认为:“普通规模的图,普通计算机就可以算,但随着数据增加,图变得复杂,高性能图计算的重要性显现。如果想把高性能图计算做好,困难不少,但是我们有信心把它们克服了,免得被人家卡脖子。”

风云变幻的国际形势下,高性能图计算,既是高性能计算与图计算这两项技术融合产生的新的技术方向,也是强国间实力竞争的重点领域。

与此同时,引人注意的是,更大规模、更复杂数据的实时处理和存储需求已经在金融、安防和电力等领域喷薄而出。

郑院士的演讲发布在海致高性能图计算院士专家工作站筹备启动会上,有关于前沿硬科技“高性能图计算”的讨论发人深省。

打开网易新闻 查看更多图片

海致科技集团(以下简称“海致科技”)是国内图计算领域领先企业,2013年创立,分为三条业务线进入到金融行业、公安行业、电力行业,齐头并进,一直处于高速发展之中,公司80%以上是技术人员,在知识图谱,智能数据产品领域已有较高的市场占有率。

究竟图计算能做什么事情?

打开网易新闻 查看更多视频
一分半钟-了解高性能图计算-第四版

郑院士给出的答案是:“比如,检测电商的虚假交易。买家卖家交易,一秒钟30万条,从中找出少量的欺诈交易很困难,但是,可以用图办法来解决。再比如,金融风控里的借款人失联修复,银行用手机、电子邮件号,微信号与借款人联系,但人可能突然就失联了,找不到了。这时候图计算发挥作用,通过各种图中的关系,就能再次联系到借款人了。”

悄然间,图计算已经在国家安全、金融安全等方面释放出价值。在金融领域,能实时识别出欺诈、洗钱行为,给出风险预警或阻止。在电子商务领域,实现更为精准的商品在线实时推荐。在网络安全领域,实时识别出攻击流量,保护信息和服务安全。

图是由节点(vertex)和边(edge)构成的一种古老的数据结构,已有上百年的历史。

图数据提供了从“关系”的角度去分析问题、发现问题的能力,有优秀的表达能力、可视化效果和坚实的数学基础。

图计算是研究人类世界的事物和事物之间的关系,对其进行描述、刻划、分析和计算的一门技术,是前沿理论界的研究热点。

世界是复杂关系的总和,图技术能够更好地描摹世界真实形态。在图 之上进行计算、分析和挖掘,包括关系的发掘、特殊群体的识别、个体的分析、事件的传导和知识推理。

但是,想要在大数据与人工智能领域,做好创新性应用,学界科研和产业实体必须深度结合,就像两条腿走路,缺一不可。正如此,海致高性能图计算院士专家工作站建立的初衷:要将清华大学知识储备和海致科技在应用方面的经验相结合。

在产业界的不为人知处,图计算技术已经成为科技巨头的兵家必争之地。

无独有偶,美国国防部也投入大量经费用于图计算的研发,并且依托大数据公司Palantir为其提供技术支持。该公司的图计算技术,也屡立战功,曾成功抓捕了本·拉登,追回了纳斯达克前主席麦道夫Bernie Madoff数十亿美元隐藏巨款。

而Palantir总是有意无意地透露出要与中国划清界限。

作为科创型企业, 海致聚焦高性能图计算的决心与底气来自于多方面。

2020 年2月,新冠肺炎疫情背景下,海致科技是国内最早开始支撑各地开展数字化防疫的企业之一。奔赴一线,从疫情最为严重的武汉起步,先后在湖北、北京、上海、湖南、广东、江西、新疆等十几个省240多个市县,搭建数字化防疫模型,发挥“智能中枢,决策大脑”的角色,进行病毒溯源、资源调配。

在金融领域,海致科技搭建了国内金融行业最大规模的知识图谱分析项目。某股份制商业银行的信用卡中心,汇集了8000万的持卡人的相关数据。对应到图计算的顶点和边,就有40亿以上的节点数据,420亿边数据。

数据量仍在不断增长,这一需求让团队看到了高性能图计算的产业呼声。

在分析类的场景,数据量将会越来越大。在实时类的交易场景,要求将会越来越多。受限于当前图计算技术增长的边界,想要做到毫秒级微秒级完成超大图的计算,软硬件的优化都受到挑战,亟待解决。

所以,海致要抢占战略性制高点,打造全球领先的图数据库,培育世界级的图计算软硬件生态体系。至此,海致高性能图计算院士专家工作站应运而生。

这一院士专家工作站由科研泰斗坐镇,群星荟萃,由郑纬民院士担任海致科技首席科学家。他是我国高性能计算和存储系统等方面的泰斗和先行者。在存储系统领域,郑纬民在国内从一张白纸率先开展了网络存储系统关键技术的研究,成果一再打破国际存储公司的垄断,做到世界领先。

2016年与2018年,郑纬民及其团队两次斩获“戈登·贝尔奖”,这一奖项有着世界超级计算应用领域诺贝尔奖之称。

第一次获奖,代表了我国高性能计算应用成果在该奖项创办30年来零的突破。第二次,代表了高性能图计算系统神图,处于世界领先地位。2018年,郑纬民院士成为首届中国存储终身成就奖获得者。

作为新的技术方向,发展高性能图计算的工作难度可想而知,但是有了“产学研平台”这一优质土壤,在“成长路径”的规划下,很有可能做出傲人成绩。规划由清华大学计算机科学与技术系武永卫教授发布,

对此,武永卫教授先抛出的核心思想是:“克至难,图智远”,希望团队脚踏实地,实实在在,行稳致远。

打开网易新闻 查看更多图片

在宏观方面,武教授谈道:“承接海致经验所在之处,希望从公安、金融、电力三大行业的应用,推广到各行各业。

希望把图计算领域产业链条打通,从硬件到应用,包括系统软件、中间件、中间的平台服务,解决我们被“卡脖子”的难题,不管别人怎么样,我们都能够自力更生。因此,不能仅仅埋头研究,需要在产学研相结合的环境下思考,直面困难与挑战,考量软硬一体,实现图计算生态的构建,特别是高性能图计算的应用,支撑起高性能图计算在中国开花结果。”

武教授介绍,在实践行动方面,分为三阶段。

近期,希望围绕图原生的数据库系统,基于通用的处理器,X86、ARM、MIPS等,自主开发数据库系统,很好地向上支持图查询、分析,支持业务需求。

中期,到人工智能领域广泛深耕,图神经网络等支持更多应用。自研系统云化,并对外开放。

远期,“云边端一体、软硬件协同”,自主可控的国际一流图技术产品体系和应用生态环境,实现从技术到产业的全面突破性发展。

“到2023年,图技术将促进全球30%企业的快速决策场景化。图技术应用的年增长率超过100%。” 全球知名咨询调查公司Gartner曾在技术趋势分析报告中指出。

郑纬民院士认为,第一,虽然高性能计算和图计算技术在我国已发展多时,但现有的解决方案尚不能满足复杂类型的操作需求,尚未实现软硬通融,还有更为广阔的应用市场亟待开拓。

第二,由于战略前沿性和全局拉动作用,抓住高性能图计算,就相当于抓住了大数据、人工智能和高端计算产业的牛鼻子,其影响不可估量。现在布局高性能图计算,恰逢其时。

在海致高性能图计算院士专家工作站的启动日,海致科技与清华大学计算机科学与技术系签署合作技术开发协议。此举,为中国图计算的技术攻坚、应用发展、产业链完善带来希翼与期待。(完)

《亲爱的数据》出品