11月28-29日,为期两日的36氪WISE2024 商业之王大会于北京隆重召开,作为中国商业领域的全明星盛典,WISE大会今年已经是第十二届,在不断变化的时代里见证着中国商业的韧性与潜力。
2024,是有些模糊且变化多于稳定的一年。相比过去十年,大家的脚步正放缓,发展更加理性。2024,也是寻求新的经济动力的一年,新的产业变化对每个主体的适应性提出了更高的要求。今年WISE大会以Hard But Right Thing(正确的事)为主题,在2024,什么是正确的事,成为我们更想交流的话题。
北电数智CMO、战略与市场负责人杨震
当日,北电数智CMO、战略与市场负责人杨震作了主题为《“国产算力PoC平台”,以场景测评寻找算力最优解》的演讲。
什么是“正确的事”,在如今的AI行业,拆解这样一个问题变得尤为复杂。但从2023年人工智能产业的营收角度来看,人工智能真正进入实际生活还很远。芯片层占了产业90%的营收,模型层有7%,但应用和工具层仅占了3%。
人工智能真正实现落地面临三个问题。算力是要解决的第一个难题,行业企业对国产算力芯片的性能和适用场景并不了解,下意识也会排斥使用国产芯片。如何把国产算力用好是关键的事。第二个问题,是如何打通算力和场景,让国产芯片和模型能完成适配,更好发挥模型的效果。第三个问题,则是如何让国产芯片协同作战,发挥集群效应,发挥不同国产芯片的算力优势。
北电数智推出了全国首个国产算力PoC平台,打破国产算力供给侧与需求侧之间的产业链断层,国产算力集群提供垂类场景评测、适配与验证服务,同时,为AIGC视听、金融、政务、工业、医疗、具身智能、交通等多领域AI应用企业提供多种算力适配试验空间,推动国产算力芯片和场景适配,将国产芯片用起来,推动人工智能时代的到来。
以下为北电数智CMO、战略与市场负责人杨震的演讲实录:
杨震:今天相信每家企业都是被这个题目引来的——做难而正确的事。人工智能是当下最火的话题,如何把算力用起来是难而正确的事。这非常契合今天的题,它怎么难、如何难。
通用技术变革生产力,难而漫长的事情
人工智能是一个全新通用技术的发明,人类历史上每次出现的新通用技术都带来了产业变革、行业变革和每个人生活的变革,它不断推动人类文明一点点往前。前三次工业革命都不如人工智能革命带来的变化彻底,它应该是整个人类文明一次质的飞跃。
但是这个飞跃来得容易吗?非常难。以电举例,电发明之前是蒸汽动力,那个时代已经有工厂,所有工厂都用蒸汽动力驱动;从电和发电机被发明出来,到电真正进入工厂替代动力源将所有工厂变成电力工厂花了50年,可想而知有多难。它不仅是动力源的替换,还要替换新型生产工具、产线、完整的生产系统,不仅是技术,更是流程、组织、系统,和每个人意识形态的变化。
今年持续有AI手机、AIPC推出。个人电脑诞生于上个世纪七八十年代,但个人电脑完全进入企业是新世纪以后的事,直到ERP、CRM等一系列工具能发挥电脑的作用,给企业带来质的变化时,它才会被普及。
回到人工智能,人工智能上个世纪50年代就出现了,但直到2006年深度学习提出才被大家关注。50年代就有类似决策向量等理论,当时《纽约时报》也预测说人工智能将来临,机器帮人做事在十年之内可实现,结果花了50年才成真。到新世纪时才会有机器学习出现,到了2021年神经网络这个体系在大赛上取得胜利,神经网络这个词才终于被大家所认知。同样的道理,大家真正认识到生成式人工智能是GPT3.5涌现了所谓的智能,给大家带来了全新的认知。之前虽然说有深蓝下国际象棋,AlphaGo下围棋等,但大家并没有切身体会到它真正产生了智能的状况。
人工智能落地,需要敢用、会用、用好国产算力
这时候又一个问题出来了,人工智能是一项通用技术,它距离真正进入千行百业、影响每个人的生活还有多远,从营收数据就可以看到。人工智能三大要素算力、算法、数据,目前还是卖铲子的人赚钱,2023年芯片层占了整个人工智能产业90%的收入,模型层贡献了7%的收入,应用和工具层仅占了3%,从这个数据看,离人工智能实打实落到所有人生活还很远。
为什么这么远?绝大部分通用技术在进到产业、社会前,首先会在To B端突破。大家可能已经开始用机器人写文章、查东西,但人工智能如果想进入企业,仅有聊天机器人是不够的,他需要系统搭建。
对于企业尤其是中国企业来说,要搭这个系统很不容易。算力其实是要解决的第一个难题。国内有将近30家GPU厂商,国产智算芯片有多好,能支持什么场景,怎么能够用起来,很多人不知道,所以下意识也会排斥不知道的东西,还是想用进口芯片。如何用,如何把国产算力用好,其实是蛮关键的一件事情。同时由于我国的产业结构,会看到有芯片层有30多家企业,模型层有百模大战,整个人工智能产业链在国内还是相对离散的状况,并没有进入收敛期,就让构筑这个系统更复杂,企业更难抉择用谁家的芯片、谁家的模型,怎么搭智能体平台,构筑企业级应用和企业级工作流,是所有人思考的事情。
打通算力和场景,PoC平台加速人工智能时代到来
今天讲的是国产算力的PoC平台,第二个问题,为什么需要国产算力PoC平台?总书记常说,看清现实,认清差距,找到路径,解决问题,整个国产算力和国际上先进的算力是存在两代左右代差的,但国产算力整体来说并不是不能用,他们都有自己发挥得非常好的部分,但使用者其实不知道国产算力哪里好用,怎么用起来。
基于这样的状况,对于算力供给方,当没有人给它场景的时候,它其实缺一个练兵场,能提供的都是单芯片的理论数据,但集群数据是怎么样的,很难得到。
整体来说,国产芯片产能还是受限的,单一国产芯片整体产量不足,很难满足需求。算力使用方也经常跟我们说,想用国产算力,但不够。他们其实有场景、有模型,但是模型任务一直在排队,等,这是我们要面对的实际问题。
这时候就提到第三个问题,为什么国产芯片不能协同作战?可能大家也听说过,每个芯片都有自己的生态,这个生态形成了自己的商业闭环,但是不同的生态之间协同作战存在一个隔阂,换句话说,在非常多的智算中心里,哪怕在同一个智算中心里有不同的集群,每个都是不同的算力烟囱,很难协同作战。对于使用方来说不知道谁家好,买单一芯片总量又不够,这又是个非常大的问题。
这次PoC平台,我们推了非常多的场景,比如金融、工业制造、AIGC视听场景,在这个场景里大家可以把自己的场景放进去看一下,国产算力在相应场景里表现怎么样,好不好用,适不适用,我们希望通过这样的平台,让大家正确地认知国产算力,正确地认知国产的算力集群是否能有效支撑实际的场景使用。
想让国产芯片协同作战,有蛮多的难而正确的事,或者说蛮多的苦工夫要做。芯片和模型之间实现适配要磨合,能够支撑芯片和模型有最好的表现,这是单一模型。混元集群是把不同算力集群打散,让他们形成巨大的虚拟算力池,对外根据实际场景提供相应的算力支持和服务。他就有非常多事情要做。第一,要让纳管的不同算力集群能够无差别支持不同的模型,有蛮多的事情要做。
我们已经实现超过10种国产芯片算力集群向上交叉普适的适配,超过20种主流的基座大模型的适配。为了支撑主流基座大模型,我们先做了算子补齐和自动调优,让所有主流芯片和基座模型进行交叉适配。如果两个芯片集群协同,打一些补丁就好了,但要想实现纳管的所有算力集群协同作战、共同对外,打补丁这条路是走不通。我们写了统一的通信库,让不同的算力集群用我们的通信库来进行通信。
刚才提到有一些国产算力和进口算力存在代差,我们去研究算法有没有机会定义硬件,给国产芯片加速,我们做了非常多类似时间压缩、编译优化的事情,通过软件给硬件做加速。
因为我们是巨大虚拟的算力池,对外提供算力服务其实需要强大、灵敏的调度策略,我们做了多套灵敏的调度策略,根据不同任务有效、准确的调配整个算力池里不同的算力,以支撑各类任务。我们还在攻关调度,让算力像电力一样可以削峰填谷,实现不同集群协同作战,无差别提供服务。
以往提供服务都是租赁的方式,按台、匹来租赁。当我们做到这样的技术,其实可以按消耗,按吞吐量计费,你用了算力才收费,不用的时候不会因为你占用时长而收钱,让非常多中小公司、开发群体,甚或是个人开发者,能用得起算力,用到非常好的高质量算力。
在基础工作做完以后,为政务、医疗等场景提供有效支撑。提到这个的时候又会提到非常多难的部分,其实做整个算力测评适配的时候,一定要对背后的原子级场景区分,语音识别、图象识别、纠错等,才能调用每个芯片里相应的参数和指标。
我们国产的PoC平台已经落地北京数字经济算力中心,对外提供服务。上周新华社、人民日报等都做了报道。我们希望搭建一个使用方和国产算力方双向奔赴的平台,推动国产算力能够被当做电一样用起来,推动整个人工智能时代的加速落地。
快速介绍一下我们是谁,我们是北京电控旗下的企业,去年8月1号才成立,现在第16个月。由于年轻决定了我们是一家人工智能的国企,我们也以总书记对科技企业三性,原创性、颠覆性、引领性作为对自身的要求。新中国成立的时候,酒仙桥一度是新中国电子工业的摇篮,北京市数字经济算力中心以及国产PoC平台就在离这里大概一公里的地方,我们也希望酒仙桥能够在人工智能时代成为新的人工智能高地,推动人工智能第四次工业革命在中国加速落地。