“投而优则研”,这句话用来形容梁文锋,既准确,或许又远远不够。

作为曾经的“量化四大天王”之一的幕后老板;也是火爆国内的AI公司DeepSeek的实际控制人。

梁文锋被认为是量化投资家投身AI创业的“第一人”。

但事实证明,梁对AI的兴趣远不止于做其幕后金主。

在一些最新的论文网站中,梁文锋赫然成为几篇AI论文的共同作者。

这或许表明,梁文锋对自己的“定位”,可能远不止是投资家、慈善家(他曾以化名捐出过至少1.38亿元)或是AI公司大老板。

而这显然也将继续影响中国国内量化市场、以及AI市场的格局。

这背后有什么隐情,值得追索?

打开网易新闻 查看更多图片

成名于资管

尽管,梁文锋最近的受访重点都在AI公司上,但不可否认,他在量化投资上的成就,才支撑了他如今在其他领域的“大肆投入”。

梁文锋是一个“80后”,他出生于广东的一个小城市(此前报道),本科和研究生都就读于浙江大学,拥有信息与电子工程学系本科和硕士学位。

2008年,梁文锋和几个伙伴(部分是他的浙大同学)一同创立了幻方量化。

此后,梁文锋和他的小伙伴通过幻方资管、九章资产等平台拓展量化资管业务,仅用了十年时间便占据了行业最前列。

幻方系资管机构不仅是规模早早超越百亿元的少数几家量化私募机构。更被业内称为首个突破千亿大关的量化机构。

而且,在业界,幻方以敢于在硬件上投入著称,他很早就建起过篮球场大的算力中心,以支撑其交易系统的实施。

曝光于慈善

量化投资带来的成就不仅是规模也包括财富。

2023年初,业内传说有一位化名“一只平凡的小猪”私募从业人员,在2022年捐助各类慈善机构1.38亿,登顶当年私募业捐助个人纪录。

此后更多的消息指出,这个人就是梁文锋。

而且不仅他个人在捐款,幻方作为机构也在捐款,其后者捐资也是上亿的级别。

这不仅显示了梁文锋对事物的看法,也显示了其强大的财力,后者也成为他个人身上的一个标签。

“孵化”萤火虫

但草蛇灰线间,梁文锋的主要注意力已经转移。2023年5月,梁文锋实控的AI研发机构北京深度求索成立,次年DeepSeek正式上线。

与此同时,业内传出了幻方量化主动缩减资格规模,不再参与量化第一梯队的竞争,至2025年初,该公司的规模已经不再大于300亿,退出了行业前六名。

但更早时间,一个名为萤火虫的系统已经开始孵化。

萤火虫(High-Flyer),通常以小巧、轻盈、灵活的形象示人,在人工智能(AI)领域有着特定的意味。即,较低的成本和资源实现高性能,类似于萤火虫用微弱的能量发出光亮。

另有一种解释是:萤火虫以群体行动发光,这一特性类似于人工智能高性能计算(AI-HPC)系统。

来自接近人士的信息称,梁文锋至少自2017年开始,就低调地开始孵化“萤火虫”。而前一年10月末,他主导的幻方第一份由深度学习生成的交易仓位上线。

“亮相”于交易市场

萤火虫的出现,首先是一定程度上改变了幻方和量化界的工作模式。

幻方的官方资料中写道:“2017年全面应用深度学习技术进行交易。”

那个年份,中国权益市场正在掀起一轮“价值股牛市”,而量化投资在彼时几乎没有任何“地位”,皆是主动选股基金经理、游资力量的“地盘”。

到了2018年,中国量化版图开始逐渐形成,并出现了“四大天王”、“北九坤、南幻方”之说法,幻方量化均占有一席之地。

量化圈的崛起,迅速的压制了游资体系,直至今日。

而当时的梁文锋团队,在业内就以高频交易的手段著称。后者从很多冲动交易者的手中寻找到了超额收益机会,同时也改变了市场面貌。

这种改变,延续至今。

另一种“高调”

从2018年开始,中国量化投资的话语权快速上升,幻方量化的资管业务不断增厚,梁文锋开始转向一种“高调”。

梁文锋和他的团队,将自己孵化许久的“萤火虫”超级计算机,对外正式亮相,并称占地面积为数个篮球场。

公开资料称:“萤火虫”的投入前后超过10亿元人民币,这个深度学习训练平台提出了“算力随时待命”的口号。

虽然梁文锋将此孵化产物宣传得相当高调,但外界对其进一步战略意图并不清晰。

这一度衍生出两个问题:

一家主打量化策略的资管机构,真的需要这么强大的算力吗?

一家机构对于算力和设备的“执着”,是否要进军数字货币领域?

一万张芯片

其实不然,梁文锋似乎很早就看到了技术前沿趋势——AI之爆发机会。

打开网易新闻 查看更多图片

他与多位“萤火虫”项目的同事撰写过一篇英文论文,题为《“萤火虫”人工智能高性能计算:一种面向深度学习的高性价比软硬件协同设计》。

这篇论文提到一个背景:深度学习(DL)和大语言模型(LLM)的快速发展,导致对计算能力和带宽的需求呈指数级增长。与此同时,更快计算芯片和互连设备的高成本也显著推高了高性能计算(HPC)的建设费用。

接下来,梁文锋团队在论文中透露了如下关键细节:

“在深度学习训练中,我们部署了萤火二号系统,该系统配备了1万张A100GPU芯片,在性能上接近DGX-A100(英伟达推出的人工智能专用超级计算机),但成本降低了一半,同时能耗减少了40%。”

一直以来,业内流传的幻方囤着1万张英伟达芯片的说法,在梁文锋的论文中得到了证实。

而且按照梁文锋等作者的说法,萤火系统的性能更大超全球最顶尖的竞争对手英伟达。

请来多位“外援”

梁文锋参与撰写的另一篇文章,是关于深度求索专家混合(Mixture-of-Experts,MoE),这个架构可以提高模型的性能和计算效率,同时降低训练和推理时的计算成本。

打开网易新闻 查看更多图片

这篇论文主要谈及了设计专家混合架构过程中,DeepSeek的相关策略和实践。

(如上图)十分有趣的是:这篇论文的作者署名中,除了梁文锋的DeepSeek团队成员,还包括其他实验室相关人员,诸如北京大学一所国家重点实验室、清华大学跨学科信息科学实验室、南京大学某实验室。

上述作者中还包括罗福莉——被誉为“AI才女”——因在DeepSeek大模型项目中的贡献被小米创始人雷军以千万年薪招揽。

这篇论文的致谢部分中,还提及两位作者有国家重点研发计划的项目支持。

可见,梁文锋为了DeepSeek价值的体验,组建了一个“学术圈子”,并请来了多位“外援”为其助阵。

此时回望2008年幻方成立之初的时代,仿佛是上个时代的事情。

在当年,那批以“简单”算力和设备开启市场变革的小伙子们,最终走上了以技术影响社会的路程。

一家昔日迈过千亿大关的资管机构,如今已经慢慢褪去资管外衣,全面转型为人工智能公司,并参与着全球火药味甚浓的“AI战争”。

这样的变化,出乎了很多人的意料。