打开网易新闻 查看更多图片

如果把量化投资里最难的一件事挑出来,很多人都会指向同一个词:Alpha。

说白了,就是那些能提前告诉你"这只股票后面大概率怎么走"的有效信号。

问题也恰恰出在这里。市场噪声太大,数据维度太高,真正有用的信号又少得可怜。人手搓因子,慢;遗传编程容易在局部打转,产出一堆长得差不多、经济意义也不强的东西;深度学习虽然猛,但很多时候你知道它有效,却说不清它为什么有效,换个市场、换个周期,就不一定稳了。

现在,一篇来自香港大学和 Grace Investment Machine(GIM)的工作想把这件事换个做法。

他们做了一个叫 CogAlpha 的框架,入选 ACL 2026 推荐 Oral。

一句话概括:不再让大模型只当"写公式的助手",而是把它当成会分工、会反思、会迭代、还会自己改代码的研究员团队,去自动挖掘 Alpha。

在来自中美港三个市场的 5 个数据集上,这套方法稳定跑赢了 21 个基线方法。主实验 CSI300、10 天预测任务上,年化超额收益达到 16.39%,信息比率1.8999

这事有点意思了。

打开网易新闻 查看更多图片

  • 论文标题:
  • Cognitive Alpha Mining via LLM-Driven Code-Based Evolution
  • 论文作者:
  • Fengyuan Liu, Yi Huang, Sichun Luo, Yuqi Wang, Yazheng Yang, Xinye Li, Zefa Hu, Junlan Feng, Qi Liu, Grace Investment Machine
  • 论文链接:
  • https://arxiv.org/abs/2511.18850

这篇论文到底做了什么?

CogAlpha 的第一个关键变化,是把 Alpha 从"公式"升级成了"代码"。

这不是小改动。用公式表达因子,表达能力受限。一旦换成 Python 代码,因子的搜索空间会一下被打开——大模型不再只是吐一个数学表达式,而是能写出带注释、带逻辑、能执行、能检查的候选因子程序。

然后,作者又在这个基础上,给大模型搭了一个"研究组织架构"。

整个系统里最抓眼球的部分,是一个7 层、21 个智能体的探索体系。这 7 层不是随便分的,而是按量化研究的思考方式,从宏观到微观一路拆下去:

  • 第 1 层看市场结构与周期,比如长期趋势和阶段切换;
  • 第 2 层盯极端风险和脆弱性,比如尾部风险和崩盘前兆;
  • 第 3 层研究价量关系,流动性、买卖失衡;
  • 第 4 层看趋势延续、短期反转、波动聚集;
  • 第 5 层处理多尺度复杂性,比如回撤结构和分形粗糙度;
  • 第 6 层做稳定性和状态门控,让信号按不同市场状态决定要不要激活;
  • 第 7 层负责几何特征和融合,K 线形态、多因子合成、非线性改写。

打开网易新闻 查看更多图片

你可以把它理解成:不是让一个大模型闷头想因子,而是让一整个分工明确的研究团队,同时从不同角度去挖。

它不是生成一次就完了,而是会"进化"

这篇论文最像人类研究流程的地方,不在生成,而在后面那套迭代机制。

CogAlpha 走了一条很像研究员反复打磨的路径:先生成一批候选 Alpha,再检查代码能不能跑、逻辑有没有问题,然后用 IC、RankIC、ICIR、RankICIR 和互信息 MI 五个指标做筛选,接着把好的候选拿去做变异、交叉和进化,最后不断迭代,把差的淘汰,把更有潜力的留下来。

筛选分两档:超过同代 65 分位的算合格因子,超过 80 分位的算精英,后者进入下一轮演化。

为了防止系统越来越保守、最后只会围着几个套路打转,作者还设计了多样化提示策略:轻度改写保证稳定,中度改写引入自然变体,创造性改写则鼓励模型从不同研究角度重新理解同一个方向。

这个设计很关键。Alpha 挖掘最怕的,不是找不到一个好因子,而是老在同一类因子里绕圈。

结果有多强?消融实验说得很清楚

论文最硬的一组结果,来自 CSI300 成分股、10 天预测任务。

在这里,CogAlpha 相比 21 个基线方法拿到了最好的整体表现。

打开网易新闻 查看更多图片

换句话说,CogAlpha 在这项核心实验里,年化超额收益大约翻倍,IR 也明显拉开。

值得一提的是,论文里有个不符合直觉的发现:闭源模型并没有天然更强,推理型模型表现甚至偏弱。Alpha 挖掘不是单纯比"谁更聪明",而是比谁的结构更适合探索、筛选和演化。真正拉开差距的,是这套认知式工作流本身,而不是底层模型的能力上限。

可解释性,量化圈真正在意的

量化圈一个老问题是:很多因子能跑,但解释不清。

CogAlpha 生成的每个 Alpha 不只是一个数字结果,而是附带详细注释、完整代码实现,解释这个因子的逻辑和想法。论文展示的一个例子,是用"价格上行幅度除以成交量"衡量流动性冲击——如果股票价格冲得快但成交量并不大,意味着流动性很薄、价格冲击更大,短期收益也许更值得关注。

不复杂,但讲得通。

对机构来说,这点很重要。真正能进研究流程、进交易流程的,不只是高分因子,而是能被理解、能被复核、能被追责的因子。

打开网易新闻 查看更多图片

这篇 ACL,真正有价值的地方是什么?

如果只把它理解成"又一篇用大模型做量化的论文",有点低估它了。

这篇工作更大的价值,可能在于它给出了一种新范式:让大模型不只是生成内容,而是参与研究流程本身;不只是给答案,而是组织探索、筛选、反思和进化。

放在量化里,这叫自动化 Alpha 发现。再往外看,更像一种 Agentic Research 的落地案例——把研究任务拆成层级化认知单元,给每个单元设定职责,再让系统通过反馈做持续演化。

如果这套方法能在 Alpha 挖掘里成立,那别的高噪声、低信号、需要创造性探索的研究任务,是不是也可以这么干?材料发现、策略生成、实验设计、复杂工业优化,这个问题值得继续看。

当然,作者自己也写得比较克制:回测全在 Qlib 框架里完成,和真实交易环境还有距离;LLM 输出有随机性,数据规模越大执行时间越长。CogAlpha 现在更像一个很强的研究引擎,而不是能无脑接到交易端的即插即用系统。

但这不妨碍它的重要性。很多真正改变行业的东西,第一步都不是立刻商用,而是先证明一件此前没人证明清楚的事:

原来这条路,真的走得通。

量化投资过去几十年,一直在和同一个问题缠斗:怎么在充满噪声的市场里,持续找到新信号。现在,大模型以另一种身份加入了这场游戏——不是聊天机器人,也不是写摘要的工具,而是一个会分工、会写代码、会自查、会进化的研究系统。

CogAlpha 让人第一次比较具体地看到:AI 也许真的可以参与"发现"本身,而不只是参与"表达"与"执行"。

About GIM

在 GIM(Grace Investment Machine)我们相信,AI技术正处在在重塑资本市场的关键节点。因此,我们致力于融合最前沿的AI与大模型技术,打造新一代智能投资范式——不仅是量化方法的升级,更是投资决策逻辑的重构。

我们希望通过智能分析师与交易系统,将金融市场洞察与执行效率提升至全新量级。 我们核心团队来自全球顶尖对冲基金、DeepMind、Meta、Anthropic 等前沿AI实验室,以及牛津、清华、北大、港大等知名高校。