GIM和港大这篇ACL主会，把量化因子挖掘重做了一遍

如果把量化投资里最难的一件事挑出来，很多人都会指向同一个词：Alpha。

说白了，就是那些能提前告诉你"这只股票后面大概率怎么走"的有效信号。

问题也恰恰出在这里。市场噪声太大，数据维度太高，真正有用的信号又少得可怜。人手搓因子，慢；遗传编程容易在局部打转，产出一堆长得差不多、经济意义也不强的东西；深度学习虽然猛，但很多时候你知道它有效，却说不清它为什么有效，换个市场、换个周期，就不一定稳了。

现在，一篇来自香港大学和 Grace Investment Machine（GIM）的工作想把这件事换个做法。

他们做了一个叫 CogAlpha 的框架，入选 ACL 2026 推荐 Oral。

一句话概括：不再让大模型只当"写公式的助手"，而是把它当成会分工、会反思、会迭代、还会自己改代码的研究员团队，去自动挖掘 Alpha。

在来自中美港三个市场的 5 个数据集上，这套方法稳定跑赢了 21 个基线方法。主实验 CSI300、10 天预测任务上，年化超额收益达到 16.39%，信息比率1.8999。

这事有点意思了。

论文标题：
Cognitive Alpha Mining via LLM-Driven Code-Based Evolution
论文作者：
Fengyuan Liu, Yi Huang, Sichun Luo, Yuqi Wang, Yazheng Yang, Xinye Li, Zefa Hu, Junlan Feng, Qi Liu, Grace Investment Machine
论文链接：
https://arxiv.org/abs/2511.18850

这篇论文到底做了什么？

CogAlpha 的第一个关键变化，是把 Alpha 从"公式"升级成了"代码"。

这不是小改动。用公式表达因子，表达能力受限。一旦换成 Python 代码，因子的搜索空间会一下被打开——大模型不再只是吐一个数学表达式，而是能写出带注释、带逻辑、能执行、能检查的候选因子程序。

然后，作者又在这个基础上，给大模型搭了一个"研究组织架构"。

整个系统里最抓眼球的部分，是一个7 层、21 个智能体的探索体系。这 7 层不是随便分的，而是按量化研究的思考方式，从宏观到微观一路拆下去：

第 1 层看市场结构与周期，比如长期趋势和阶段切换；
第 2 层盯极端风险和脆弱性，比如尾部风险和崩盘前兆；
第 3 层研究价量关系，流动性、买卖失衡；
第 4 层看趋势延续、短期反转、波动聚集；
第 5 层处理多尺度复杂性，比如回撤结构和分形粗糙度；
第 6 层做稳定性和状态门控，让信号按不同市场状态决定要不要激活；
第 7 层负责几何特征和融合，K 线形态、多因子合成、非线性改写。

你可以把它理解成：不是让一个大模型闷头想因子，而是让一整个分工明确的研究团队，同时从不同角度去挖。

它不是生成一次就完了，而是会"进化"

这篇论文最像人类研究流程的地方，不在生成，而在后面那套迭代机制。

CogAlpha 走了一条很像研究员反复打磨的路径：先生成一批候选 Alpha，再检查代码能不能跑、逻辑有没有问题，然后用 IC、RankIC、ICIR、RankICIR 和互信息 MI 五个指标做筛选，接着把好的候选拿去做变异、交叉和进化，最后不断迭代，把差的淘汰，把更有潜力的留下来。

筛选分两档：超过同代 65 分位的算合格因子，超过 80 分位的算精英，后者进入下一轮演化。

为了防止系统越来越保守、最后只会围着几个套路打转，作者还设计了多样化提示策略：轻度改写保证稳定，中度改写引入自然变体，创造性改写则鼓励模型从不同研究角度重新理解同一个方向。

这个设计很关键。Alpha 挖掘最怕的，不是找不到一个好因子，而是老在同一类因子里绕圈。

结果有多强？消融实验说得很清楚

论文最硬的一组结果，来自 CSI300 成分股、10 天预测任务。

在这里，CogAlpha 相比 21 个基线方法拿到了最好的整体表现。

换句话说，CogAlpha 在这项核心实验里，年化超额收益大约翻倍，IR 也明显拉开。

值得一提的是，论文里有个不符合直觉的发现：闭源模型并没有天然更强，推理型模型表现甚至偏弱。Alpha 挖掘不是单纯比"谁更聪明"，而是比谁的结构更适合探索、筛选和演化。真正拉开差距的，是这套认知式工作流本身，而不是底层模型的能力上限。

可解释性，量化圈真正在意的

量化圈一个老问题是：很多因子能跑，但解释不清。

CogAlpha 生成的每个 Alpha 不只是一个数字结果，而是附带详细注释、完整代码实现，解释这个因子的逻辑和想法。论文展示的一个例子，是用"价格上行幅度除以成交量"衡量流动性冲击——如果股票价格冲得快但成交量并不大，意味着流动性很薄、价格冲击更大，短期收益也许更值得关注。

不复杂，但讲得通。

对机构来说，这点很重要。真正能进研究流程、进交易流程的，不只是高分因子，而是能被理解、能被复核、能被追责的因子。

这篇 ACL，真正有价值的地方是什么？

如果只把它理解成"又一篇用大模型做量化的论文"，有点低估它了。

这篇工作更大的价值，可能在于它给出了一种新范式：让大模型不只是生成内容，而是参与研究流程本身；不只是给答案，而是组织探索、筛选、反思和进化。

放在量化里，这叫自动化 Alpha 发现。再往外看，更像一种 Agentic Research 的落地案例——把研究任务拆成层级化认知单元，给每个单元设定职责，再让系统通过反馈做持续演化。

如果这套方法能在 Alpha 挖掘里成立，那别的高噪声、低信号、需要创造性探索的研究任务，是不是也可以这么干？材料发现、策略生成、实验设计、复杂工业优化，这个问题值得继续看。

当然，作者自己也写得比较克制：回测全在 Qlib 框架里完成，和真实交易环境还有距离；LLM 输出有随机性，数据规模越大执行时间越长。CogAlpha 现在更像一个很强的研究引擎，而不是能无脑接到交易端的即插即用系统。

但这不妨碍它的重要性。很多真正改变行业的东西，第一步都不是立刻商用，而是先证明一件此前没人证明清楚的事：

原来这条路，真的走得通。

量化投资过去几十年，一直在和同一个问题缠斗：怎么在充满噪声的市场里，持续找到新信号。现在，大模型以另一种身份加入了这场游戏——不是聊天机器人，也不是写摘要的工具，而是一个会分工、会写代码、会自查、会进化的研究系统。

CogAlpha 让人第一次比较具体地看到：AI 也许真的可以参与"发现"本身，而不只是参与"表达"与"执行"。

About GIM

在 GIM（Grace Investment Machine）我们相信，AI技术正处在在重塑资本市场的关键节点。因此，我们致力于融合最前沿的AI与大模型技术，打造新一代智能投资范式——不仅是量化方法的升级，更是投资决策逻辑的重构。

我们希望通过智能分析师与交易系统，将金融市场洞察与执行效率提升至全新量级。我们核心团队来自全球顶尖对冲基金、DeepMind、Meta、Anthropic 等前沿AI实验室，以及牛津、清华、北大、港大等知名高校。

GIM和港大这篇ACL主会，把量化因子挖掘重做了一遍

世界模型让智能体预知未来？这篇新范式研究给了一个反直觉的答案

横扫室内3D场景，港科大（广州）打造单目开放词汇占据预测新SOTA

CMU等团队：PAT3D把文生3D从能看推进到能模拟、能交互

女性的这几个信号你都知道吗

百慕大三角

男人的主动全靠女人给信号，准到吓人，别再傻傻被爽约了！

看懂身体这10个信号，关键时刻能救命，每一条都重要！

中山大学发布通告，回应国家杰青康某论文被实名举报问题

领导执迷不悟对实验走火入魔，结果毁了一座城

RouteMoA：无需预推理的动态路由，实现高效多智能体混合

吴宜泽斯诺克世锦赛夺冠成首位00后斯诺克世锦赛冠军

导师最希望的就是自己的学生“有出息”

中山大学通报“附属医院康某某相关学术论文图片及数据存疑”：启动调查

中国传媒大学全网通用论文降重技巧！AIGC 智能降重实操教学

梵蒂冈走廊里的"完美女友"实验

大学生论文的AIGC检测真的既荒谬又贵！！！

毕业论文答辩六大高频问题及回复模版！

中山大学通报“附属医院康某某相关学术论文图片及数据存疑”：已正式启动调查程序

港校申请机构大盘点：正规香港留学中介甄别小技巧

围棋实战解析：柒柒黑先困境，实用策略揭秘

GIM和港大这篇ACL主会，把量化因子挖掘重做了一遍

世界模型让智能体预知未来？这篇新范式研究给了一个反直觉的答案

横扫室内3D场景，港科大（广州）打造单目开放词汇占据预测新SOTA

CMU等团队：PAT3D把文生3D从能看推进到能模拟、能交互

女性的这几个信号你都知道吗

百慕大三角

男人的主动全靠女人给信号，准到吓人，别再傻傻被爽约了！

看懂身体这10个信号，关键时刻能救命，每一条都重要！

中山大学发布通告，回应国家杰青康某论文被实名举报问题

领导执迷不悟对实验走火入魔，结果毁了一座城

RouteMoA：无需预推理的动态路由，实现高效多智能体混合

吴宜泽斯诺克世锦赛夺冠 成首位00后斯诺克世锦赛冠军

导师最希望的就是自己的学生“有出息”

中山大学通报“附属医院康某某相关学术论文图片及数据存疑”：启动调查

中国传媒大学全网通用论文降重技巧！AIGC 智能降重实操教学

梵蒂冈走廊里的"完美女友"实验

大学生论文的AIGC检测真的既荒谬又贵！！！

毕业论文答辩六大高频问题及回复模版！

中山大学通报“附属医院康某某相关学术论文图片及数据存疑”：已正式启动调查程序

港校申请机构大盘点：正规香港留学中介甄别小技巧

围棋实战解析：柒柒黑先困境，实用策略揭秘

吴宜泽斯诺克世锦赛夺冠成首位00后斯诺克世锦赛冠军