10 月 18 日 -19 日,由极客邦旗下 InfoQ 中国倾力打造的 QCon 全球软件开发大会 2024(上海站)圆满落幕。大会现场,共计超过 1600 人次参会,近 70 位来自英特尔、微软、eBay、阿里、百度、腾讯、携程、小红书、火山引擎、快手、华为、商汤、月之暗面、哔哩哔哩、Motiff 等企业资深专家进行了精彩分享,话题涉及 AI 应用开发、出海合规与大模型安全实践、Data for AI 、云原生工程实践、演进式架构、大模型基础设施与算力优化等不同热门话题方向。
开幕:洞察前沿趋势
大会开始,InfoQ 研究中心首席分析师姜昕蔚发布了《中国软件技术发展洞察和趋势预测研究报告 2025(先行版)》(以下简称报告)。
报告中回顾了 2024 年的技术市场,融资事件共 484 起,共融资 468.0 亿人民币,截至 2024 年 9 月 30 日,融资额已超越 2023 年全年。而人工智能领域吸纳资金能力一骑绝尘,人工智能领域在 2024 年 1-9 月期间,融资金额占据整体技术领域融资金额的 84.7%。
对于 2025 年,报告给出了十大技术趋势预测:
- 在应用层,生成式 AI 逐渐在应用中回归生成式定位,语音 Agent 带来陪伴新体验,端云协同加速终端智能体探索进程,端到端助力汽车自动驾驶迈进奇点时刻,人形机器人大脑升级近在咫尺,空间计算打造沉浸式虚拟现实体验。
- 模型层面,大小模型协同,加速大模型技术企业实践落地,开源模型赶超闭源,在相互竞争中继续推动大模型多元化演进,多模态模型转向端到端探索,视频模型有望再度突破、国产竞争力提升,3D 模型突破,模型越来越接近三维世界。
- 基础设施层,国产 AI 芯片加速在端侧的落地,合成数据生成将成为 AI 模型训练的关键工具,云算力价格持续走低、企业享受 AI 基础设施红利,多芯异构算力池成为提升 AI 算力利用效率的解决方案。
此外,报告还指出,未来 AI 伙伴将带来打工新体验和新要求,新的人才评价指标和机制也即将诞生。伴随新技术和新生态,开发者进一步向应用端流动,而 AI 开发工程师逐渐走下神坛,从尖端需求岗位走向普通岗位。
盛宴:AI Infra、搜推融合、
编程语言分享
北电数智首席科学家窦德景——智能时代的全栈 AI 基础设施创新探索与实践
北电数智首席科学家窦德景从事计算机行业已经近 30 年,1996 年清华大学电子工程本科毕业,2004 年获得耶鲁大学人工智能方向博士学位。
他回顾自己的学习和工作经历,表示通过图灵测试一直是 AI 学者多年以来追求的通用人工智能的目标,但目前为止,大多数 AI 学者们不认为 ChatGPT-4 已经通过了图灵测试,当然部分机构可能会认为已经通过了。
前段时间,诺贝尔物理学奖和化学奖都颁给了人工智能相关领域的科学家。窦德景表示,2017 年的时候,利用计算机视觉的方法帮忙拍出了人类历史上第一张黑洞照片,这已是 AI 对物理学的贡献。化学领域,人工智能则加速了蛋白质结构的预测过程,DeepMind 两位学者获得奖项也是实至名归。
数据、算法和算力是大模型带来的深度学习浪潮的三大要素。数据需求呈指数级增长,算力市场呈现缺乏定价能力、存在较大折旧空间等难题,大模型也正从多模态向 AGI 发展。算力、算法、数据皆需要适应新的需求和格局。
聚焦算力基础设施,窦德景指出国内芯片偏科严重,需要协同作战破局。目前预训练环节对芯片要求高,但国产芯片对不同数据类型处理能力不同,怎么把这些芯片放一起跑起来是最大的问题。在此之上,如何打破不同芯片集之间的生态壁垒成为解决方案的关键
为此,北电数智推出了“前进·AI 异构计算平台”和 AI 工具链“宝塔·模型适配平台”,“前进”向下纳管多元异构的国产算力,激活不同国产芯片的性能优势和适用场景;AI 工具链“宝塔·模型适配平台”向上广泛解耦和适配大模型,让大模型无痕运行在不同 AI 芯片上,支持企业内的专用应用。
此外,窦德景指出,大模型的发展未来尚未形成共识:Scaling law 是否可持续、端侧模型能否成为新方向、思维链是否能开启推理训练新范式等都是摆在行业面前的挑战。
小红书技术副总裁王晓博——搜推融合时代:UGC 社区信息分发技术升级与创新实践
对于当前 UGC 社区信息分发,小红书技术副总裁王晓博表示,搜索和推荐场景逐渐呈现出相互跳转、相互转换的场景。
在当前搜推融合趋势下,他以小红书的社区发展历程为例,分别介绍了搜索引擎和推荐系统的演化历程以及当前两者面临的主要挑战。其中,搜索面临了用户意图模糊、长尾查询召回准确性和多模态数据带来的问题。推荐则面临着如何平衡图文与视频的用户价值,如何兼顾用户体验、商业价值和新业务成长,双列形式带来的虹吸效应等挑战。搜推融合表现在下面几个方面:
- 产品形态:信息流(单列 or 双列)与搜索 SRP 页通过内容详情和连续消费容器打通,对话 BOT 是融合天然场景;
- 引擎架构:
- 表征学习与向量化让统一架构成为了可能;
- 召回模式:从检索召回走向生成式召回;
- 个性化:搜索与交互式推荐都在走向更强的个性化;
- 上下文:从单次请求走向 session 交互,有更多的上下文信息。
更进一步,架构融合也应运而生,像推荐系统已经越来越多地用到搜索的 query,用户在使用小红书时会有直观的感受:当你搜索过某个关键词后,信息流中就会实时出现与之相关的内容。
基于单模态的表征学习已被广泛且深入地研究,那多模态表征的困难体现在:如何结合来源不同的异质数据、如何处理不同模态的不同噪声等级以及表达中的信息损失问题等。小红书团队则结合天然笔记数据和用户行为的多层次多模态自监督学习,来实现对复杂多模态内容的综合语义表征。
大模型的快速发展在优化用户搜索路径、快速响应用户需求、理解笔记内容、理解用户、提升搜索召回能力等方面都又很大的发展潜力。此外,王晓博也指出,后训练和推理对能力作用持续显现、算力分布发生较大变化,可穿戴设备接近变革的前夜等。
华为编程语言首席专家冯新宇——仓颉:全场景智慧化应用编程语言的技术演进
围绕当前应用开发的多样性需求、特别是移动应用开发中面临的一系列挑战,以及新语言在大模型时代下的机遇和挑战,华为编程语言首席专家、南京大学教授冯新宇分享了仓颉编程语言的应对之道。
- 开发效率和性能平衡发展。
在开发效率方面,高阶函数、泛型、代数数据类型、类型扩展、并发等是现代编程语言算不可或缺的特性,仓颉作为一个多范式的编程语言,更加关注语言的表达力。另外,作为一个生态型语言,在“严谨性”和“易用性”难以兼得时,仓颉的某些特性选取会优先考虑“易用性”。
在性能方面,仓颉团队从语言设计、运行时、编译器前后端协同优化方面,都给与了充分的重视和考虑。以运行时为例,仓颉提供用户态的轻量级线程(M:N 线程模型),开销远小于系统线程,而仓颉全并发 GC 算法通过安全点和读屏障支持轻量 GC 同步、消减全局暂停 (STW),来实现更低时延。
- 用可扩展性应对多样性。
冯新宇教授引用了图灵奖得主 Hennessy 和 Patterson 关于“计算机架构创新的机会在于 DSA”的论断并做出类比,指出编程语言未来创新的机会在领域专用语言(DSL)。而仓颉作为一个通用语言,更加强调语言的可扩展性和嵌入式 DSL(eDSL)的构建能力,从而可以作为一个强大的能力底座和宿主语言,使能开发者在其上快速构建 eDSL 来满足来自各个领域的多样性需求。
为了提供一个强大的 eDSL 工具箱,仓颉语言提供了丰富的原生语法特性、libast 和宏、以及 effect handler 等一系列能力。仓颉语言的声明式 UI 开发能力,以及正在研发中的 AgentDSL,都受益于其 eDSL 的支持。
- 基于大模型的 Agent 编程和代码生成。
作为一款新兴编程语言,仓颉也在积极拥抱大模型能力,仓颉团队正在围绕两个方面积极打造智慧化应用开发能力。一方面,基于 eDSL 能力,仓颉希望提供内嵌式 AgentDSL 和大模型应用开发框架,支持自然语言和传统编程无缝融合的方式来开发 Agent 和智能原生应用,支持 Agent 与大模型之间的各种交互和多 Agent 协同。
另一方面,新兴语言的大模型代码生成通常面临着语料不足的问题,而且仓颉作为一个新语言也还没有相关预训练模型的支持。为此,团队通过跨语言代码转换、基于大模型的数据增强和数据清洗等技术来增强数据集,通过预训练和基于同质语言的迁移学习双管齐下来开展模型训练,并利用检索增强生成及可控解码来加强模型推理能力,逐步提升代码生成的接受率。