本周（4.15-4.21）AI界发生了什么？

文｜赵炜嘉

编辑｜邓咏仪

大佬言论李彦宏：开源模型将会越来越落后

4月16日，百度创始人、董事长兼首席执行官李彦宏在Create 2024百度AI开发者大会上表示，未来，自然语言将成为新的通用编程语言，每个人都可以成为一名开发者，用自己的创造力改变世界。李彦宏还指出，“大家以前用开源觉得开源便宜，其实在大模型场景下，开源是最贵的。所以，开源模型会越来越落后。”

扎克伯格：80亿的Llama 3还不够小，大模型需要提升训练质量

4月18日，Llama 3正式发布后，扎克伯格在知名主持人Dwarkesh Patel的播客中，谈及Meta AI的技术路线、未来规划和开源哲学。扎克伯格表示：Llama 3最小版本的80亿参数模型“还不够小”，无法满足大量使用场景。他更倾向于将模型蒸馏到5亿、10亿级别，看看能用来做什么。

李飞飞报告：中国大模型世界第二，但专利数、机器人全球第一

4月15日，由华裔女科学家、“人工智能教母”李飞飞联合领导的HAI研究所（Stanford HAI）近日发布了《2024 年人工智能指数报告》。报告中指出，2023 年，61 个著名的人工智能模型源自美国的机构，超过欧盟的 21 个和中国的 15 个。然而，中国依然是美国最大的竞争对手，中国的机器人安装量居世界首位；同样，世界上大多数人工智能专利（61%）都来自中国。

△图源：HAI

另外，4月18日，李飞飞在拜登的国情咨文演讲中呼吁，希望拜登政府出资建设一个国家计算能力和数据集仓库。她指出，当前AI学术界明星人才正大量流失，大公司正在以高薪挖掘学术界人才资源。而研究大模型的高昂成本正在将研究人员排除在该领域之外，从而损害了学术界的独立研究。

大事件Meta 开源新一代模型 Llama 3

当地时间4月18日，Meta 公司宣布最新开源推出新一代大型语言模型Llama 3，包含 8B 和 70B 两种参数规模。Llama 3在由24000块GPU组成的定制集群上，使用15万亿个token训练的，上下文长度实现8K，推理编码大幅提升，代码和权重全开源。Llama 3现可在网页版Meta AI免登录使用。

Stable Diffusion 3 API发布

4月17日，Stability AI正式发布Stable Diffusion 3 API，新的SD3在文字位置、提示词的遵循程度上大幅提升，超过DALL-E 3和Midjourney v6等行业领先模型。目前SD3技术还未完全开源，但Stability AI承诺，对于普通用户，SD3模型不会收费。

Reka Core登场，比肩GPT-4、Claude 3

4月16日，由前DeepMind、Google Brain和FAIR成员组成的AI初创公司Reka推出与GPT-4匹敌的多模态大模型Reka Core，具备理解图像、音频和视频的能力，支持32种语言，性能可与GPT-4和Claude 3 Opus匹敌。不过，Reka没有计划开源此模型。

AI界前线OpenAI在东京开设亚洲首个办事处

4月15日，OpenAI宣布在日本东京设立亚洲首个办事处，承诺与政府、当地企业及研究机构合作，开发安全的AI工具满足本地需求。同时，OpenAI还宣布推出一款专为日本语言优化的GPT-4定制模型，其在翻译和总结日语文本方面表现出色，性能和速度都有显著提升，成本效率更高，速度提升至原来的三倍。

波士顿动力推出电动版Atlas机器人

当地时间4月17日，在宣布原液压版Atlas人形机器人退役的一天后，波士顿动力推出全电动版本的 Atlas机器人。电动Atlas动作的自由度和灵活性远超人类。它继承了液压版的三指设计，采用比其前身更加流线型的设计，有着更灵活的机械骨架，具有类似环形灯的头部，没有任何电缆外露。

△图源：波士顿动力

英特尔推出全球最大神经拟态系统，比人脑快200倍

当地时间4月17日，美国芯片巨头英特尔（Intel）公司宣布，其已经建立了世界上最大的神经拟态系统Hala Point，拥有11.5 亿个神经元和1280亿个突触，速度最高可达人脑的200倍。该系统系统最初部署在桑迪亚国家实验室，采用英特尔Loihi 2处理器，旨在支持未来类脑AI的研究。

文心一言4.0工具版上新，还发了三大AI开发工具

4 月 16 日，在2024百度Create AI开发者大会上，百度正式宣布基础模型全面更新，并推出文心一言4.0工具版，包括智能体开发工具 AgentBuilder、AI 原生应用开发工具 AppBuilder和模型定制工具ModelBuilder，以对应不同的开发场景。

贾佳亚团队Mini-Gemini全开源

香港中文大学终身教授贾佳亚团队提出多模态模型Mini-Gemini，提供从2B到34B的模型大小范围，融合ChatGPT+DALL·E 3，具备更高清图像的精确理解、更高质量的训练数据、更强的图像解析推理能力，还能结合图像推理和生成。目前，Mini-Gemini从代码、模型到数据已全部开源，线上Demo也已发布。

联想官宣5款AI PC

4月18日，联想TechWorld 2024在上海开幕。联想发布了内嵌个性化AI智能体“联想小天”的AI PC系列产品。用户可基于自然语言与“小天”交互，“小天”在交互中也能不断完善。官方演示中，“小天”具备可实现通过自然语言找到照片、AI跨端生图等本地化AI能力。

融资动态芯片初创公司 Rivos 融资 2.5 亿美元

4月17日消息，RISC-V芯片初创公司Rivos宣布在 A-3 轮融资中筹集了超过 2.5 亿美元，该笔资金将专项用于研发其首款针对生成式AI()和数据分析工作负载的加速器产品。Matrix Capital为本轮最大投资者管理层，英特尔资本、联发科（MTK）、Cambium Capital、CIDC、Capital TEN以及Hotung Venture Group等投资机构也积极参与了此次融资。

微软将向阿联酋AI公司G42投资15亿美元

4月16日，微软表示将向总部位于阿联酋的人工智能公司G42投资15亿美元，让这家美国科技巨头获得G42的少数股权和董事会席位。G42将在微软的云计算平台Azure上运行，为全球公共部门客户和大型企业提供先进的人工智能解决方案。

新玩意Rewind宣布更名Limitless，推出可穿戴AI挂坠

4月17日，Rewind更名为Limitless，推出用于会议场景的可穿戴 AI 挂坠，具备提供实时笔记、会议转录和会议摘要等功能，预计将在8月发售，售价99美元。Limitless为用户配备“同意模式”，以确保隐私保护和加密云服务确保数据私密性，用户可控制数据解密。

△图源：Limitless

前沿研究Meta实现无限上下文长度的新算法

Meta联合南加州大学、CMU、UCSD的研究人员近期发布了论文，提出一种名为Megalodon的算法。这是一种新型神经网络架构，能够高效处理具有无限上下文长度的文本。Megalodon引入了多项创新组件，显著提高了模型的能力、稳定性，以及训练的性价比，并在多个基准测试中表现出优于Llama2的性能。

微软推出单图生数字人技术VASA-1

4月18日，微软发布VASA-1技术，能通过单张图片和音频生成逼真的数字人视频。VASA-1利用面部动态统一编码和Diffusion Transformer技术，实现精准的唇语同步和自然的表情动作，并支持实时生成。

△图源：微软

欢迎交流

本周（4.15-4.21）AI界发生了什么？

全世界机器人共用一个大脑，谷歌DeepMind已经完成了第一步

全新神经网络架构KAN一夜爆火！200参数顶30万，MIT华人一作

伯克利开源大型机器人操控基准，面对复杂自主操控任务不再犯难

“离谱的AI扩图”火了！张张那叫一个出其不意

国产人形机器人征服复杂场景: 实时感知规划，动态运动告别盲走

新一代注意力机制Lightning Attention-2：无限序列长度

2024投什么？先来看看人形机器人吧｜钛媒体创投家

「还是谷歌好」，离职创业一年，我才发现训练大模型有这么多坑

马斯克：当代互联网鲁迅

Deepfake假CFO骗走公司1.8个亿，员工：视频会议每个人都很真实啊

论文 Figure 不堪入目，句子啰嗦读不通……这几个在线科研工具可以免费用了

扎克伯格夫妇被指迎来中年叛逆期

PyTorch团队重写「分割一切」模型，比原始实现快8倍

一次预测多个token，Meta新模型推理加速3倍，编程任务提高17%

巨头雄霸天下，微软、谷歌、Meta、亚马逊能一直无敌吗？

Xbox 掌上游戏机更多消息被披露

魔兽世界：国服最新进展，账号和下载域名更新，玩家打开国服战网

河南大学就大礼堂火情致歉：无比痛心、自责

Xbox掌机要来了？微软发邮件调查用户掌机使用情况

微软发布 Xbox预览版更新：可存储最多 10 个 Wi-Fi 网络连接信息

本周（4.15-4.21）AI界发生了什么？

全世界机器人共用一个大脑，谷歌DeepMind已经完成了第一步

全新神经网络架构KAN一夜爆火！200参数顶30万，MIT华人一作

伯克利开源大型机器人操控基准，面对复杂自主操控任务不再犯难

“离谱的AI扩图”火了！张张那叫一个出其不意

国产人形机器人征服复杂场景: 实时感知规划，动态运动告别盲走

​新一代注意力机制Lightning Attention-2：无限序列长度

2024投什么？先来看看人形机器人吧｜钛媒体创投家

「还是谷歌好」，离职创业一年，我才发现训练大模型有这么多坑

马斯克：当代互联网鲁迅

Deepfake假CFO骗走公司1.8个亿，员工：视频会议每个人都很真实啊

论文 Figure 不堪入目，句子啰嗦读不通……这几个在线科研工具可以免费用了

扎克伯格夫妇被指迎来中年叛逆期

PyTorch团队重写「分割一切」模型，比原始实现快8倍

一次预测多个token，Meta新模型推理加速3倍，编程任务提高17%

巨头雄霸天下，微软、谷歌、Meta、亚马逊能一直无敌吗？

Xbox 掌上游戏机更多消息被披露

魔兽世界：国服最新进展，账号和下载域名更新，玩家打开国服战网

河南大学就大礼堂火情致歉：无比痛心、自责

Xbox掌机要来了？微软发邮件调查用户掌机使用情况

微软发布 Xbox预览版更新：可存储最多 10 个 Wi-Fi 网络连接信息

新一代注意力机制Lightning Attention-2：无限序列长度