10月20日,北京智谱华章科技有限公司(简称:“智谱AI”)今日宣布,今年已累计获得超25亿人民币融资。

打开网易新闻 查看更多图片

参与方主要包括社保基金中关村自主创新基金(君联资本为基金管理人)、美团、蚂蚁、阿里、腾讯、小米、金山、顺为、Boss直聘、好未来、红杉、高瓴等多家机构及包括君联资本在内的部分老股东跟投。

智谱AI融资历程

智谱AI称,上述融资将用于基座大模型的进一步研发,更好地支撑行业生态,与合作伙伴一同高速发展。

此前7月,据36氪报道,智谱AI数月前已完成B-2轮融资,金额为数亿人民币,由美团战投独家投资,该轮投后估值为近5亿美金。对于以上融资信息,智谱官方暂未表态。

随后9月,智谱AI被传完成B4轮融资,投资方包括腾讯战投、阿里云战投等,投后估值约10亿美元。另有多方消息称,智谱AI的市场估值已在120-140亿元左右,是目前国内估值最快超过百亿人民币的创业公司之一。对此,智谱AI方面未给予置评。

“中国OpenAI”的5家企业之一

智谱AI成立于2019年6月,由清华大学计算机系知识工程实验室的技术成果转化而来,现任智谱AICEO张鹏此前是国内首个中英文平衡的跨语言知识图谱系统XLORE设计和研发者。此前,依托清华大学团队研发积累和人才优势,智谱AI参与研发落地大规模预训练模型悟道2.0。

同时,智谱AI公司持股13.06%的唐杰,是清华大学计算机系教授、ACM/IEEEFellow、清华大学人工智能研究院基础模型研究中心主任,主要研究领域包括人工智能、知识图谱等,发表论文300余篇。同时,唐杰还主持研发了千亿级开源双语预训练模型GLM-130B——目前是智谱AI研发的核心产品,全球已有70个国家1000多家机构申请使用。

而智谱AI公司董事长、法定代表人刘德兵,是中科院计算所博士,师从高文院士,清华数据科学研究院科技大数据研究中心副主任,清华大学(计算机系)一中国工程院中国工程科技知识中心“知识智能联合研究中心”(K&I)研究人员。

打开网易新闻 查看更多图片

智谱AI致力于打造新一代认知智能通用模型。2022年8月,智谱联合KEG(清华大学知识工程实验室)合作研发了双语千亿级超大规模预训练模型GLM-130B,推出了千亿基座的对话模型ChatGLM及开源单卡版模型ChatGLM-6B,并打造大模型产品矩阵,包括高效率代码模型CodeGeeX、高精度文图生成模型CogView、多模态对话语言模型VisualGLM-6B等。同年11月,斯坦福大学基础模型研究中心对全球30个主流大模型进行全方位评测。其中智谱AI的GLM-130B成为亚洲唯一入选的大模型。

今年3月,智谱开源了62亿参数的中英双语对话的轻量模型ChatGLM-6B,同时,基于GLM-130B基座的语言生成应用ChatGLM也同期推出,并开启了内测。5月,智谱AI与360宣布达成战略合作,双方共同研发千亿级大模型“360GLM”。8月底,作为8家首批通过备案的大模型公司之一,智谱AI推出了生成式AI助手智谱清言。

在硅谷科技媒体The Information2023年的盘点中,智谱AI被视为最有可能成为“中国OpenAI”的5家企业之一。

不过,CEO张鹏在接受采访时表示,智谱AI的目标并不是做“中国的OpenAI”。张鹏表示,要想在AI赛道上实现对美国的弯道超车,只跟着OpenAI的路子走,永远没有机会。“GLM”便是智谱AI认为的,实现弯道超车的必然路线。

此外,智谱AI始终认为AGI(通用人工智能)是发展的必然。为了更早推动AGI技术,智谱AI没有选择推出行业大模型,而是说服行业客户在通用大模型基座上做微调。

我国大模型落地应用进入关键期

IDC 预测,全球 AI 计算市场规模将从 2022 年的 195.0 亿美元增长到 2026 年的 346.6 亿美元。其中,生成式 AI 计算市场规模将从 2022 年的 8.2 亿美元增长到 2026 年的 109.9 亿美元。至于中国市场,IDC 预计中国人工智能市场规模在 2023 年将超过 147 亿美元,到 2026 年这一规模将超过 264 亿美元。

大语言模型被认为是通向 AGI 的里程碑。自 ChatGPT 引爆本轮人工智能浪潮,中国目前已经有超过120家机构或企业发布了自己的AI大模型,其中10亿参数规模以上的大模型就已经有79个,有20个是通用领域的大模型,基本来自互联网大厂和科研院所,其余均为垂直领域的产业应用大模型。毫无疑问,中国的AI产业正在进入一场名副其实的“百模大战”,而且已经有了逐渐开始向垂直领域深入分化的趋势。

今年以来,人工智能成为全球科技产业的热门领域,上百家公司、机构相继发布大语言模型相关产品,人工智能应用在大模型领域打开新局面。在这场全球参与的竞争中,我国紧跟趋势、走在前沿。国产大模型加速发展,短短半年时间,就走出实验室,面向大众接受考验。

9月1日,国家互联网信息办公室发布的《关于第二批深度合成服务算法备案的信息公告》显示,共有110款算法完成备案,产品涵盖虚拟人或3D数字人合成、影音图文合成及生成、智能客服、智能对话等领域。此前6月,国家互联网信息办公室发布了首批《境内深度合成服务算法备案清单》,包括百度、阿里巴巴、腾讯、抖音、美团、快手等公司的41款算法率先拿到“通行证”。

截至目前,我国累计有151款算法完成深度合成服务算法备案。随着越来越多的大模型产品陆续获批备案上线,我国生成式人工智能发展将从“拼大模型参数”阶段步入“拼原生应用、拼产业落地”阶段。

两批大模型算法备案信息汇总→

第一批

第二批

附:中国AI初创企业Top 5

打开网易新闻 查看更多图片

今年,科技媒体The Information盘点了中国AI初创企业Top 5,究竟谁会是中国的OpenAI?

MiniMax

融资信息:天使轮

成立日期:2021-11-03

所属地:上海市

所属企业:名之梦(上海)科技有限公司

由前商汤科技副总裁、通用智能技术负责人闫俊杰成立的AI公司,已经构建了文本到视觉、文本到语音、文本到文本三大模态的基础模型架构,也是在当前的AI大模型创业潮中估值最高的创业公司。

6月1日,据报道,MiniMax已完成了超2.5亿美元新一轮融资,目前公司估值超12亿美元。在本轮融资中,有腾讯有关联的实体参与,参投资金或为4000万美元。

此前,MiniMax已完成两轮融资,投资方包括米哈游、IDG资本、高瓴创投、云启资本、明势资本等。云启资本曾在4月份发文确认,该机构于2021年投资MiniMax,是天使轮中唯一的早期投资机构。

今年2月16日,MiniMax在北京举办的小型媒体沟通会上曾透露,团队人数已过百,公司核心技术研发成员均来自全球知名高校和全球顶尖科技公司,拥有世界顶尖自然语言处理、语音、计算机视觉、计算机图形学等工业界和学术界经验,1/3的团队成员拥有世界顶尖技术实验室的博士学位。

据介绍,MiniMax直接从底层的基础模型做起,自研了三个foundationmodel(基础模型)——文本到视觉(texttovisual)、文本到语音(texttoaudio),文本到文本(texttotext)。

Langboat澜舟科技

融资信息:Pre-A+轮

成立日期:2021-06-10

所属地:北京市

所属企业:北京澜舟科技有限公司

澜舟科技的创始人周明是在国内AI市场温度降到谷底的时刻决定创业的。

2020年底,周明考虑辞去微软亚洲研究院副院长的工作,很多朋友劝他别出来,但他很坚定地要开始大模型创业,认为“大模型未来会成为某种基础设施”

周明于2021年正式成立澜舟科技,并成为了李开复的创新工场从0孵化的AI企业。周明曾指出,澜舟科技致力于解决人类的语言理解和生成难题,提供基于NLP(自然语言理解)技术的开源大模型以及聚焦于营销、金融、文化创意等场景的功能引擎和应用。

主要产品是基于“孟子大模型”核心技术打造的一系列能力平台和垂直场景应用。已落地孟子大模型、AIGC(智能创作)平台、机器翻译平台、金融NLP平台等多款技术及产品,落地同花顺、华夏基金等企业。结合类ChatGPT技术,澜舟科技推出了对话机器人MChat,能够通过智能对话帮助用户完成特定场景中的多种工作任务。

今年3月,澜舟科技完成了Pre-A+轮融资。本轮融资由北京中关村科学城公司领投,斯道资本和创新工场跟投。不到一年时间内,澜舟科技融资总额达到了数亿元。

在3月14日由创新工场举办的“AI1.0到AI2.0的新机遇”趋势分享会上,澜舟科技正式发布了“类ChatGPT”的语言生成模型——孟子MChat可控大模型。

孟子MChat可控大模型强调了其本身“可控”的特色——模型能力相较于其他同类技术更为灵活,面向垂直领域、专业赛道落地会更加聚焦,可以根据行业、地域等需求做出快速调整。据周明介绍,孟子MChat可控大模型有以下几个特点:

将陆续推出10B和100B参数级的大模型;

具备聊天、问答、翻译、文本生成、信息抽取等多种能力;

可融合搜索结果、领域数据和知识图谱;

对功能、风格、人类认知等方面具可控性。

谈及对产业未来方向的展望,周明坦言,当下类ChatGPT技术在推理、逻辑、数学和算术、事实性错误等方面仍有所欠缺。未来,大模型相关的九大问题尤其值得关注,涉及推理能力、事实正确性、中文处理能力等方面。

智谱AI

融资信息:B轮

成立日期:2019-06-11

所属地:北京市

所属企业:北京智谱华章科技有限公司

智谱AI由清华大学计算机系唐杰教授创立,团队核心成员曾参与清华大学与智源研究院合作项目“悟道”的研发工作。2022年8月,清华大学知识工程实验室与智谱AI合作研发的超大规模预训练语言模型GLM-130B正式上线,是同年亚洲唯一入选斯坦福评测的全球主流大模型。

GLM在准确性等关键指标与OpenAI、谷歌大脑和Meta等公司的大模型对比中,仍旧表现非常出色,在MMLU、LAMBADA、BIG-bench-lite指标测试上超过了GPT-3、谷歌的PaLM和Meta的OPT大模型。

今年5月16日,三六零宣布与智谱AI达成战略合作,双方共同研发的千亿级大模型“360GLM”,双方将参考“微软+OpenAI”的合作模式,将大模型与应用场景结合。

三六零CEO周鸿祎认为,国内应当建立大型科技企业+重点科研机构的产研协同创新模式,打造中国的“微软+OpenAI”组合引领大模型技术攻关。他表示,此次与智谱AI合作,正是借鉴了这种产研协同关系。

对于此次合作,智谱AICEO张鹏表示,智谱AI一直坚持着自己的愿景,让机器像人一样思考,实现ModelasaService(MaaS)的理念。

目前,该模型的训练数据量为4000亿,中英文各占一半,拥有1300亿参数,训练成本在百万-千万人民币。截至到今年5月1日,该模型已经收到69个国家1000多个研究机构的下载使用申请。

在GLM-130B的基础上,智谱AI又进行了有监督的微调得到ChatGLM模型。ChatGLM模型是目前国内最先进的开源大模型,并已开放内测。

周鸿祎的微软梦能实现吗?智谱AI能成为中国的下一个OpenAI?

光年之外

融资信息:天使+

成立日期:2023年

所属地:北京市

2月,王慧文、出门问问创始人李志飞,以及真格基金两位合伙人戴雨森、刘元吃了顿饭。四人亲眼见到ChatGPT带来的变革,王慧文的态度是“必须参与”。

聊到兴起处,王慧文拿起手机,高调宣布了自己入局的态度:

自带5000万美元入局ChatGPT热潮,希望加入合适的公司。

两天后对外披露更多创业细节时,王慧文的想法显然已经从“求组队”变成了“我组局”。

这位光杆司令在宣布招募“顶级技术人才”的同时豪言表示,各位放心施展才华,杂事交给他来打理,更是不必为资金担心——

除了他个人按照2亿美元估值出资的5000万美元,“下轮融资已经有VC认购2.3亿美元”!

此后,王慧文陆续发文,招聘产品经理、算法工程师、实习生等。

进入3月,第二位投资光年之外的“大佬”出现了——王慧文的老友,美团创始人王兴。

这位美团大佬加入队伍的方式是“出钱”,参与A轮投资,并出任光年之外的董事。王兴与王慧文是清华大学的同学兼室友,曾数度合作创业,一起打造了校内网、美团等多个大众熟悉的品牌。

再次并肩作战,王兴在票圈简单解释了背后的缘由:AI大模型让我既兴奋于即将创造出来的巨大生产力,又忧虑它未来对整个世界的冲击。老王和在创业路上同行近二十年,既然他决心拥抱这次大浪潮,那我必须支持。

4月6日,光年之外的运营正式开始,王慧文在朋友圈更新了动态。

美团“双王”的招牌,也让“光年之外”在风投市场上吸纳资金变得更容易。毕竟,风投机构们应该也想抓住“再造美团”的机会。

王兴、王慧文带着美团,挺过了千团大战、百团大战,但历时九年才首次实现全年盈利。这一次,他们还能挺到ChatGPT版“美团”诞生吗?

月之暗面(Moonshot AI)

融资信息:天使轮

成立日期:2023年

所属地:北京市

成立仅2个月,这家公司的天使轮便获得近20亿元投资,投资机构包括了最头部的几家VC,如红杉资本、今日资本、砺思资本等。成立仅6个月,这家公司就推出了全球首个支持输入20万汉字的智能助手产品——Kimi Chat,宣布开启人工智能“长文本时代”。

这家公司就是Moonshot AI,创始人杨植麟曾在Google和MetaPlatforms的人工智能实验室工作。在创立Moonshot AI前,杨植麟还与他人共同创立了循环智能(Recurrent AI),红杉中国也对该公司进行了投资。

10 月 9 日,成立仅半年的大模型初创公司 —— Moonshot AI 宣布在「长文本」领域实现了突破,推出了首个支持输入 20 万汉字的智能助手产品 Kimi Chat。这是目前全球市场上能够产品化使用的大模型服务中所能支持的最长上下文输入长度,标志着 Moonshot AI 在这一重要技术上取得了世界领先水平。

从技术上看,参数量决定了大模型支持多复杂的「计算」,而能够接收多少文本输入(即长文本技术)则决定了大模型有多大的「内存」,两者共同决定模型的应用效果。

支持更长的上下文意味着大模型拥有更大的「内存」,从而使得大模型的应用更加深入和广泛:比如通过多篇财报进行市场分析、处理超长的法务合同、快速梳理多篇文章或多个网页的关键信息、基于长篇小说设定进行角色扮演等等,都可以在超长文本技术的加持下,成为我们工作和生活的一部分。

相比当前市面上以英文为基础训练的大模型服务,Kimi Chat 具备较强的多语言能力。例如,Kimi Chat 在中文上具备显著优势,实际使用效果能够支持约 20 万汉字的上下文,2.5 倍于 Anthropic 公司的 Claude-100k(实测约 8 万字),8 倍于 OpenAI 公司的 GPT-4-32k(实测约 2.5 万字)。

责任编辑:张薇