元创说

GPT以石破天惊的速度出圈:

  • ChatGPT月活用户已过10亿(VS 微信13亿、QQ 6亿);

  • 微软旗下搜索引擎Bing在集成GPT底层模型后,下载量飙升10倍;

  • AI芯片算力供应商英伟达的市值突破万亿;

  • GPT用1万亿个连接记住了人类所有的知识和文明(VS人脑100万亿连接),学习方法碾压人类;

  • 多模态大模型GPT-4已展现出通用人工智能(AGI)的特征……

以GPT为代表的AIGC(生成式人工智能)一度成为创投圈最耀眼的明星。自2012年AlexNet深度学习技术的突破促使AI跃入投资人眼帘,到2016年AlphaGo战胜围棋圣手李世石,再到2022年ChatGPT引发AI2.0浪潮……

我们认为,当下人工智能技术,相较AI 1.0而言,具备较强的泛化能力,底座模型可几乎零门槛地被下游应用层调用,具备敏锐嗅觉的超强创业者或将做出杀手级应用(类似互联网时代的抖音、微信等国民级应用)。

01

基建-模型-应用,哪个层面机遇更大?

AI无疑是个新物种、而非工具,是一场生产力的革命、而非生产关系。可类比1950年计算机的诞生(计算时代),远超移动互联网的意义(连接时代)。AI is much bigger than the Internet。

AI生态链可分为三层:基建层(云计算、芯片)、算法(模型)、应用层(AI+)。

1、基建层,主要由云计算、芯片硬件构成,云计算市场集中度较高(亚马逊占据47%份额、微软14%、阿里云7%),芯片厂商目前主要是英伟达(市值过万亿)、AMD(跑步进场)等,由于门槛极高,故新进入者入局机会较为渺茫。

2、模型层,可通过调用API或开源的形式赋能应用层,构建在模型层的应用可用数据反哺模型层,优化模型质量和性能,形成飞轮。类似移动互联网时代的苹果IOS和安卓系统,模型公司可分为闭源和开源两类:

  • 闭源大模型,盈利方式有两种:一是开放API根据token数量收费;二是基于自身大模型开发消费级应用;但劣势在于不得不自己承受天价开发和训练成本,这类玩家的代表有:Chat-GPT&DALL-E的母公司Open AI、LaMDA母公司google、text to image模型Stable Diffusion。

  • 开源大模型,其优势在于可通过调动外部资源来优化模型,但如何盈利变现一直都是悬在头上的达摩克利斯之剑。这类玩家的代表有:hugging face(类似互联网时代的github)。

通用模型层门槛也很高,据马斯克访谈透露起步2.5亿美金,一般只有Open AI这类明星初创公司才有入场券。目前ChatGPT每服务一次用户所花费的成本是传统搜索的接近10倍。

现在进场的模型层公司,很多做的是垂直大模型,即针对特定领域或任务进行优化设计的模型,例如语音识别、自然语言处理、图像分类等。玩家举例:学而思的数学大模型。这类公司虽然算力、算法上比不上通用大模型,但壁垒在于高质量数据(数据的独特性比数据量更重要),有望在专业领域(比如自动驾驶、工业制造等)大放异彩。

3、应用层,一类是传统行业接入大模型后的升级(80%的存量市场);另一类是AI原生应用(20%的增量市场),类似十年前移动互联网催生的双创热潮,AI应用层无疑是未来十年创业者最大的机遇。

打开网易新闻 查看更多图片

02

模型层 诸神之战

大模型,又称为基础模型或者大规模预训练模型,是“大算力+强算法”结合的产物。大模型一般具备如下特征:

  • 参数量(十亿量级)和训练数据量(GB以上)巨大,一般采用Transformer架构;

  • 采用预训练模式,首先是在通用数据集上进行训练,而不是直接在特定数据集进行特定任务的训练;

  • 具备迁移学习能力,迁移学习的思想是将从一项任务(例如,图像中的对象识别)中学到的“知识”应用到另一项任务(例如,视频中的行为识别)中,在Zero/One-shot中具有较好的表现,即训练样本很少或者没有的情况下,依旧能做预测,实现已有知识的迁移;

  • 模型的训练过程依赖云端设备,无法在离线个人终端上实现。

大模型的训练过程有5个步骤:数据获取、数据清洗、大模型训练、下游适配、终端应用。算法和数据缺一不可,既要聪明、又要勤奋,不仅需要投喂千亿级参数(量变从而产生质变),还需要能够基于人类反馈进行学习,每走一步都观察人类反馈、朝着人类期望的方向前进。

打开网易新闻 查看更多图片

目前国内布局大模型的公司主要有三类玩家:

  • BAT互联网公司(腾讯、百度、阿里、360、小米等)以及科技企业(科大讯飞、华为、商汤、澜舟、昆仑万维、达观、面壁智能等);

  • 大佬自立门户、出来创业(美团王慧文的光年之外融资数亿美金,还有阿里贾扬清、搜狗王小川等);

  • 高校(复旦的MOSS、清华等)。

关于通用大模型的终局,有几种预测:一家独大、三分天下、百花齐放。我们倾向于认为未来会有几家通用大模型公司,而且中国一定要训练自己的大模型,尽管中美目前有一定差距,但以防未来卡脖子,“自研”是唯一路径。目前AI应用层创业者一般还是接用Open AI、stable diffusion等海外开源公司的API,但一旦海外公司拒绝API接用的话,无疑是釜底抽薪。日前微软和Open AI的擦火值得我们警惕:根据《The Information》资讯,微软的一份内部文件指示 Azure 的销售人员告诉客户微软能比 OpenAI 提供更多的服务;而 OpenAI 则在通过延迟授予微软产品 API 访问权限、暂缓提供最新模型等方式,进行防御。

03

应用层 暗流涌动

云计算、芯片硬件和模型层的搭建阶段,主要是大厂密集出手,待“道路”铺设好之后,预计今年下半年应用层将迎来爆发期, 也即是VC出手期。

将底层模型集成到面向终端的产品,途径有两种:

  • 一是在自家模型上开发应用;代表玩家:AI绘画工具Stable AI,日活用户已过千万;

  • 二是调用大模型公司的API,代表玩家:从事to B营销文案生成的Jasper,调用了OpenAI的GPT 3的API,Jasper去年营收接近1亿美金。

套用一句广为流传的话“所有行业都值得被重新做一遍”,AI对产业的颠覆可以从两个维度来看:

  • 行业+AI,AI赋能传统行业,现有应用接入大模型后的升级。这部分是80%的存量市场。举个例子:在移动互联网时代,找餐厅基本是打开美团进行筛选。而有了AI agent(由语言模型驱动的机器人,能分解复杂问题并以迭代的方式加以解决,还能代表用户采取行动),我们可以让它找到最符合我们的日程安排并且满足我们个人喜好的最佳餐厅,同时预订好座位。其他领域比如智能客服、新闻稿撰写等,已经有创业者在试水。

    智能机器人赛道是我们一直看好的赛道,背后逻辑有两个:一是中国老龄化程度加剧、劳动力不足(接近20年前日本的人口结构),去年新增人口已跌至1000万以下了,劳动力成本的上升将利好机器人的普及;二是中国人本身擅长做硬件(供应链完善),AI的赋能可弥补原先软件的不足,极大提高产品竞争力,未来硬件的出海将成为趋势。此逻辑可类比到电动车、自行车、小家电等硬件产品。

  • AI+行业,AI原生应用,这部分是20%的增量市场。比如AI自监督应用(用模型去监管模型)。

04

从算力(英伟达GPU产能受限)、算法(逐字生成,推理能力受限)、应用(暂未出 现国民级应用)各产业链来看,AIGC似乎仍有些不确定性。 但AI让人兴奋的地方在于: 尚未出现天花板。 我们相信,AI对生产力的颠覆,可比作普罗米修斯火种,未来或许可通过全⺠社保的形式保证98%的⼈得到生活保障,剩余2%的⼈将会⼯作。

小思考: 18世纪末第一次工业革命催生了纺织业,农民变成了工人; 商品的极大富足使得贸易成为刚需,从而催生了交通业和钢铁业。 今天AIGC的兴起会催生哪些新行业和新工种? 欢迎创业者或者投资人同行与我们交流您的见解。

元创资本(Innovator Capital)创立于 2017 年,专注于“人工智能、大数据等新科技赋能传统产业”领域的投资。创始人王浩先生是国内最资深的一线基金管理人之一,拥有20 年专业投资经验,见证了中国创投行业的整个发展周期。

元创资本秉持“投资中国原创,成就中国创业者”的理念,支持中国原创,投资有伟大格局和全球视野的优秀企业家,致力于成为中国卓越、值得信任且受人尊敬的投资机构。

元创资本管理团队均深耕产业和投资多年,分别来自国内一线专业投资机构、世界 500强及顶级咨询机构等兼具深厚产业背景、产业资源与多年投资经验,拥有多元化的投资视角和优异的历史业绩,形成了完整互补的管理团队。

元创资本创始人王浩先生及其管理团队投资的企业超过160家,其中超过30家企业成功实现IPO,近20家企业通过借壳或重组上市,成功案例包括:美团点评(03690.HK)、滴滴、Bilibili(NASDAQ:BILI)、孩子王(839843)、红蜻蜓(603116)、永贵电器(300351)、福达合金(603045)、高斯贝尔 (002848)、华韩整形(430335)、合全药业(432159)、摩贝(NASDAQ:MKD)、盘子女人坊、爱回收、松鼠Ai、小卫科技、源氏木语、乐秀科技、拜安传感等多个项目。

打开网易新闻 查看更多图片