未经许可不得转载,务必保留原文出处链接和公众号按钮

(关注本城公众号并设为标,

第一时间获取最新世界顶级科技认知)

打开网易新闻 查看更多图片

文:Web3天空之城·城主

前言:

OpenAI高管访谈不算少,但一般都是讲大模型研究或者愿景,这个访谈是难得一见的企服负责人谈OpenAI如何做金融企业客户的服务,对于那些做企服的大模型公司,这是一个难得的资料。本城在这里分享全文书面整理版和中英视频。

B站传送:【精校】OpenAI如何服务企业级金融 | OpenAI平台主管James Dyett访谈 2024.6.25 【中英】-哔哩哔哩】

https://b23.tv/HXR6gSY

主持人:

人工智能将彻底重塑金融。我来到旧金山市中心的 OpenAI 总部,看看未来是什么样子。您可能已经看过他们最新模型 ChatGPT 4o 的演示。这非常令人印象深刻。但我认为更令人印象深刻和更有趣的是这些模型今天在实际中是如何使用的。

摩根士丹利和 Klarna 都是 OpenAI 的客户。摩根士丹利在一年内开发出一款工具,供其 100% 的财富经理使用,从而改变他们的工作方式。在企业时间线上,这是超光速。另一方面,Klarna 仅用两个月就开发出一款工具,实现了其客户服务工作票务工作流程三分之二的自动化。一个大问题是,这些客户服务代表下一步会做什么,或者 Klarna 现在有了更多的能力,将如何使用他们。

但我们不仅要谈论摩根士丹利和 Klarna,还要看看 Oscar Health 等一些客户。我们今天的嘉宾是 James Diet。他之前曾管理过 Stripe的 GoToMarket 团队,现在是 OpenAI 的平台销售负责人。当世界上最大的银行(如摩根士丹利)或最大的初创公司(如 Klarna)致电 OpenAI 并希望使用最新模型时,他和团队是第一批听到他们消息的人,也是第一批看到这些模型如何在实际中部署的人。谈论特定的客户用例、他们今天在做什么、未来会做什么将会非常有趣,不仅是摩根士丹利和 Klarna,还有其他一些精选的人。

我们还将讨论构建和扩展企业 GoToMarket 动议需要什么,因为詹姆斯已经成功服务了两家标志性的硅谷公司,即以前的 Stripe 和今天的 OpenAI。

詹姆斯,欢迎参加节目。

James:

谢谢你邀请我,雷克斯。

所以第一个问题,我想了解你的背景。你当时从 Stripe 转到了 OpenAI。那时OpenAI 的知名度不高,而你却要与谷歌和亚马逊等公司的 30,000 名销售人员竞争。那么你为什么要做出这一举动呢?

是的,事实上这是一个有趣的故事。当我 2016 年刚开始在 Stripe 工作时,我们的办公室距离我们今天所在的位置只有几个街区,位于旧金山 Mission。我们当时在一间小办公室里,它被称为先锋大厦。这是一间漂亮的办公室。

是的,我也去过那里,不太远。

它非常非常迷人,而且有着悠久的历史。事实上,在我加入 Stripe 三个月后,我们就搬走了,一家小型非营利组织搬进了同一个办公室。我了解到,这个非营利组织是 OpenAI。我很好奇,OpenAI 是什么?Stripe 的创始 CTO Greg Brockman 是 OpenAI 的创始人之一。我很好奇,为什么这位工程师决定跳槽到这家公司?这家公司是什么?我读了一些关于它的内容,发现它创造了人工智能,而且是非营利性的,多么古怪。

确实如此。

我几乎不知道七年前会发生什么。所以这个故事很有影响力。我在 Stripe 待了六到七年后离开。然后我收到了 OpenAI 某人发来的 LinkedIn 消息,上面写着,OpenAI 的销售。我记得 OpenAI,他们以前在我们以前的办公室工作,但他们为什么需要销售?这是一个非营利组织,他们试图制造出造福全人类的人工智能。但我非常好奇,所以我接了电话。

这是在 DALL-E 推出之前,也是 ChatGPT 推出之前。我被这项技术迷住了。这是在这项技术炒作前、真正商业化前。我无法摆脱这对公司来说将是一件大事的想法。但正如你所说,我不认为我会与亚马逊和谷歌竞争。我以为我会敲开人们的门,试图说服他们和我开会讨论这些疯狂的大型语言模型以及它们如何有用。

所以我在 11 月接受了这份工作。我上任后,我们推出了 ChatGPT。然后,在 ChatGPT 发布后的 2 月份第一周,我突然发现自己处于一个与预期截然不同的环境。

这非常有趣。希望现在,有时客户也会来敲你的门。这就是我们在这里要谈论的。

我想谈谈世界上一些最大的银行,像摩根士丹利、Klarna 这样的银行。在此之前,请先给我一个客户如何使用 OpenAI 的框架。

是的,我们喜欢说,企业今天似乎有三种方式使用我们的技术。首先,他们将人工智能带入员工队伍。因此,他们正在帮助员工提高编码或文案撰写等任务的效率,甚至撰写绩效评估等。所以有这种劳动力生产力类别。

第二个是关于自动化工作流程。因此,将过去可能非常手动或低效的东西,以及将这些模型应用于特定任务。第三类是将人工智能引入公司提供的核心产品和服务。因此,如果你看看所有关于将人工智能引入 XYZ 公司的公告,它们往往会遵循并属于这三类之一。

是的。让我们用这个框架来谈谈你的一些特定客户,也许从摩根士丹利开始,看看他们在财富管理部门内部所做的事情。

当然。所以摩根士丹利实际上在我们推出 ChatGPT 或我们现在的旗舰模型 GPT-4 之前就押注了我们。我们花了大约一年的时间与他们合作开发一种工具,该工具将使他们的财务顾问能够为客户提供更好的财富管理和支持。这种工作方式使这些模型非常擅长推理任何类型的数据,无论是定量数据、定性数据,还是现在的视觉数据或音频数据。

如果您考虑财务顾问的工作,假设您是我的客户雷克斯,您会经常问我一些问题,而我可能不知道这些问题的答案。比如,您可能会问:“詹姆斯,我的表现只有一半。”没错。但更重要的是,您可能会好奇摩根士丹利对某个特定问题的看法。答案肯定存在于摩根士丹利的某个地方。

过去,获得答案的传统方法是打电话给您知道的苹果股票专家、利率专家或大学储蓄计划专家,然后刷新您的记忆,这样您就可以给雷克斯一个很好的答案。

作为一名顾问,您可能支持50多个客户,每个客户可能有10种产品或更多。摩根士丹利内部有这些产品线的专家,但可能需要多个不同的登录名才能访问数据,更不用说打电话给这些人了。

把所有东西都记在脑子里是一项不可能完成的任务。

因此,过去财务顾问曾使用过一些工具。在摩根士丹利成立初期,他们可能有一些纸质文件,可以查看最新的公司研究报告或公司提供的产品。随着时间的推移,这些文件可能转移到公司内联网,即内部搜索门户。这些AI工具只是让这些财务顾问能够回答客户问题的下一步。这就是摩根士丹利提供的服务。

他们有一个工具,就像是坐在财务顾问旁边的助手。顾问只需输入客户提出的任何疑问,就可以实时得到很好的答案。这很重要,因为在受监管的行业中,您无法处理模型产生的任何幻觉或错误。这个助手实际上会链接到主要来源。因此,财务顾问可以看到实际的研究报告,讨论公司对利率的看法。顾问可以快速扫描,确保给雷克斯的信息是正确无误的。

因此,这确实是人机交互的,并且是助手。我们发现这对于银行和其他受监管公司来说非常重要,因为他们希望知道他们分享的信息是100%准确的。

我很想看到使用的具体细节和一些数字。所以我之前和他们谈过,他们花了大约一年的时间推出这个工具。我很好奇获得认可和训练的情况如何,今天有多少顾问在使用它,摩根士丹利和OpenAI以及您的团队在评估最新模型以升级平台方面的反馈循环是什么样的。

是的,这个问题问得很好。这个和大多数AI计划都是C级计划。因此,在技术的这个阶段,它不是自下而上的。我们正在与一个部门合作,我们将与这个小部门取得成功,并将这种成功带给其他人。

在金融等受监管的行业中,很难自下而上地进行上市动议,因为您接触的是受监管的数据,您不能产生幻觉,所以您必须从高层开始。

摩根士丹利当时的首席执行官詹姆斯·戈尔曼表示,这是公司想要做的事情。让我们从财富管理开始吧。我们与摩根士丹利的合作非常紧密,因此他们在内部需要做出很多决定,关于如何将人工智能引入公司,设立什么样的护栏和内部政策,以及从哪个部门开始。

在人工智能中,有一个评估的概念。评估是用来确定模型在某项任务中表现如何的工具。你可以想象一堆问题和答案,我们会将其评为A+,即优秀答案。然后你测试模型,看看它与答案的接近程度。这就是我们所说的评估。

例如,GPT-3.5在100个问题中可能得分40%,而GPT-4在同样的问题中得分可能为70%。如果为GPT-4提供一些额外的背景信息,它可能会达到80%。经过一些微调,GPT-4可能会达到85%。每周我们都会和摩根士丹利团队一起审查这些评估。我们的目标是,只有当模型超过一定的绩效标准时,才会交给财务顾问,然后得到他们的反馈。

模型在静态问题组上表现良好是一回事,而了解它对财务顾问是否真的有用又是另一回事。摩根士丹利团队不断迭代哪些问题可以代表该技术在该领域的应用。OpenAI和我们的客户都使用这种创建评估的框架来判断我们是否做得好,这是一种很好的工作方式。

这可能是您的团队专门为大型企业开发的一项重要技能,帮助他们共同创建这些评估。

这是一种判断我们是否达到帮助他们解决某个问题的标准的方法。当我们探索模型行为时,会与公司合作,确保模型必须超过一定的标准才能提供给员工。企业通常需要经历一段旅程来确定这个标准是什么,对于我们来说,优秀意味着什么。

很多公司以前没有购买过这样的工具,也没有制定标准,所以你们必须帮助定义这些标准。

我们在谈论其他客户时会更多地谈论这个问题,但他们往往不太清楚这些公司的人在评判模型的评估中表现如何。这就是事情变得非常有趣的地方。

我认为这是人工智能中最有趣的事情之一。你会说,哦,你怎么可能相信一个模型能做到这一点,尤其是当它是非确定性的?然后你会想,等等,只有5%的企业数据是结构化的,95%是非结构化的。财富管理部门与客户进行非结构化的互动,提供非常重要的财务建议。你意识到你实际上并不知道你的公司是如何运作的。

我们的总裁格雷格·布罗克曼说,这些模型并不完美,我们也不完美。我认为,这是一个很好的框架,让我们能够将这种人工智能范式带入一个全新的境界,那就是真正谦逊地对待我们人类所能做的事情,同时也谦逊地对待模型所能做的事情。如果我们能做好自己的工作,希望你能将模型与人类联系起来,最终的结果会比我们现在的更好。

这是一个有趣的想法,即使你不使用该模型,它也可能让你更多地思考如何建立和运营你的业务,并在这方面做得更好。此外,也许还有一个模型可以为你完成这项工作。那么摩根士丹利的推广情况如何?他们如何迭代评估?有多少比例的顾问已经开始使用它?

这个工具现在已经推广到所有的财务顾问。

这非常重要,因为通常在摩根士丹利推出这样的工具,可能需要三年以上的时间才能签署、签约,更不用说推出。所以现在它已经推出并上线,这非常令人印象深刻。

事实上,我有一个好朋友是摩根士丹利的财务顾问。我问他,吉姆,你觉得这个工具怎么样?他很喜欢。现在他可能只是想对我好一点。但我们从摩根士丹利团队那里听说,他们最初得到了很好的反馈。不过,我认为,如果你和摩根士丹利的人交谈,他们会认为这是他们在公司内部推出的第一款产品。这可能是他们在公司内部推出的最差的人工智能产品。

他们有长远的眼光。我喜欢与摩根士丹利的关系,这不仅仅是我们为财务顾问做了什么,而是他们将如何长期利用人工智能?比如,我们从为财务顾问构建这个工具中学到了什么,关于如何使用这些模型。正如你所说,这些模型是概率性的,是一项全新的技术,随着时间的推移会变得更加智能,需要换成新的模型。他们从这个过程中学到了什么,可以带到公司的下一个AI项目中?他们现在有几十个积压项目。

这对企业来说就像学习如何使用新工具然后采用它们。所以听到这个故事非常有趣。我们来谈谈摩根士丹利,世界上最大的银行之一,用例和财富管理。我想谈谈世界上最大的金融科技公司之一Klarna。他们最近发布公告称,我们已经将客户服务代表目前所做的工作中的三分之二自动化。他们是OpenAI客户,所以很高兴听到他们如何利用该平台。此外,这些客户服务代表现在都应该找工作还是在内部做其他事情?

这是一个很好的问题。因此,如果我们回到企业使用人工智能的初始框架,你可以将摩根士丹利对其财务顾问所做的事情视为劳动力生产力。我认为 Klarna 将人工智能引入了他们的核心产品,即客户与支持团队的体验。因此,Klarna 的首席执行官 Sebastian 为他的团队设定了一个非常大胆的愿景,看看这些模型在自动化客户服务方面能走多远。正如您所说,他们走得相当远。现在,大约三分之二的 Klarna 客户支持传入票证都是由模型端到端自动化的。

我认为这是非常了不起的。不仅仅是三分之二的端到端是自动化的,而且他们构建和发布所需的时间不到一年。

我想我们大概是几个月。我认为他们所做的事情很重要,这不仅仅是简单的客户服务。大多数时候,我们会想,客户服务就是提出一个问题,然后得到一个答案。实际上,大多数时候,你希望你联系的公司能代表你做某事。你希望他们提供退款,取消某些服务,或者为你升级。因此,模型不能仅仅用正确的答案做出回应。这不仅仅是一个查询,你必须做代理工作,采取行动。这就是 Klarna 与我们一起做的大量工作。三分之二的自动化票证中的大多数都需要实际行动才能完成。

我们意识到,这不仅仅是针对只需要文本回复的一小部分票证,而且你可以承担这些代理目前正在做的相当大一部分工作量。

既然 Klarna 的自动化已经奏效了,他们今天来找你们是为了什么,并希望做些不同的事情?我相信他们想使用最新的模型。

有趣的是,如果你仔细想想,我们刚刚发布的 GPT-4o 比 GPT-4 Turbo 更智能,后者是之前最先进的模型。但我认为,新模型最让客户兴奋的是其人性化音频功能。这正是我们几周前演示的。如果你考虑客户服务,每当我打电话给航空公司时,这些功能都是自动化的,如果你需要,只需用一个词告诉我们你的想法。你会说,代理,代理,代理。因为有时他们实际上有生物识别软件。

但现在,这些模型实际上可以进行像人类一样的对话。尽管我们已经有一段时间的文本转语音和语音转文本技术,但它有很长的延迟,所以它对于你想要的像人类一样的客户服务对话并没有真正起作用。现在,这更像是在播客上和你交谈,也许你是 GPT-4 的幕后推手,你可以开始将其指向电话客户服务体验。目前,我们还没有在生产中看到这一点,也没有在 GPT-4 中推出音频功能。但这是 Klarna 等公司接下来会真正兴奋的事情。

我认为这确实提供了更好的客户体验,因为没有人喜欢在线等待。然而,这也触及了一个巨大的社会焦虑,即我们在美国联络中心有 280 万人,他们中的许多人为银行和其他金融机构工作。

那么,Klarna 今天对他们的客户服务代理和基地做了什么?他们如何重新利用这些员工?从就业角度来看,这是什么样子?

我给 Klarna 的首席执行官塞巴斯蒂安很大的赞誉。他在推出这项服务后在 Twitter 上宣布,这些模型占据了我们很大一部分的票房。他直面就业问题,说当时他们还没有对员工队伍做出任何改变,但他也指出,这项技术将改变我们的工作方式。

Klarna 的做法是让他们的代表处理那些没有得到正确解决的棘手问题,这才是客户服务真正发挥作用的地方,不是在交易问题上,而是在真正棘手的客户服务问题上。我认为这项技术将以各种方式对劳动力产生真正的影响,其中一些我们可以预测,比如某些工作将会消失。我想到的是翻译的工作。最近在日本,我们有一个翻译坐在我们身边。她说,你们看起来很棒,你们会接替我的工作。我没有给她一个很好的答案,因为这些模型的翻译能力非常好。

当然,劳动力将会发生一些变化,但我认为也会出现一些新的工作岗位和新的工作方式,我们目前还不知道,无法预测。举个小例子,我现在工作的每家公司都有一个人工智能主管的职位,这个职位以前并不存在,后来才被创造出来。我想象,有进取心的产品经理会说,我有机会进入高管层,我可以成为首席人工智能官,这些职位是存在的。18 个月前它们还不存在。

显然,并不是每家公司都有那么多首席人工智能官,但有一个概念,比如即时工程师,真正懂得如何使用模型的人。所以我认为我们将看到某些领域的工作类型发生很大变化。我们没想到,第一批受到人工智能等新技术影响的工作实际上是地位相当高的知识型工作。你可能会想,这可能会解决更多的低技能劳动力问题,但这根本不是发生的事情。

我确实认为变化即将到来,而且变化正在发生。我们只是不完全知道它会以什么形式出现。

当你遇到那些关于就业的社交焦虑问题时,这真的很难。很容易看到哪些工作会受到影响,甚至可能减少,但很难考虑等式的另一边。而且可能会产生意想不到的后果。我认为金融服务的一个很好的例子是自动取款机。如果你看看自动柜员机的推出,实际上是自动取款机在20世纪60年代的引入。自动取款机的推出导致银行柜员人数增加,因为它减少了柜员的部分工作负担。这一变化花了40年的时间才显现出来。然而,从2010年代开始,这种情况发生了变化。随着时间的推移,虽然可能会出现压缩,但当出纳员可以从发放现金转移到实际销售新产品时,运营分支机构的边际成本降低,使得运营分支机构比以往任何时候都更有利可图。因此,银行因为ATM的引入而开设了更多分支机构,雇用了更多出纳员。

我们正处于人工智能和金融服务的有趣阶段,也许这是真的,人工智能实际上是互补的,但它的发展速度更快。进入2010年代,这一变化不再需要40年,可能只需要五年左右。

回到摩根士丹利的情况,摩根士丹利财富顾问通常管理的资产为1000万美元或更多。正如你所说,有了新的生产力工具,现在可以为更多的人服务。对于拥有2.5亿到1000万资产的人来说,之前为这些人提供服务是有利可图的,这对于引入AI来说是很棒的,因为你会拥有更多的客户。

我们实际上在另一位客户身上看到了这一点,那就是巴西和整个拉丁美洲的Nubank。Nubank是一家总部位于巴西的拉丁美洲新银行,规模庞大。很多美国人并不了解他们有多大、有多有价值。我认为他们是世界上最有价值的金融科技公司之一。Nubank的规模比你通常认为的新银行要大得多。很多欧洲新银行可能只拥有相对较少的人口在它们那里开户,而在拉丁美洲,Nubank在整个客户群中所占的比例要大得多。

重要的是,Nubank的客户并不是摩根士丹利那种拥有1000万美元资产的客户。事实上,Nubank现在确实做到了这一点,而摩根士丹利可能会想,他们也许可以进入低端市场,在那里他们可以更有效地为客户服务。像Nubank这样的公司实际上能够通过提供的服务类型进入高端市场,因此他们可能不需要为每个客户都配备一个单独的财务顾问。你不能真的去Nubank寻求贷款产品或储蓄计划的建议,但现在,这些模型能够以自然语言提供真正出色的建议,使用其他语言,而不仅仅是英语、葡萄牙语或西班牙语。

因此,Nubank客户的体验得到了改善。Nubank提供相同的服务不仅变得更便宜了,他们实际上能够提供以前无法提供的新服务。

回到最初的框架,如果你有员工生产力,你就有面向最终用户的东西。然后,你还有整个领域,基本上就是开辟可以为客户打造的新产品线。我们很想听到更多关于 Nubank 推出的情况。类似的问题,比如他们花了多长时间推出,他们给你和你的团队的反馈是什么?

是的,我认为他们所做的事情令人兴奋的地方,在运营速度方面与 Klarna 非常相似。此外,如果你考虑 Klarna 和 Nubank,我们能够与他们合作,而无需在巴西或瑞典设立办事处。现在,我们充分利用了虚拟会议。但在很多情况下,这些客户能够用我们很少的资源做很多事情。

你提到,我正在与亚马逊和谷歌等公司竞争。我的团队中没有数万人来支持所有这些部署。但我们能够做的是提供非常出色的建议,告诉人们如何将这些模型推向他们想要的方向。因此,我们与 Nubanks 和 Klarna 合作的很多工作并不是提供项目计划,也不是亲自提供部署支持。更重要的是,我们遇到了这个问题。我们已经阅读了你们所有的文档。我们自己做了很多研究,但我们有点陷入了困境。这就是我们可以让专家发挥作用的地方。这基本上就是我在市场上的价值主张,即深厚的人工智能专业知识。

是的。这是否属于,您是否有一个解决方案团队、客户成功?比如,您实际上是如何构建它的?

是的。因此,OpenAI 的结构方式是,我们基本上有三个不同的组织部分。有研究。研究人员是那些将新模型变为现实并不断突破可能性边界的博士和人工智能专家。然后,我们有了应用组织,其中包括工程师和产品经理。他们将这些模型带入应用环境。因此,他们正在构建 API,在研究人员提供的核心智能之上构建 ChatGPT。然后,你还有像我这样的市场营销人员的业务。如果我们与 Nubank、Klarna 或 Morgan Stanley 这样的客户交谈,我们主要会利用我所在组织和同行组织中的解决方案资源和业务资源。偶尔,如果出现他们无法解决的新问题,我们会深入研究。这样的例子可能是为特定任务或用例定制模型。我们与一家名为 Harvey 的公司合作,该公司希望打造一位法律服务专家。在那里,我们与我们研究团队的一些人合作,建立了一个法律模型,即法律 AI 专家。但是,在大多数此类合作中,我们只需依靠团队中整天与企业合作开发 AI 的解决方案专家就能取得真正的成功。

是的。让我们看看其他一些客户。所以我们谈过了摩根士丹利、Klarna、Nubank。也许让我们回到美国。但看看医疗保健和 Oscar Health。我认为他们也是另一个。所以我喜欢 Oscar Health。你花了很多时间考虑金融服务。

Oscar Health 也处于一个高度监管的行业。医疗保健和金融服务之间的交集非常大,特别是在账单、索赔、保险和付款方面,有很多重叠之处。

如果我们把Oscar看作一家企业,它是医疗保健企业还是金融服务企业?从某种意义上说,它管理着临床医生和患者或支付患者护理费用的企业之间的资金流动。

Oscar Health是一家健康保险公司,他们的主要业务是有效地支付其会员的医疗费用。坦率地说,他们被视为世界上技术最先进的医疗保健公司之一。然而,他们面临的挑战是,在医疗保健领域与United Healthcare、Cigna和Blue Cross Blue Shield等规模极大的组织竞争,这些组织拥有很大的议价能力和规模效益。为了找到另一种竞争方式,Oscar Health真正接受了人工智能作为他们的竞争优势。

如果仔细思考,健康保险公司需要做什么?它需要理解大量数据,包括医疗记录数据和索赔数据,并根据这些信息采取行动。例如,它可能是在与医生的对话中,根据医生提供的信息批准或拒绝某项服务,或者是处理索赔及相关的所有文书工作。这些模型的优势在于能够快速准确地处理大量非结构化数据。医生在做笔记时并不以特别有条理而闻名,但这些模型能够快速准确地做出决定。

如果我们回到摩根士丹利的例子,财务顾问面临的挑战是拥有大量数据,客户希望访问这些数据中的知识。如何使用这些模型来提取客户需要的信息?Oscar也遇到了同样的问题,所有答案都在数十、数百和数千页的索赔或医疗记录中,但没有时间花上数小时来阅读所有这些内容。如何快速总结关键信息以便做出决定?

Oscar主要在保险、患者和临床医生方面使用这些技术。他们构建了一个称为“索赔助手”的工具,可以快速为代理总结与特定患者相关的所有信息,从而回答客户和患者的问题,例如某个程序是否在保险范围内等。这就是他们使用技术的核心。

作为医疗保健系统的客户,这非常令人沮丧。你经常会问提供商或健康保险公司,某个问题是否涵盖在内,但他们可能会告诉你先做,然后再告诉你结果。

对于我们所有人来说,在这个领域,能够更快地得到答案是非常重要的。这些模型在许多测试中还不如人类聪明,但它们的速度更快。当我们思考人工智能如何融入我们的生活时,这一点非常重要。比如,你希望人工智能做什么工作?你是否希望它完成一些我们人类做不到的事情,因为我们不够聪明,例如下棋。人工智能的下棋水平可能比你我高得多。

但有时我们希望人工智能做一些你我特别擅长的事情,只是希望它做得更快、更便宜。在绝大多数情况下,这可能是一个更好的类比。比如,你我可能可以筛选医疗记录并总结出来,但我们是否想这么做?这么做是否划算?

绝对划算。

我很好奇大家对企业采用该平台的一些一般想法。比如,您的客户上线这些产品的瓶颈是什么?

当我接受这份工作时,我认为瓶颈是让他们关注我们。如果您考虑一下颠覆理论,一项新技术出现时,最大的客户一开始往往会忽视它。而您获胜的方式是从初创公司和早期采用者开始,然后证明其价值。

这就是 Stripe 所做的,也是您帮助 Stripe 做出的改变。在 Stripe 成立大约六七年后,它从初创公司转向向企业销售。

这就是剧本。我没有参与向云的转型,但我的理解是云也是这样运作的。它不像世界上最大的银行……

云仍然是这样运作的。J.P.摩根大通去年宣布了云核心基础设施迁移,用于核心银行系统。因此,他们有工作流在运行它,但仍有大约 50% 或更多是在本地。

这是一个完美的例子。如果我们进入革命的 20 年,企业应该这样采用新技术。如果我们回顾过去,这个新事物不同,它会改变我们的工作方式,但它有一些好处。谁会冒险开始?初创公司和小公司会进入高端市场。这 100% 是我在 Stripe 所做的。这就是 Stripe 取得巨大成功的方式。我们花了很多年才为亚马逊处理付款,我们必须一路学习,就像你从成长中的小客户那里学到东西一样。他们说,如果你要支持我们 1000 万的支付量,你最好提供这些功能。客户会逐渐迫使您做好企业准备。

这与人工智能完全不同。这就是我仍在思考的原因。

我认为为什么非常有趣。初创公司面临的一个大问题是,初创公司是否在现有企业之前获得创新,或者现有企业是否在初创公司建立全新业务之前获得创新的分配并将其实际集成到他们的系统中?而且他们做得更快。Clarinet花了两个月的时间,Bore和Stanley花了一年时间。他们没有像JPM那样花20年时间将核心系统迁移到云端。

所以我认为,如果我们考虑云基础设施或Stripe支付平台所采用的模式,你会发现这需要几年时间。某个时候,像摩根士丹利这样的公司会关注我。

但我不会从那里开始。我加入OpenAI时,我们刚刚推出了ChatGPT。我想不出有多少财富500强的CEO没有联系过OpenAI要求会面。

我不认为AWS或Azure以及其他云提供商的情况会如此。我认为ChatGPT可能在11月推出。假期来了,很多高管都说,他们一直在读关于ChatGPT的文章,并尝试了一下。然后他们有了这种发自内心的顿悟时刻,觉得这可能会对他们的员工产生真正的影响。

ChatGPT的本能性质在于,当你与它互动的那一刻,它就是一款非常引人注目的产品。它的演示非常清晰,这实际上是ChatGPT的目标。它本应是一个低调的研究预览,也是人们的一种方式。GPT-3是ChatGPT的基础模型,已经上市很长时间了,我想有一年多了,而这只是一个顶层界面。

我的理论是,这些高管看到它后顿悟了,认为这是下一个技术平台,我们需要领先于它。所以你最终没有走上那条通往企业的缓慢道路。企业意识到,我们必须快速行动。也许他们从过去的经验中吸取了教训,比如移动和云计算,认为这些事情即将到来,他们最好快速行动,而不是等待。

无论如何,突然之间,我们被迫成长为一家公司,比我们计划的要快得多。这是我遇到过的最有趣的职业挑战之一。

这不仅仅意味着拥有一款出色的产品,但如果你有一款出色的产品,再加上出色的演示,那么它真的可以吸引核心客户。

我认为对于假期在家的高管来说,云演示效果不是很好。

Chachi Bouti的演示,Snowflake很棒,但对于高管来说,Snowflake演示并不那么令人兴奋。

Chachi Bouti所做的所有愚蠢的东西、诗歌和韵律,至少当我第一次看到它时,就像魔术一样。这太神奇了,并要求它写一首关于任何事情的诗。它能够想出完美的押韵方案。我认为,这种看似愚蠢的功能很快就能证明其价值。哦,等等,能够写诗的系统也可能写得出法律摘要。

您从 Stripe 的建立、上市实践和企业过程中学到了什么?这些经验是否已经转化为开放式 AI?开放式 AI 是一种不同的产品,一家不同的公司。

是的,虽然有一些相似之处,但我们在 Stripe 和 OpenAI 看待世界的方式有所不同。我们有不同的市场细分,并且在 Stripe 开发了销售团队来为初创公司、我们所谓的数字原生代和传统企业制定计划。在 OpenAI,我仍然以这种方式看待世界,并经常使用这个框架。

不同的是,在 Stripe,当我们第一次创建企业销售团队时,这是一个实验。我们的想法是看看我们需要什么才能赢得一家企业。因此,第一个企业销售团队更像是一群前瞻性部署的产品经理,他们也在尝试做交易。我们会走进市场,与很多企业交流。结果发现,我们向他们展示的 API 文档虽然在创业社区中很受欢迎,但企业客户并不在意。

事实证明,企业公司购买支付服务的人并不是我们在 Instacart 的买家,后者通常是产品经理。企业中有一个新角色,叫做支付主管。这个支付主管在一个完全不同的组织里,他们在财务部门,关心很多不同的事情。他们是支付生态系统的专家,而我们当时的销售团队中没有人具备这种专业知识。所以,如果我们要赢,我们必须完全重新设想我们的市场行动。这就是我们在 Stripe 所做的。我们花了相当多的时间才到达那里。

人们认为 Stripe 非常成功,事实也确实如此,它是一家伟大的公司。但是,进入企业市场需要学习很多东西。

每个在那里的人都会告诉你,事实并非如此简单。这是一条坎坷的道路,我们花了一段时间才弄清楚。

这就是 OpenAI 真正与众不同的地方。我们仍然必须找到一种方法来服务所有这些客户,但我们没有像在 Stripe 那样经历漫长的学习期。所以,最终,我与团队分享的答案是,我们可以取胜的地方在于我们与竞争对手的不同之处。我们每天醒来,所想的都是人工智能。

与亚马逊竞争是相当可怕的。当你从竞争的角度看谁会让你害怕,是亚马逊还是谷歌?

如果你仔细想想,亚马逊和谷歌可能拥有世界上最大的销售团队,或者接近最大的销售团队,以及庞大的用户群。他们可以提供各种交叉补贴和信贷。因此,他们应该因为所有这些原因而击败我们,而且他们甚至不应该接近我们。但他们没有的是我们那样的专注力,这又回到了我们关于颠覆的讨论。如果你是 AWS 或 GCP 的销售代表,你不仅要销售 AI,而 AI 目前只是整个云支出的一小部分,你还必须销售所有其他服务,并且你必须是所有这些服务的专家。而你获得报酬的方式可能不会因你将 AI 带给客户而给予不成比例的奖励。因此,我们在市场上看到很多行为,AWS 或 GCP 销售代表会试图将 AI 捆绑到更广泛的更新中。

客户实际上确实需要深厚的 AI 专业知识,因为他们面临着生存挑战:AI 如何融入我的业务?他们不知道答案。他们不想听到这样的推销,比如,这里有 25 件东西,我想向你推销,但你需要做一点,这是 Microsoft Word 和剪辑。他们想要的只是获得 AI 方面的帮助。

我们试图与客户打交道的真正方式是说,看,我们无法像竞争对手那样为您提供那么多的时间或人力,但我们能为您提供的是对 AI 的痴迷。所以我告诉团队,让我们专注于 AI 的最佳部署,而不是最多的部署,我们不会以最多的部署取胜。我们不会以规模取胜,但我们可能能够以质量取胜。如果你这样做,你就会在市场上树立声誉。

实际上,我觉得这对任何公司来说都完全一样,如果你以卓越和满意的客户而闻名,没有人会回头说,我不应该在早期的客户关系上投入那么多。我应该把自己分散到极致。我们仍然是一家初创公司,我们还处于起步阶段。因此,我们能否成功取决于我们能否真正实现出色的人工智能部署。

这又回到了 YC 的建议,比如,做一些无法扩展的事情。虽然我认为他们真正想说的是,做一些适合你的规模的事情。你们规模化运营,你可以支持大客户,但可能无法支持每天给你和你的团队发电子邮件的 10,000 名客户。

当我听到“做一些无法扩展的事情”时,我也听到“实际上要尝试非常深入地了解客户问题,即使这意味着要花费比你认为应该花在客户身上更多的时间。”因为一旦你真正深入地理解了这一点,你就可以以一种可行的方式进行扩展。

但是,在你理解客户问题之前,你将无法扩展,因为你会假设,我认为这是我面临的最大挑战,有很多公司只是在购买人工智能,因为他们被告知,你必须对人工智能做些什么,去找到一种与 OpenAI 合作的方法。你可能会产生这种虚假的安全感,比如,哦,我们的产品适合市场,你看,美元进来了,注册人数也进来了。但在我看来,现在的北极星不是收入,而是人工智能的成功部署。

这需要做一些无法扩展的事情,那就是花时间和客户打交道,说,好吧,你在我们身上花了很多钱,这有效吗?这能提供投资回报吗?如果答案是肯定的,那很好。但很多时候,答案可能是,我们已经做了很多实验,这五个实验都没有成功,这两个实验,你能帮我们理解为什么吗?

是的,我认为公司内部最重要的沟通循环之一,尤其是在金融科技领域,我很好奇这如何转化为OpenAI,是在工程和客户声音之间。客户的声音首先被听到,比如,当你在Stripe时,你称自己为前线部署的销售人员,但实际上,你就像一个产品人员一样运营。所以我很好奇你如何整合客户的反馈并将其提供给研究团队,因为你们的产品非常技术化。

我明白在金融科技公司,产品技术性较低,这个循环需要非常紧密。但它实际上是如何在OpenAI中体现出来的,即接受客户反馈并通知,比如训练核心模型或顶层?

是的,简短的回答是,我们真的没有向研究人员提供大量的客户研究人员和客户洞察。研究人员正在尝试制作更智能的模型。他们知道建立一个更智能的模型需要做什么,他们有自己的评估等。但客户研究对于您提出的第二点非常重要,即模型顶层。那么我们的客户希望如何与模型交互?例如,他们希望输出处于某种受限模式吗?他们希望批量调用还是获得同步响应?他们有多关心延迟、吞吐量和成本?因此,这种反馈非常有价值。

现在的困难是核心模型正在以更快的速度改进,以至于它们几乎取代了整个其他层。

是的,但您与模型交互的方式仍然很重要,因为在下面,智能会变得更好。但如果智力很难建立,那么无论智力是处于五年级、七年级还是九年级的水平,我都无法真正使用它。

所以我认为,获得反馈的方法是聘请一支非常好奇的团队。因此,花时间与客户打交道的团队需要非常高效、技术娴熟,因为你做不到,他们只是,PM组织比上市组织要小。所以你必须有人……

我认为这是最难招聘的角色。我称他们为解决方案工程师,因为这不是一个很好的术语。他们不是产品人员,不是客户成功人员,也不是销售人员。解决方案很笨拙,但它有点正确……我认为两者兼而有之。

我认为,对于任何上市团队来说,要想真正出色地工作,你需要那些更偏向业务方面但又非常技术娴熟的人,以了解核心业务问题。但你还需要这些解决方案工程师,我们称他们为解决方案架构师,他们技术性更强,能够理解技术挑战。那么,你们这两个人,这种业务主管和技术主管,花了大量的时间与客户打交道,他们可以回到产品团队,说,好吧,这些是我们正在解决和没有解决的业务问题。这些是我们正在解决和没有解决的技术问题。如果这个团队在做他们的工作,那么产品团队就可以行动得更快。但我认为很多公司失败的地方在于他们从现场得到的反馈很差劲,他们不知道要为谁或什么而构建。现场的人们并不认为提供反馈是他们的工作。他们觉得,他们的工作是达到配额,这是另一回事。我们现在在 OpenAI 没有配额,我认为这非常重要。

你如何激励销售团队?

他们只是拿工资,没有奖金。他们只得到现金和股权,和 OpenAI 其他人一样得到报酬。

这就创造了一种完全不同的销售人员,不管是好是坏,它都会吸引到一种完全不同的销售人员。

我认为在这个阶段这实际上更好,因为我们还不确定剧本是什么。当市场尚未确定时,重要的是,市场尚未确定,流程也尚未确定。

比如,如果我说,这是你的剧本,我可以给你一个配额,雷克斯。这是你取胜的方法。如果你做这些事情,你可能会得到你的配额。但我现在不知道剧本说了什么,所以我需要愿意帮助制定剧本的人。如果我给他们设定配额,这些人将无法有效地做到这一点。因为如果我给他们设定配额,他们会做很多事情来优化他们的配额,而不是优化帮助我制定剧本。

我可以想象这是真的,尽管我不确定,可能是谷歌和微软……好吧,你们正在与微软合作,但谷歌和亚马逊,他们的销售人员有配额。

哦,100%。他们有配额。所以他们试图将人工智能强行塞入现有的配额系统,这对新技术来说并不适用。你希望你的销售代表处于发现学习模式,而不是早期的交易模式。五年后,也许这对全球的 GCP 和 AWS 来说会很好,但我认为它今天不起作用。

我认为你构建的东西越创新,配额就越不奏效。因为它的确定性较差。早期阶段与后期阶段,

我认为在早期阶段,你根本无法生存。

五年后你会有配额吗?

也许,可能,但今天不行。

我认为这是对的。

在建立市场营销组织方面还有其他有趣的经验吗?比如,你需要扩大到什么程度?你是否需要为上市组织招聘一大批人?

是的,我们会的,但你只能这么快地招聘。为了让你了解我们面临的规模,我们曾有 75 万张未答复的来电单。

OpenAI 现在有多少名员工?

我们今天大约有 1,200 名员工。go-to-market组织包括支持、销售、解决方案、开发者关系等,那是 200。对于我们这样规模的公司来说,这个比例实际上比你预期的要小。因为过去五年多来它主要是一家研究公司,因此我们规模很小。我们正在努力扩展业务,目前我们已经有200名员工。当我一年多前开始创业时,我们大约有10到15名员工。因此,尽管我们仍在高速增长,但这远远不足以满足我们的需求。

在招聘方面,我认为你需要弄清楚的是我的终端速度是多少,并且要非常自律地控制这个速度。因为如果你增长得太快,会破坏很多东西。早期公司的魔力之一就是创造一种像滚雪球一样发展的文化。如果你的团队正在做你希望他们做的活动,他们就会训练下一批员工做这些活动。如果你发展得太快,你就无法了解第二批、第三批和第四批员工的活动。因此,你要以一种你觉得舒服的方式,以能够自我复制的速度发展。

我认为,当你在一年内增长两倍或三倍以上时,这种情况就会开始改变。

文化非常重要。你必须非常自律地制定激励机制,无论是配额、雇佣对象,还是其他方面。

接下来,我们应该考虑客户和金融服务如何使用这些技术。你对今天正在探索的特定用例感到兴奋吗?

是的,我认为我们将看到的最大变化可能是在金融服务领域,即我之前谈到的多模式内容。因此,与模型进行更多的音频交互和语音交互。我认为我们还将开始看到模型承担更复杂的任务。在某些情况下,模型可能会一次思考几个小时。

在我们当前与技术的互动中,有很多事情是我们要求一些东西,然后希望它立即得到回报。我们对技术没有太多的耐心。但如果你开始把人工智能看作是工作中的助手或同事,你不会说,"嘿,雷克斯,你能帮我做一点关于西班牙衍生品市场的研究吗?你能在1.2秒内完成吗?" 这就像一件荒唐的事。而且,我不需要它在1.2秒内完成。随着这些模型的发展,我认为你会看到更多像模型一样的长期工作,特别是在金融服务领域,产出的卓越性非常重要。但在某些流程中,你获得的时间并不那么重要。

是的,绝对如此。这真的非常有趣。

感谢您向我们介绍各种不同的客户用例,也感谢您与我们分享您的空间。感谢您的邀请,

非常感谢。