OpenClaw 项目自今年发布以来,引发了大量关注,GitHub 平台上的星标一度飙升到约 20 万。在该项目成为开发者社区现象级爆火之后,也迅速引爆了另一场更大的行业冲突:平台控制与开源自由的博弈。

就在几天前,谷歌限制了部分开发者通过 OpenClaw 调用 Antigravity 平台后端服务的账户访问权限,理由是认为其“恶意使用”。

打开网易新闻 查看更多图片
(来源:谷歌)

谷歌 DeepMind 工程总监 Varun Mohan 迅速在社交媒体上做出解释:“我们发现恶意使用 Antigravity 后端的情况激增,严重影响了用户的服务质量。我们需要尽快找到一种方法,切断这些未按预期使用产品用户的访问权限。我们理解部分用户并不了解这种行为违反了我们的服务条款,我们会为他们提供恢复访问权限的途径,但由于资源有限,我们希望公平对待所有正常用户。”

打开网易新闻 查看更多图片
(来源:X)

相关限制措施引发了 OpenClaw 创始人 Peter Steinberger 的强烈不满,他马上吐槽谷歌这种“没有警告,也没有补救措施”的做法太严苛了,更是直言“看来我得停止对谷歌的支持了。”

打开网易新闻 查看更多图片
(来源:X)

当然,这些风波也并未影响 Peter 近期的活动,比如他参加了编程黑客马拉松 Codex Hackathon,还举办了专门围绕 OpenClaw 的活动 ClawCon。2 月 25 日,他接受了 OpenAI 的深度访谈,这是继几天前他宣布加入 OpenAI 后的首次亮相。

在这次访谈中,Peter 谈到了 OpenClaw 的开源之旅,如何使用 Codex 进行开发,以及 OpenClaw 滥用和安全问题等。一个“顿悟时刻”来源于 Peter 将 AI 智能体接入 WhatsApp 后,发送一条语音消息后的回复。他坦言,当第一次看到模型自己用 FFmpeg 转格式、调用 API 时,意识到某种东西发生了改变,更是直言“我鸡皮疙瘩都起来了”。

打开网易新闻 查看更多图片
(来源:OpenAI)

以下是访谈实录,DeepTech 在不改变原意情况下做了适度删减和编辑:

13 年创业后,他被 AI 重新点燃

主持人:Peter,欢迎来到 OpenAI。OpenClaw 项目可谓是火爆全球,并登上全球各大网站和报刊,这可不常见,恭喜你取得成功。你现在感觉怎么样?

Peter:坦白说,各方面都有点信息过载让我有些不适应。我最初启动这个项目是想激励大家,这种形式很有意思,我感到很自豪。

主持人:太了不起了。你这一周都在旧金山,参加了一些活动,比如编程黑客马拉松 Codex Hackathon,还举办了专门围绕 OpenClaw 的活动 ClawCon。

Peter:其实这是社区自发创建的活动。当时大家都说“我们得来线下聚一聚”,所以我建了一个用于组织聚会的 Discord 频道。结果我到现场一看,来了差不多 1,000 人。他们的创造力、多样性、热情都让我震撼。

那一刻我意识到,原来自己做出了很神奇的东西:这个项目几周前还根本不存在,现在却有成千上万人在应用它,还专程来见我。下周我们还会有 300 多人参与,而且这还远不是全部。我意识到,现在 OpenClaw 确实已经火遍全球了。

主持人:没错,能影响到不同文化,真的很厉害。那你和社区的交流怎么样?你花了很多时间和社区成员在一起,其中一些人也参与到了你的项目里。

Peter:感觉很特别。很多人喜欢它,也有很多期待,希望它最终成为一个非常成熟的产品。但对我来说,很长一段时间它只是我的小小游乐场。今年我一直都在惊叹它的可能性。如果你是个 builder,现在真的是一个最好的时代。

主持人:你觉得在当下这个时代,真正动手去创造、做一名 builder,最有趣的地方在哪里?现在这个时代很特别,整个工具链都在变,开发者的定义也在变, 似乎任何人都能做出任何东西。

Peter:我刚接触这项新技术时,每次都能感觉到多巴胺在飙升。以前我写很多代码,做对一件事的概率大概只有 30% 到 40%。而现在的体验真的颠覆认知,因为我突然意识到:我可以构建任何东西。当然时间依然有限,软件开发还是充满挑战,但速度大大提升了。

主持人:我同意。我们往回倒几年吧,我第一次知道你的工作应该是 2011 或 2012 年,你做了 PSPDFKit。在外人看来,你实现了每个开发者的梦想:发现一个问题,做出很棒的解决方案,并创办公司、扩张,然后出售。我相信这段历程绝对没那么容易。

Peter:确实是这样。我不是某天醒来,突然拍脑门决定“要做一个 PDF 框架”。这其实是一连串蝴蝶效应:从参加诺基亚开发者大会,到朋友有相关需求,再到办理美国签证被延期……这些因素推动着我创办了公司。

主持人:有意思的是,卖掉公司之后,你休息了几年。那最终是什么让你重新出发的?

Peter:在高强度运转 13 年后,我当时彻底精疲力尽了。经营一家公司并不是一件容易的事情,做创始人也很考验各方面的能力。关键是,第一次创业时,我并不懂得如何缓解压力。所以整个人燃得太猛,必须停下来减压。

但我仍然一直关注技术。我看到了早期的 ChatGPT 之类的技术,觉得挺酷,但没有特别打动我的地方。因为新技术必须亲自上手体验,仅是停留在看文章阶段是感受不到它真正力量的。直到我准备好、内心也有冲动了,我才想要再做点东西。

和“做什么”相比,我更清楚“不想做什么”:我不想再碰苹果生态了,因为做了太久,世界也已经向前走了。这意味着必须得走出舒适圈重新开始,从一个领域专家转到另一个领域,哪怕是术语都很难甚至让人感到痛苦——明明有一大堆做产品的经验,却没法直接拿来就用。然后,我就想来看看这个 AI 到底是什么。

真正震撼我的那一刻,是我把之前没做完、烂尾的项目捡起来。开发者都喜欢有新想法、开新项目,但最难的是把它做完。但这个项目我想继续做,也想重写一遍。

于是我把所有内容整理成一个巨大的 Markdown 文件,大概 1MB 多,然后我把它拖进当时的 Gemini Studio 2.5,让它重写。它返回了代码,我直接放进 Claude Code,然后就开始构建了。我接着做别的事,它就在屏幕上连续跑了好几个小时。后来,它说自己“已经 100% 可用于生产”。我试了一下,就崩了。

之后,我找了一个我少数真的会用的 MCP 工具 Playwright,对它说:把日志系统做出来,顺便检查一下问题。一小时后,它真的跑通了,还展示了效果。尽管代码写得很粗糙,但对我来说,就是那一刻我彻底被点醒了。毫不夸张地说,我“鸡皮疙瘩都起来了”,满脑子都是那些可能性。那段时间我几乎睡不着,因为脑海里炸开了无数我以前想做却做不到的东西。然后,我就彻底陷进去了。

我没写这段逻辑,它却完成了

主持人:很多人觉得 OpenClaw 是一夜爆红,但我觉得你故事里最迷人的地方在于,这其实是你过去 9、10 个月几十个项目沉淀的结果。看你的 GitHub,有 40 多个项目,其中一半都用在了现在这个作品里。我也非常想了解你的这段历程,这些想法和项目是怎么一步步汇集成 OpenClaw 的?

Peter:实际上,这并不是一开始就有完整的规划,而是大部分在探索中慢慢完成的。我想要某些还未拥有的功能,便提示 AI 把它们做出来。我先是做了大量实验直到呈现出原型,那一刻我才真正开窍:这东西太酷了。我用一小时内做出第一个原型,直接把想法变成现实。然后,我稍微转移了一下注意力在其他项目上,因为我当时认为大公司肯定会做类似的东西。到去年 11 月,我做出了几个版本,但效果还没有达到很理想。

真正让我确信的,是在摩洛哥马拉喀什的短途旅行。当时网络信号不好,但 AI 助手的好用程度远超我预期。WhatsApp 在任何地方都能用,我需要拍照翻译、查电脑里的资料。我分享给朋友,他们也想要。我还劝他们说:你们别用,都还没好呢。但这正是产品契合市场的一种信号:如果你的朋友都抢着用一款产品,哪怕你根本没为他们特别设计,而只是给技术同行用的,那就可以判断这事基本成了。

还有个让我顿悟的时刻,我随手发了一条语音消息,但并没有代码,模型竟然回复了。我突然想到:我根本没写这部分逻辑,按常理推断这根本跑不起来。这一下子激发了我的好奇心,我就问模型是怎么做到的,模型说:“你发了一条消息,但只是个没有后缀的文件,我分析了文件头,发现是 Opus 音频格式。我就在电脑上用 FFmpeg 转了格式做转录,后来又发现没装 Whisper。于是我找了一圈,发现了 OpenAI API key,再用 cURL 调用转录接口,最终拿到了文本。”

这让我见识到这些模型解决问题的强大能力。从初始目标看,我们开发这些技术的目标更好地辅助完成一些事务,而它展现出来的能力比预期的中更好。这种能力与真正的全能开发者是触类旁通的:首先得是名优秀的问题解决者,而这刚好和 AI 的能力对上了。

打开网易新闻 查看更多图片
图丨OpenClaw 工作原理(来源:https://github.com/openclaw/op)

这太不可思议了。这就是给 AI 工具、给电脑完整权限的力量,它们能自己想出解决方案,哪怕你完全没写过相关代码。我当时心想:天呐,它还用了我的 API key,太疯狂了吧。后来我又一想,不对,把它放在环境中的作用就应该是这样的。我的聊天机器人就在同一个环境里,当然能调用,我就是故意这么设计的。这不是坏事,而是我想要的效果。

我刚把它放出来时也很好奇,总在想:这会带我走到哪一步?但我也不断有“原来如此”的时刻:你给它的权限越多、工具和技能越多,它就越惊艳。你甚至可以给它加一个 Vercel skill,让它建网站、做应用,需要部署时它还能自己搞定。它还会用你的 API key 把 AI 功能加进去。反过来也一样,你可以直接生成链接分享给朋友。这是一种思维层面的升级,而不只是“我自己会写代码”。

去年 11 月和 12 月我完全沉迷在这个项目中,虽然当时还在做别的项目,但大部分时间都花在这个项目上面。尽管前期在网络平台上反响平平,可我每次给朋友看,他们都想要,我就说:还没好呢。然后我就想:我怎么做才能让大家感受到它有多酷?

所以,我建了个 Discord,把聊天机器人放进去,没有任何安全防护——因为还在极早期,连沙箱都没有,我就是完全开放开发。现在的 OpenClaw 就是这么来的,边调试边让模型参与,问它:你看到这个工具调用了吗?如果它回答没有,那我就会让它检查一下自己的源码,然后做所有的事情。当人们看到它,他们就理解了。

主持人:你在 Discord 里给了它哪些权限?比如你所有的推文?它现在掌握了你的哪些信息?

Peter:我的推文很多,记忆相关的内容也不少。不过我很快就开始监控,因为提示词部分是公开的。但新一代模型表现真的很好。我有一个名为 mysoul.md 的保密文件,定义了我的价值观、模型该如何运作、思考,什么对我是重要的。

很多人都想要这套配置,也有人进来尝试提示词注入,贴大段代码试探,但模型直接回复“我不读这个”,甚至还会调侃对方,但我还是不太放心。项目发布后第一天晚上就引发了巨大关注。我把它关掉睡觉,10 个小时后,当我醒来一看,Discord 里竟然有 800 条消息,而我的 Agent 在一条条进行回复。

我吓坏了,赶紧关掉,冷静下来逐条查看。最后发现它没做任何恶意的事,也没泄露我的系统提示。我不是说不可能,提示词注入确实存在,但没大家想的那么容易。总体来说,它的表现符合预期。我犯的一个大错是:我把服务关了,但忘了我设置了 LaunchDaemons(注:这是 macOS 系统中用于管理系统级守护进程的机制)。

它的作用就是进程崩了或被杀掉后自动重启,以保证服务稳定。我做 OpenClaw 就是为了稳定可靠,但当时完全忘了这一点。我杀了进程,结果 5 秒后它又重启了,而我已经睡了。

现在不会这样了,我也加了沙箱,模型还很骄傲地把 Mac Studio 称作“城堡”。我把它放进了一个轻量容器里,然后问它:你能访问这个网站吗?它回复:“里面连 cURL 都没有。”我说:“你能发挥创造力试试看吗?”于是,它就造了一个 lobster cURL,自己用 TCP socket 写了个简易版 cURL 去访问网站,甚至还调用了 C 编译器。这太疯狂了,它的应变能力太强了。

主持人:当然你也遇到了一些挑战。很多人很关注安全问题,觉得你从第一天就该把一切做得非常稳健,但你这只是个开源实验项目。

Peter:是啊,每次有人问我:你能把 CEO、HR 或者团队成员拉进来吗?我就想笑。我基本上就是在咖啡馆里自己瞎折腾。但你也看到了区别,对吧?这是任何一个人类单靠自己都不可能做到的。我现在有维护者,也收到了代码合并请求(PR,pull requests),但本质上就算是一年前,这也不可能实现。没有任何模型能支持一个人做出这种东西。大家甚至都没意识到这一点。

主持人:很多开发者肯定和我一样好奇:Peter 怎么能这么高产?我今早又看了一眼你的 GitHub,过去一年你有近 9 万次提交,参与了 120 多个项目。还有个有意思的点:去年年初活跃度还一般,到 10、11 月突然暴增变成深绿色。我很好奇,这中间发生了什么?

Peter:改变在于换上了 Codex。我觉得每一代模型都在变强,但不只是模型,调度框架也在变好,我对使用方式和工作流的理解也在提升。有些人用传统方式写代码,他们尝试 AI 并把它叫做“vibe coding”,但我觉得这个词并不好。这是一项需要时间慢慢磨练的技能,就像你拿起吉他,不可能第一天就弹好,所以体验会很差。

但如果你用玩乐的心态去学,去适应,慢慢就会有感觉:知道怎么写提示词,大概要多久。如果耗时太长,我就会反思:是不是我哪里错了?是架构错了、思路错了,还是别的问题?就像写代码一样,你对目标群体有感知,自然就能融入架构,而不是和系统对抗。

主持人:如果大家想变得像你一样,你现在的 Codex 工作流是怎样的?你说过:大多数人把工作流搞得太复杂了。

Peter:其实我一开始也把配置弄复杂了。从接触这项技术到真正高效使用,确实花了一段时间。很多人卡在搞超级花哨的工作流上,那并不会真正提升效率,只是感觉上更高效。

我后来写了一篇很有争议的文章:就把它当成对话。模型不只是结对编程伙伴,它是不一样的存在。我直接说我想要什么,而且总会问模型:你有什么问题吗?出于一些原因模型总会有问题,但默认训练它只是解决问题,然后自己做假设,但这些假设不一定是最好的,尤其是当你的代码库很新、没有大量旧代码时。

“你有什么问题吗”是个非常重要的问题。大家没意识到,模型通常是从零开始的,它不像我们一样学习,每次新会话都相当于“对这个代码库一无所知”,只能搜到你让它看的局部内容,试着解决问题,通常看不到全局。

Codex 在全局视野上就强很多。我用的方式非常简单,甚至用不上工作树(Worktree),基本就是检出 1 到 10 个目录,以保持简单能让我更专注于真正的问题。我不想处理复杂的分支管理,只专注不同问题。项目变大后,同时做互不冲突的事会轻松很多。

主持人:你用 Codex 开发 OpenClaw,它改变了你的工作方式吗?

Peter:嗯,我尝试喜欢所有工具。但我对 Codex 的信任度是最高的,它能准确做出我想要的东西,能用的功能非常多。我觉得大家还没意识到,GPT-5.2 又是一次巨大的飞跃。我到现在还经常被惊艳到,我们可以放手创造了,太不可思议了。大家真的应该去试试。

主持人:你还曾说过,你现在甚至都不怎么读代码了,这带来了哪些改变?

Peter:大部分代码都是很枯燥的,把一种数据格式转成另一种,最终呈现给用户。所以大部分代码我都能大致理解它在写什么,看一眼流程就够了。我脑海里的模型和它实际生成的基本一致。

我以前带过团队,手下有很多工程师,你也必须接受:他们不会写出和你一模一样的代码。最终你要优化代码库,让 Agent 发挥最大作用,这和让人发挥最佳效果不完全一样。这也意味着要接受:代码可能不是你理想中的写法,但我可以引导模型。很多时候结构方式有很多种,通常无所谓。如果出现性能问题,再针对性优化就行。

正如刚刚我们谈到的,我对代码的理解也改变了做开源的方式,现在 OpenClaw 已经有接近 2,000 个 PR。在 AI 出现之前,你必须读完所有 PR,因为那是价值所在。但现在我把它们叫作“提示词请求”而不是传统的合并请求,因为 PR 背后的想法和意图,比代码本身更重要。

通常来说,由于我对模型的信任度,远高于一个我从没听过、也没交流过的外部贡献者,所以我还是会稍微做代码审查。但每当我看到一个 PR,我问模型的第一个问题是:你理解这个 PR 的意图吗?我其实不关心代码,我关心你想解决什么问题。

这更像是一个问题:这是我的解决方案尝试。但很多人还不太会用好 Agent,常常只给出局部解决方案,因为脑子里没有完整系统。最难的是,这个新功能怎么融入我的整个大系统?这个小修复是不是正确的修复?还是只是表面修补,底层有架构问题?

只要你用对话的方式沟通,模型其实非常擅长。我会说:现在来构建这个,先告诉我:意图是什么,这是最优解吗?有时模型说是,但大部分时候会说不是。然后我就会一起探索,最好的修复是什么?这是架构问题,还是消息机制的问题?会不会只影响 WhatsApp,还是也影响别的工具?我们应该用更通用的方式做资源处理吗?这是个新功能,我们真的需要吗?

这些讨论有时会持续 10 到 15 分钟。我习惯用语音,就像和非常聪明的同事聊天一样,实际上用语音比打字省 token。当我得到满意的答案之后,我就用一个斜杠命令,比如 /len pr,它会完整执行:创建分支、修改、合并 PR。我想创建一个社区,所以我尽量给贡献者署名,哪怕整个过程比我自己写还慢,但我非常感激大家愿意参与进来。

未来不会被 AI 淘汰,但会被懂得用好 AI 的人甩开

主持人:对于围绕着项目的这些贡献者,你对 OpenClaw 的未来愿景是什么?你会把自己当作个人 Agent 领域的行业标杆吗?未来可能全球几十亿人都能用得上这类产品。

Peter:我想找到一个平衡点:即便是我妈妈也会安装,同时又好玩、可黑客化,但显然这仍然充满挑战。大多数开源项目就是下载安装包,但很长一段时间里,我的默认安装方式是 git clone、build、run,源码就在磁盘中。Agent 就在源码里,也能感知自己的源码。如果你不喜欢什么地方,给 Agent 一句提示,它就能自己修改,如果实现这会是真正的自修改软件。

所以,很多从没给我提过 PR 的人,提的其实都是提示词请求,因为他们不太懂如何构建持久化软件。同时,整个安全行业都在盯着它,这挺有意思,同时也有点让人沮丧,因为他们忽略了很多细节。比如我做的 Web 界面,本来是给自己用的。最初是为了调试,后来美化了一下,但本意只是在自己的可信网络里访问。但因为它也可以像黑客乐园一样玩,所以提供了修改的选项。

有些人会用 Ngrok 或者代理。我之所以不做限制是有原因的,但现在有人把它放到公开网络上,哪怕我在安全文档里反复强调:别这么做,这不是它的设计用途。然后安全人士就会指出,它没有登录限制,没有公网环境必需的各种防护。

我想说的是,我本来就不是为这个设计的。但因为它可配置,就被认为是最高级安全风险(CVSS 10.0),我对此也有些困扰。但现在我已经请了安全专家,我意识到,我没法阻止大家用在非设计场景里。我现在的重点是支持这些使用方式,帮大家别误伤自己。这就是开源的魅力:人们可以接纳它,想出你根本没想到的用法,这很美妙。

主持人:好的接下来我们从更宏观的视野来聊聊,不仅是 OpenClaw 这个项目。我们这周和很多开发者聊过,大家都在问:Peter 怎么能想出这么多好点子?创造力为什么这么强?

Peter:我不知道有没有标准答案,可能就是好奇心驱动,也可能是意识到现在做东西变简单了。就算我找到一个开源项目能解决 70% 的问题,我也会自己做。这在一年前完全不可能,但现在只要提示 AI,代码就在副屏幕上跑起来,Codex 就能工作。

主持人:很多开发者和工程师还没真正接受 Codex 和 agentic 工具。你对他们有什么建议?尤其是刚开始接触时,是否需要重新思考工作方式和工作流?

Peter:我的第一条建议永远是:用玩乐的心态去接触,做一件你一直想做的事。我总说,未来不会被 AI 淘汰,但会被懂得用好 AI 的人甩开。但如果你的内核是“我想创造、我想解决问题”,如果你有强大的自驱力、足够聪明,你永远都会很好。对拥抱这些工具的创作者来说,这是最好的时代,带着好奇心塑造未来,把任何想法变成现实。

主持人:我觉得以此结尾非常棒,非常期待你接下来的作品。

参考资料:

https://www.youtube.com/watch?v=9jgcT0Fqt7U

https://x.com/steipete/status/2025743825126273066

https://x.com/_mohansolo/status/2025766889205739899

运营/排版:何晨龙