打开网易新闻 查看更多图片

4月16日上午,李彦宏在百度AI开发者大会上重点介绍了三款产品——

AgentBuilder、AppBuilder、ModelBuilder。

这场大会虽然叫开发者大会,这三款产品看起来也都是面向开发者的,但事实上整场发布会,李彦宏都在极力宣传一个观点:

AI工具的帮助下,任何一个普通人都可以是开发者

这句话其实有两层含义。首先,由于“编程”这项技能的熟练成本较高,绝大多数普通人被拦在门外,大量富有创意的想法受困于现实无法实现,天然阻止了众多应用的出现。

AI工具的出现使得自然语言编程成为可能,极大降低了应用的开发成本。

其次,同样是由于开发者数量较少,互联网上的绝大多数信息都以散点状出现在用户面前。

举个简单的例子,硅基君准备去上海玩一个礼拜现在需要做攻略,但搜索航班、餐厅、景点、酒店就需要多次重复进行搜索、查阅、记录的工作。

但如果有个专门做旅游攻略和行程安排的AI Agent,这个过程不就简单多了吗?

还是这个例子,如果我们直接用百度搜索“上海旅游攻略”,出现的大概率是旅行社或者携程美团之类的产品页面,用户想要更详细的信息还是得反复进行搜索查阅,效率极低。

但如果出现的是一个类似文心一言的对话窗口,无论是了解关于上海的一切信息,或者是旅游预定服务都可以在一个窗口完成,显然更加便利。

这些旅行社为什么不做一个这样的页面?同样也是由于开发成本过高。

现在百度想解决的就是这样一个问题:

人人都可以低成本的开发属于自己的应用。

硅基君尝试了一下百度推出的三款产品,AgentBuilder、AppBuilder、ModelBuilder,发现真的挺方便。

AgentBuilder

首先是AgentBuilder,李彦宏表示“ 智能体可能是未来离每个人最近、最主流的大模型使用方式,基于强大的基础模型,智能体可以批量生成,应用在各种各样的场景 ”。

所谓的智能体,当下更像是AI助手。

进入百度文心智能体平台,我们可以看到各种类型的现成智能体。硅基君简单翻了一下,常见的使用场景基本都被覆盖。

据李彦宏所说:“ (百度平台中)已经有3万多个智能体被创建、5万多名开发者和上万家企业入驻 ”。

工作智能体有“Canva设计助手”“TreeMind树图”“AI搜索助手”等;生活学习上文心智能体也有不少,像哄孩子用的“熊猫天天AI故事”“读书专家”等等,让用户生活更加便利。

这其实就很接近OpenAI的GPT store了。

但毕竟千人千面,如果用户有自己特殊的需求,百度文心智能体也提供了非常简便的制作方法,用户可以用自然语言(说人话)来建立智能体。

具体来看看是怎么操作的。

五一快到了,硅基君想出门旅游,但宅了20多年了,对旅游一窍不通,文心智能体就能帮忙。

点击左侧的“创建智能体”,有代码能力的用户可以选择低代码模式,但大部分情况用户使用“零代码”就可以满足需求了。

打开网易新闻 查看更多图片

接下来硅基君给智能体起名五一旅游助手,并且简单写了一下它的设定:你是一个旅游专家,对中国各地的名胜古迹、人文风光如数家珍。而且你能够随时查询各地景点的门票费用。

之后进入文心智能体创建的主页,有三个主要部分组成,分别是基础配置、高级配置和预览调优。

其实到这一步,文心智能体创建的差不多了,因为智能体的核心功能“指令(prompts)”部分,文心一言已经根据你的设定进行扩展。

硅基君简单看了一下,这指令写的比一般没培训过的人写得要好。

打开网易新闻 查看更多图片

在高级设定里,用户可以添加一些“代码生成器”“画一画”之类的工具,让智能体能力更强。

和指令一样,文心智能体会根据你的设定,为你推荐相关的工具。比如推荐硅基君的五一旅游助手,可以搭载“酒店查询”“景点榜单推荐”“景点门票”等。

最后是实战环节,“故宫的开放时间”这样细节的问题可以问文心智能体。连“只有5000块怎么出国旅游”这样刁钻的问题,文心智能体也回答的有板有眼。还提供了很多链接素材,给用户提供更多内容。

到这里还没完,硅基君想让自己的智能体更加个性化。于是上传了李白的图片作为五一旅游助手的数字形象,而且为了丰富智能体的数据,硅基君还上传了一些上海旅游的资料,先让五一旅游智能助手成为上海本地通。

打开网易新闻 查看更多图片

简单评价下,智能体虽然不是百度独家的,OpenAI也推出过GPTs。但百度的文心智能体是真的方便,智能体的核心功能指令,百度可以自动生成,而且会根据用户需求提供相关工具。

极端情况下,用户给智能体起个名字,写一句话设定,点几下鼠标,一个可用的智能体就诞生了。

AppBuilder

接下来看看百度AppBuilder,这款产品可以大幅降低AI原生应用开发门槛,开发者不写一行代码,就可以用自然语言开发出一个AI原生应用。

有多方便呢,用李彦宏的话来说“ 最快只需要三步,开发者就可以用自然语言开发出一个AI原生应用 ”。

三步,是不是太夸张了?

AppBuilder相较于AgentBuilder,很多地方有相似之处,但最大的特点在于有更多专业的组件可以使用,比如语音识别、手写文字识别,还支持第三方api接口,像快递查询、热门短视频等。

比如硅基君想做一个拍照解题的应用,没有文心一言之前,硅基君可能需要编程,调用百度飞桨的paddleocr库等,识别完成后还要联网搜索。而AppBuilder把文字识别和网络搜索功能都集合在一起。

硅基君告诉百度AppBuilder,“我想做 一个可以拍题解答的应用”。AppBuilder思考了一下后,就做了一个应用框架。

接下来,硅基君配置了一下所需要的模型和组件。关键组件“手写识别”“通用文字识别”都是AI自动推荐的,不需要用户一个个找。模型方面,主要可以用到百度ERNIE3.5或4.0,不同模型的能力、上下文长度和价格有所区别。

应用就这么完成了!?

硅基君随便百度了一道题,给AppBuilder做一下。

对于纯文 字题,AI识别完整,并且答案正确,还科普了一下等差数列。在做几何题的时候,AI对图形识别不是很好,但根据描述给出了建议。也可以理解,毕竟只用了文字识别组件,图像识别不到也正常。

如果你有api接口,那么你还能将此应用到百度的AI中。比如李彦宏展示了AI如何引用大学的接口,从而让学生可以更方便的查询课表、饭卡余额。

虽然现在有各种库可以方便实现不少功能,但依然要编程基础。AppBuilder集合了百度的各种组件,解决了这一问题。百度飞浆有很多功能,希望到时候可以共同加入。

ModelBuilder

最后是百度发布的ModelBuilder,一款更适合专业开发者使用的工具。

我们都知道,对于现在的AI来说,背后的大模型是最重要的。但从零训练一个成本太高,微调有技术难度,更别说对硅基君这样的小白,怎么在huggingface上找到模型都要花点时间。

ModelBuilder正在解决这一问题。ModelBuilder提供了“大模型直接调用”“大模型调优训练”“Prompt工程”“插件应用”四个场景。

在大模型直接调用模式中,ModelBuilder提供了77个模型供用户选择。除了百度自己的大模型,目前市面上比较流行的开源大模型基本都有,像Mistral-7B、Llama2-7B、Gemma-7B等。

进入模型详情页,用户可以看到模型的基准分、技术亮点等。哪些模型更适合问答、哪些模型更适合角色扮演都写得很详细。

在模型微调、Prompt工程上,ModelBuilder还提供了详细流程。

用李彦宏话来说:“ ModelBuilder可以根据开发者的需求定制任意尺寸的模型,并根据细分场景对模型进一步精调,这样就能达到更好的效果 ”。

比如李彦宏展示了经过调整后的模型,如何好的批改作文,为学生提供建议。

第一步:创建数据集。模型精调的效果很大程度依赖我们的数据质量。 ModelBuilder提供了数据清洗、数据标注、数据增强的工作流。

第二步,数据搜集完毕后,在ModelBuilder上选择一个基础模型进行微调,微调的参数配置平台都会提供建议,可以说是用AI训练AI?

在Prompts工程上,开发者可以学习百度精选的Prompts。硅基君使用了ModelBuilder的五子棋Prompts,和百度大模型玩了一局酣畅淋漓的五子棋。

虽然相较于AgentBuilder、AppBuilder,ModelBuilder上手有些难度,但其可视化的页面,清晰的流程,的确比纯代码页面方便了不少。

李彦宏曾经发出宣言:“ 你只要会说话,就可以成为一名开发者,用自己的创造力改变世界 ”。

使用完三款产品,硅基君感觉这一天并不远了。

全文完。

作者:董道力

编辑:张泽一

视觉设计:疏睿

责任编辑:张泽一

关于「新硅NewGeek」:我们以AI为圆心,追踪科技领域的方方面面,努力用最简单的方式阐述技术是如何改变世界。敬请关注。