今年是AI大模型应用落地的元年。其中通用大模型比拼技术和规模,而垂类大模型则是拼场景和效率。
半个月前各大美股科技巨头公布的财报中,已经证实了AI对现有业务实现了显著的增收和提效,并且宣布下一阶段还会持续加大投入,AI助手成为押注的重点,有望诞生“杀手级”的应用。
在本周刚举行的百度世界大会上,围绕“应用来了”的主题,百度创始人李彦宏分享了百度在AI方面的探索、努力、工具和找到的路径方法,发布了多款跨领域创新成果,涵盖了iRAG技术、无代码应用以及智能体探索等多个前沿阵地;同时,也介绍了他人如何在百度平台上创造出有价值成果,帮助更多人在AI时代找到自己的发展道路和方向。

打开网易新闻 查看更多图片

对于这次百度世界大会,舆论层产生了两种不同的看法。一种认为百度无疑是中国人工智能的“扛旗者”,不仅在AI技术上保持着领先的规模和生态优势,而且还在应用上深入布局了内容创作、教育、电商、医疗、汽车、农业等各个行业领域,有代表性的软件、硬件或者提供了解决方案,还打出了“我们迎来一个前所未有的只靠想法就能赚钱的时代”的口号。
另一种则认为,百度这次的发布还是有些平淡,并没有突破性的超级应用出现,比如类似Sora这样的文生视频多模态技术,或者本月初OpenAI推出的AI搜索,又或者具身智能体的高阶自动驾驶、人形机器人,以及一些颠覆性的AI消费电子,没有达到预期。
但不管观点如何,百度做人工智能的一个原则已经非常明确,那就是要做人人可触可及,并且能给自己带来价值的应用,AI时代每个人既是使用者,也是创作者和参与者,在技术平权下诞生的这些普惠性AI应用,可能远比一个超级应用更有意义。
正如李彦宏所提到的那个问题“过去一年整个行业都在焦虑,超级应用到底在哪里?”在他看来,人工智能很像是一次新的工业革命,这意味着它不是三五年就结束,不是一两年就出现超级应用,它更像是三五十年对于整个社会的方方面面一个非常彻底的重构。
商业新研社认为,万众期待的AI超级应用,当前还并不具备诞生的条件。一方面需要人工智能基础设施的完善,这有赖于AI技术的迭代以及代表企业的持续投入,比如ChatGPT就让生成式人工智能进入了新时代,才有这两年来的“智能涌现”,带动全球科技大厂进入了新一轮投入。另一方面用户对AI的认知和普及还未积累到一定规模,当前对人工智能技术和应用的探索,主要集中在行业人士或者高知人群中,普通民众对其了解仍然知之甚少,ChatGPT带来了一场人工智能的认知洗礼,但这远远不够,打破认知圈层、让人人触手可及才是破局的关键。
人工智能作为第四次工业革命的核心技术,正在释放科技革命和产业变革积蓄的巨大能量,但AI时代,做技术普惠下的众乐乐,或许远比独乐乐更实在。
1、从需求出发,百度揭开了AI应用的冰山一角
客观来说,此次百度世界大会,只能说是揭开了百度在各个领域布局AI应用的面纱,虽谈不上惊艳,但至少让人看到了未来AI能做什么。
而百度做AI的逻辑,是从应用需求出发,确定需要的模型,通过对技术的研发和迭代,提升解决行业问题的能力,以及解决这个问题后,逐步深入挖掘背后的商业价值。
李彦宏在会上首先分享了一个行业观察。“过去24个月对于大模型行业而言,最大的变化是‘大模型基本上消除了幻觉’,回答问题的准确性大大的提升了。让AI从一本正经的胡说八道变得可用,可被信赖。”
在行业中,基于大语言模型的文生图还有比较严重的幻觉,尤其是针对长城、东方明珠、金字塔、爱因斯坦、贝多芬等特定地点、物品和人物,常常会出现张冠李戴的幻觉问题,让生成的图片“一眼假”,极大地影响了AI的实用性。
消除大模型的幻觉,提高其准确性和可控性,也是AI应用爆发的基础。基于此,百度正式发布了检索增强文生图技术(iRAG),通过将百度搜索的海量图片资源与强大的基础模型深度融合,生成各种超真实的图像,极大地提高了AI生成图片的可用性。与传统文生图工具相比,iRAG以其“无幻觉、超真实、无成本、立等可取”的独特优势,引领图像生成技术迈向新高度。此外,在影视作品、漫画作品、连续画本、海报制作等应用场景中,iRAG都可以大幅降低创作成本。
在解决行业应用痛点的同时,百度还想到了如何进一步降低行业门槛。百度无代码工具“秒哒”的推出,成为一款不需要写代码就能实现任意想法的软件,门槛很低、人人可上手,涵盖无代码编程、多智能体协作以及文心大模型的多工具调用等特点,只需说说话,就能构建出各种应用。正如李彦宏所说,“百度不是要推出一个‘超级应用’,是要帮助更多人、更多企业打造出数百万‘超级有用’的应用”。
根据百度发布的数据,截至2024年11月初,百度文心大模型的日均调用量已突破15亿次,相比一年前首次披露的5000万次,增长了近30倍。这一增长反映出中国大模型技术应用的快速成熟,AI是真需求。
为了更好的实现AI技术的落地,百度还发布了首款AI眼镜,是全球首款搭载中文大模型的原生AI眼镜,具备第一视角拍摄、边走边问、识物百科、视听翻译、智能备忘等功能。该眼镜以文心大模型为技术底座,在模型使用效果和效率上实现了显著提升。
2、智能体的全球同频,百度的先手和决心
如果从人类信息技术变革的不同历史来看,其应用出现的样貌都是不一样的。比如在PC时期,是一个个的软件和网站,Windows是最主流的操作系统;而在移动时期,是一个个的App和被关注的账号,操作系统也变成了安卓和iOS的两强相争局面,软件和硬件都迎来了繁荣期。那么AI时代,其应用最主流的形态又是什么?
在此次百度世界大会上,李彦宏认为,AI应用最主要的形态将会是智能体(Agent)。他表示,随着大模型技术和能力的指数级跃迁,自然语言成为了这个时代最重要的编程语言,我们每一个人都能动手创造一个属于自己、也属于他人的AI应用,或者智能体。就像PC时代的网站,移动时代的自媒体账号,智能体可能会变成AI原生时代,内容、信息和服务的新载体。
为何如此坚定看好智能体?李彦宏解释道,一方面,做智能体的门槛足够低,在百度文心智能体平台上,甚至可以看到11岁的小学生在创造智能体。另一方面,智能体的天花板足够高,可以做出功能非常强大的应用,通过多个智能体的协作,可以解决更加复杂的问题。
事实上,李彦宏的这一判断,也得到了全球企业家和AI专家的认可。去年11月,比尔·盖茨在其个人网站上撰文表示:“智能体不仅会改变我们与计算机的互动方式,还将颠覆软件行业,带来自图形用户界面诞生以来最大的计算革命。”他称智能体将会像过去的Android、iOS和Windows一样,成为下一个平台。扎克伯格也预测,未来智能体的数量可能会达到数十亿,甚至超过全球人口总数。
在Gartner最新发布的2025年十大战略技术趋势中,Gartner预测到2028年至少有15%的日常工作决策将由代理型AI自主做出,而2024年这一比例为0%。同时,Gartner预测到2030年80%的人类将每天与智能机器人打交道,而这一比例目前还不到10%。
最近,OpenAI也准备发布一款能够独立执行任务的AI智能体,项目代号为“操作员”(Operator)。OpenAI计划在明年1月份将其作为研究预览版和开发者工具,首次向公众亮相。
基于百度文心大模型和百度生态的丰富应用场景,百度已经在智能体和产业应用两大方向上跑出商业通路。目前,文心智能体平台已吸引15万家企业、80万名开发者,每周都有上万个新的智能体在百度文心智能体平台上被创造出来。这些智能体通过百度新搜索这一最大的分发入口,日均分发量已超1000万。2025年,百度也将为智能体提供每天一个亿的流量分发支持。
对于百度而言,智能体的低门槛开发模式,为小型应用的涌现和生态的构建提供了肥沃的土壤,不仅为百度带来了丰富的流量入口,更通过精准的信息服务增强了用户的黏性和活跃度。而高天花板背后,随着AI技术的持续演进,智能体将不断突破自我,创造出更多的商业机会和成长空间,为百度在AI时代的竞争中奠定坚实基础。
3、结语
从满足需求到创造需求,就像智能手机的硬件革命,将互联网时代的核心用户场景从PC转移到了手机,掀起了多轮App应用开拓和迭代。而AI技术的升级,又迅速把我们拉入了智能时代,多模态生成、AI助手、智能硬件、机器人等“超能力”应用开始将社会的生产、生活逐渐形成新的绑定。
我们一直希望C端AI“杀手级”应用能够出现,但目前还需要继续提升基座模型的能力,进一步解决“AI幻觉”等问题。这就像我们刚刚学会走路,却被观众要求去打破百米跑的世界纪录,这显然不现实。因为只有当基础模型能力达到一定水平后,才会产生应用层面的创新,并形成产业级场景应用。
在当下这一阶段,恰恰需要更多耐心资本真正投入硬科技领域,促进这一轮科技的发展和迭代,这就如当年的PC互联网时代、移动互联网时代都经历过的那样。