量子位

量子位

关注
17.6万粉丝
0关注
9.2万被推荐

《量子位》官方网易号

4枚勋章

2次获得编辑精选

追踪人工智能动态
IP属地:河北
更多信息


  • 6月23日,百度AI开放日举行,百度智能代码助手文心快码迎来重大突破。 百度副总裁陈洋现场发布了文心快码独立AI原生开发环境工具——Comate AI IDE,是行业首个多模态、多智能体协同的AI IDE,首创设计稿一键转代码。 模型已接入文心4.0 X1 Turbo,开箱即用,为国内企业和开发者打造高效、智能、安全可靠的AI IDE。
    行业密探

  • 现有的语言大模型(LLMs)在复杂指令下的理解和执行能力仍需提升。 腾讯优图(UTU)研究团队提出一种系统性方法——激励推理(Incentivizing Reasoning ),来提升LLM处理复杂指令的能力。 结果显示,该方法能够有效提升大多数LLM进行复杂
    行业密探
  • 冠军队独享200w?这波是冲大学生来的,超千支队伍已组队报名

    39分钟前
    图片
  • 曝苹果拟收购Perplexity AI,人才一并拿走

    53分钟前
    图片

  • 弗吉尼亚大学Anton Korinek教授表示,AGI(通用人工智能)将在2-5年内实现,一旦AGI到来,AI将取代大部分人类工作,可能会对全球经济产生深远影响。 以下是他的深度访谈: 主持人: 今天我们请到了弗吉尼亚大学经济学教授Anton Korinek,他专注于AI对经济的影响。教授,您提出AGI(人工通用智能)可能在2-5年内到来,这个观点引发了广泛讨论。能否和我们分享一下,AGI的到来将如何影响我们的市场? Korinek: AGI的到来意味着AI将能取代大多数人类工作,除了简单的机械工作,还包括许多需要认知和创造力的任务。传统的工资收入模式可能会面临挑战,很多行业将受到AI技术的影响。比如,医生、律师、工程师等高技能职业,也会被AI部分或完全替代。 主持人: 听起来确实令人担忧。那么,收入问题如何解决呢?您提到了全民基本收入(UBI)的概念,这似乎是一个较为激进的方案,您认为这真的能解决问题吗? Korinek: 随着AI的普及,我们必须重新思考财富分配体系。AI有潜力大规模创造财富,但如何确保社会大众能从中受益,将是一个挑战。因此,像全民基本收入这样的措施逐渐成为一个可能之选,它能够确保社会大多数人即使不再依赖传统的劳动方式,仍能维持体面的生活。 主持人: 这么说,AGI可能会带来大量失业和社会不稳定,您认为如果不采取有效措施,社会将面临哪些风险? Korinek: 如果没有适当的收入再分配机制,失业率可能上升,社会动荡的风险会增大,甚至可能对现有经济体系产生冲击。假设许多人失去工作,而社会保障体系没有及时适应这些变化,社会矛盾可能会加剧。 主持人: 这确实是一个巨大的挑战。那么,面对AI的快速发展,我们应该如何准备呢?您提到,未来最重要的技能将是“与AI共生”,而不是单纯与其竞争,能否具体说明? Korinek: 未来的竞争力确实会发生变化。我们不能再将AI视为竞争对手,而应该学会如何将其作为“助力器”来提高工作效率。无论是学生、员工,还是企业领导者,掌握与AI协作的技能,将是发展的关键。在教育领域,我们应当培养学生利用AI的能力,而不是让他们单纯地与AI竞争。 主持人: 那么,全球合作在这个过程中扮演着什么角色呢?我们是否需要一个全球性的AI治理框架? Korinek: 全球合作至关重要。AI技术已经进入全球竞争的阶段,为了确保AI技术的发展不带来负面影响,各国应加强沟通与合作,共同制定全球性的AI治理规则,推动AI的安全和可持续发展。
    行业密探

  • 只在数学数据上进行训练,却在物理、化学、生物等领域取得了惊人的突破? 一项新的强化学习算法——CPGD(Clipped Policy Gradient Optimization with Policy Drift),正打破传统模型的训练瓶颈,它甚至超越了闭源模型o1! 来自上海创智学院和上海AI Lab的团队,在多个基准测试中,基于CPGD的MM-Eureka-CPGD-7B模型,不仅在数学推理上提升了21.8%,在物理、化学和生物等学科领域也表现出了前所未有的泛化能力。令人惊讶的是,尽管这些模型仅在数学数据上经过强化学习训练,它们在其他学科的表现仍然超过了o1,展现了出色的跨学科推理能力。 CPGD算法最大的亮点,不仅仅是性能提升,它还成功解决了强化学习训练中的稳定性问题。传统强化学习方法常面临训练崩溃、梯度不稳定等问题,而CPGD通过创新的策略比值对数化处理和引入策略漂移项,有效提升了训练的稳定性。 [图片] 只训练数学,却在物理化学生物战胜o1!新强化学习算法性能显著提升
    行业密探
  • 👀 小米也要发AI眼镜了?近十款AI眼镜在过去一个月内密集登场 —— 更轻的机身、更长的续航、更时尚的外观,正从实验室走向日常场景。「面向下一个时代的个人智能设备」是否近在咫尺?
    👓 周三下午3点,欢迎来 #量子位AI沙龙# 与影目科技、李未可科技、小米、百度智能云一起来聊聊 #AI眼镜# 距离「全民标配」还有多远!~ 👉 速戳报名:https://hdxu.cn/1elmk
    行业密探

  • 上海AI Lab与上交团队提出TELLME方法,摒弃传统依赖外部“黑盒”监控模块的方式,创新性地通过“表征解耦”提升大模型的内在透明度。 TELLME方法的核心在于,通过对比学习和双重约束微调,直接在模型的表征空间内实现不同行为(特别是安全与不安全行为)之间的清晰分离。 该方法有效提高了模型的透明度和可监控性,实验验证表明,TELLME在多个任务中的准确率显著提高,在安全风险识别方面,提升了22.3%的监控准确率。 提升大模型内在透明度:无需外部模块实现高效监控与自发安全增强
    行业密探
  • 马斯克Robotaxi今日上路:画饼十年终兑现!团队C位华人引关注

    4小时前
    图片

  • 动物跳水比赛一次性看个够,参赛选手有河马、猪、各种猫狗、猩猩、驴、一群鸭子... 该系列视频由海螺AI生成,提示词也相对简单—— Televised footage of [a cat] is doing an acrobatic dive into a swimming pool at the olympics, from a [10m] high diving board, flips and spins. 将括号内容替换成想要的动物,以及改一下跳台高度就行。 海螺AI最近发布了Hailuo 02视频模型, 并提高了会员费用。有网友估计,一段30s左右的视频,费用接近60元。
    行业密探

  • 北京银河通用机器人有限公司(以下简称“银河通用”)成功完成由宁德时代领投的11亿元人民币新一轮融资,这也是目前国内具身智能领域的单笔最大融资。 除宁德时代外,溥泉资本、国家开发银行国开科创、北京机器人产业基金和纪源资本等知名机构也参与了此次融资。 银河通用成立于2023年,公司推出的GraspVLA模型,率先实现了基于十亿级仿真合成数据的预训练和零样本泛化能力,成功解决了复杂场景中的抓取问题。 此外,银河通用还发布了TrackVLA导航大模型,具备在复杂环境中精准跟踪动态目标的能力。 在2025年BAAI大会上,银河通用展示了其基于VLA大模型的机器人Galbot,实现了从货架上精准抓取商品,并且在高干扰的零售环境下稳定运行。 此次融资的背后,不仅是银河通用技术实力的体现,也反映了业内对其商业模式的高度认可。 宁德时代作为战略投资方,将与银河通用进一步深化产业合作,为其具身智能机器人在工业领域的应用提供支持。 业内人士认为,具身智能技术在工业、零售等领域的商业化落地,将大幅提升生产力。 银河通用创始人兼CTO王鹤博士在多个公开场合提到,银河通用的核心目标是通过技术实现具身智能的产业化突破,尤其是在生产和零售领域,推动机器人从“炫技”走向实际生产力的转化。 在这一时刻,银河通用创始人兼CTO王鹤博士接受了采访,分享了他对公司技术和未来发展的见解—— - 关于VLA大模型的意义 王鹤表示,银河通用的核心技术是基于VLA大模型开发的。该模型不仅提升了机器人在复杂环境中的泛化能力,还通过视觉和自然语言指令,实现了端到端的动作执行。与传统的小模型相比,VLA大模型极大地提升了系统的扩展性和效率。 - 合成数据的优势 王鹤强调,银河通用的成功关键在于采用了高质量的合成数据。他指出,相较于真实世界的遥操作数据,合成数据能够更高效地覆盖广泛的任务场景,尤其在移动抓取和放置等原子动作上,合成数据的应用表现出了极高的适应性。 - 未来的机器人产品落地 王鹤称,银河通用将专注于打造能够在工业和商业场景中广泛应用的具身智能机器人。具身智能的真正价值在于通过“抓取、放置、移动”这些核心动作,提升生产力,尤其是在高频、重复性任务中,机器人能替代人类工作。 - 机器人从科研到商业的转型 王鹤认为,机器人行业的最大挑战是将“炫技”的研究展示转化为能够稳定工作的商业产品。具身智能的成功落地不仅依赖于强大的技术支持,还需要通过不断优化硬件与数据策略,确保产品在实际应用中的可靠性。 - 关于PMF(产品市场契合度) 王鹤强调,银河通用的PMF逻辑在于,通过提供能够切实替代人工的高效机器人产品,创造出真实的商业价值。虽然目前机器人产品的定价较高,但在实际应用中能够显著节省成本,因此市场接受度较高,未来随着量产会逐步降低成本。
    行业密探

  • 马斯克最近宣布,他将用推理版本的Grok 3.5(可能会被称作Grok 4.0)来重写整个人类知识库,修正其中的错误并补充缺失信息。 他指出,“未经校正的数据”训练的基础模型中,存在太多垃圾信息,而Grok 3.5将在整理知识的同时,提升模型的准确性和可靠性。 有网友认为,这意味着AI逐步有了“改写历史”的能力。 但纽约大学名誉教授、知名学者Gary Marcus却将这一行为比作《1984》中的情节:“你想让Grok与你的个人信念保持一致,于是你打算重写历史,让它符合你的观点。”【图2】 相反,百科平台Justapedia Foundation则表示支持,称他们能够帮助信息校正工作,并想和马斯克聊聊这事儿。【图3】
    行业密探
  • AI为何卷起了小游戏?大模型最新评测方式是让它们玩怀旧小游戏!

    1天前
    图片
    01:23

  • 每只手21个自由度,支持16主动自由度,具备高精度操作能力。 在夹持、旋转、精准插拔等精细操作上,能力远超市面常见的6自由度抓取器。【图1】 这就是具身智能创业公司灵初智能最新推出的自研灵巧手。 要知道,人类的一只手是27个自由度,而特斯拉最新一代Optimus Gen-3灵巧手也只有22个自由度。 21个自由度,意味着机械结构复杂,硬件制造上难度极高,还需要保证稳定性和可量产性,造价下探很有难度,“市面上很多团队,光灵巧手就要几十万一只。” 而灵初智能创始人兼CEO王启斌告诉量子位,灵初的目标,是将一台机器人整机的价格—— 打到10000美元(约71885元)级别,对标特斯拉“Model 3定价策略”。 由于视双足为炫技,在整机设计上,灵初的人形机器人打造成“轮式+双手”的形象,长这样:【图2】 下面来说说此次新推出灵巧手背后的故事:
    行业密探
  • 监督学习也能反思?清华英伟达提出隐式负向策略爆炸提升数学能力

    1天前
    1跟贴
    图片

  • 空间推理成了大模型的新战场。 换句话说,就是模型能“边看边画,边画边想”:在推理过程中主动对图像动手脚,比如绘制参考线、框选关键区域,来捕捉更精准的空间关系。相比传统“视觉转文本”的方式,ViLaSR-7B更像人类那样,借助图形操作引导理解,解决了细节丢失和时空信息混乱的问题。 不卖关子,这就是蚂蚁技术研究院联合中科院自动化所、港中文大学,开源的视觉语言模型 ViLaSR-7B,在迷宫导航、视频理解等五大任务上平均提升18.4%。在最具挑战的VSI-Bench上,更是追平Gemini-1.5-Pro,刷新SOTA成绩。 模型不仅表现好,而且具备类人的空间思维策略:会主动找参考物推理、系统性跨帧追踪物体。更聪明、更像人,是它最大的进步。 大模型掌握人类空间思考能力!三阶段训练框架学会“边画边想”
    行业密探
  • AI也会闹情绪了!Gemini代码调试不成功直接摆烂,马斯克都来围观

    1天前
    16跟贴
    图片
  • 00后投身具身智能创业,剑指机器人界Model 3!推出21个自由度手

    1天前
    1跟贴
    图片

  • 大模型最新评测方式,竟然是让它们玩各种怀旧小游戏!DeepSeek上榜,o3-pro断层领先……这个Benchmark叫Lmgame,出自UCSD的Hao AI Lab。
    行业密探
  • HarmonyOS 6 开发者Beta正式启动,AI辅助开发效率大大提升

    2025-06-21
    图片
正在载入...
正在载入...