打开网易新闻 查看更多图片

杨剑飞这十年,算是把科技浪潮踩得明明白白。

2012年进中山大学移动信息工程学院,赶上互联网热潮的风口,2014年扎进大疆做视觉算法,亲眼见证无人机行业的元年,还总往上海、武汉、台北的黑客松赛场跑,48小时极限编程练出的0到0.1产品化能力,怕是行业里没几个人比他扎实。

后来他穿梭在新加坡南洋理工、加州伯克利等几所顶尖高校,最终一头扎进“PhysicalAI”这个领域,去年还在南洋理工创立了MARS实验室,正式开启教职生涯。

打开网易新闻 查看更多图片

本来想,像他这样踩中多个风口的人,大概率是个“卷王”。

但接触下来才发现,他反倒称自己是“躺平”的人。

这种“高效学习远胜于耗时间”的理念,放在现在的科研圈,确实挺难得。

打开网易新闻 查看更多图片

他深耕的PhysicalAI,核心不是让机器人单纯动起来。

一开始他也觉得,RGB相机加雷达,就能构建完整的三维世界表征。

但在哈佛访学期间,和光学、实验物理研究者深入交流后,他发现之前的认知太局限了。

真实世界里,多光谱信息、电磁信号这些看不见的维度,都是客观存在的。

打开网易新闻 查看更多图片

如此看来,PhysicalAI的核心是更准确、全面地观测物理世界,再用AI去解释这些观测结果。

这一点在生命科学领域也能找到印证,显微镜、基因测序本质上都是新观测方式加AI分析的组合。

毫无疑问,这是个值得长期投入的方向。

2026年,他的团队重点还是放在以人为本的具身智能研究上。

打开网易新闻 查看更多图片

比如更安全自然的人机交互,他判断具身智能3到5年可能落地,到时候人机交互的人性化问题躲不开。

另外,团队也在VLA方向发力,探索多模态接入能否提升动作表达精度。

他还参与了Meta的ProjectAria项目,研究XR眼镜和具身智能的结合。

现在XR眼镜的显示、芯片、电池技术都在突破,短期能做自然交互入口,长期配合边缘算力,还能帮家里的机器人理解用户需求。

打开网易新闻 查看更多图片

当下具身智能的应用场景之争,吵得挺热闹。

有人说该进工厂拧螺丝、搬东西,也有人觉得家庭才是趋势。

杨剑飞的观点很明确,核心还是在toC端。

工业场景是结构化的,传统工业机器人已经做得很好了。

打开网易新闻 查看更多图片

具身机器人在工业领域的价值,只体现在处理不规则物体、杂乱环境这些传统机器人搞不定的地方。

但这些需求更适合工业自动化公司解决,不是通用具身智能的潜力所在。

那家庭场景的话,人形机器人是不是最好的形态?不同场景有不同优势,但通用家用机器人,人形形态适配性确实更强。

一方面,家庭空间本就是按人的尺度设计的,人形机器人能上下台阶,这是轮式机器人比不了的,尤其是海外很多多层住宅,这种优势更明显。

打开网易新闻 查看更多图片

另一方面,情感接受度很关键。

像小鹏机器人,不光步态逼真,外观、材质的设计也能带来拟人化的温度,让人们更容易接受它融入生活。

当然,人形不一定非得是双足,这是更细节的讨论了。

中美在具身智能赛道上的差异也很有意思。

打开网易新闻 查看更多图片

国内是供应链自下而上,很多公司搞全链路自研,从本体到模型、数据都自己做。

这种模式能建独立生态,但也容易资源分散,同质化问题突出。

而且国内的开源模型,声量往往大于可用性,缺乏社区认可的基础模型。

美国则是分层创新,很多团队专注单一技术层,硬件直接采购国内的成熟产品。

打开网易新闻 查看更多图片

这种模式能集中资源搞突破,差异化更明显,开源生态也更成熟,比如π系列模型就成了很多研究的基础。

不过国内的硬件制造和工程化能力是优势,松山湖的供应链让产品能做得快、做得好,迭代周期也比海外短。

现在美国有些创业者都想“做美国的宇树”,这也能看出国内硬件的领先地位。

打开网易新闻 查看更多图片

具身智能发展的痛点不少,数据问题首当其冲。

机器人数据采集成本高、不连续,合成数据能不能解决?杨剑飞觉得,仿真数据和真实数据得并行。

仿真数据容易规模化,但和现实有差距,真实数据成本高,可迁移性更强。

现在也有提升真实数据效率的办法,比如UMI的统一夹爪,还有用第一视角人类视频训练能促进智能涌现。

打开网易新闻 查看更多图片

行业共识是预训练用仿真和视频数据,场景落地靠真实数据校准,再加上世界模型补充。

开源对行业发展的作用,不用多说,肯定能加速创新,但也会带来不确定性。

不过早期阶段,这种不确定性正是创新的源头。

打开网易新闻 查看更多图片

硬件方面,UMI的开源夹爪让社区有了很多改进,有人改成了三指灵巧手。

软件层面,围绕PaLM-E、π系列模型的微调改造,也出了不少实质性进展。

杨剑飞觉得,机器人领域的开源价值比纯软件领域还大,能同时撬动硬件、算法、数据、应用多个层面的创新。

宇树机器人之所以普及,PaLM-E、Llama能形成生态,都是开源逻辑的体现。

打开网易新闻 查看更多图片

国内现在就缺一个像DeepSeek那样的具身智能开源模型,来带动整个社区的创新。

最后说说人才培养,现在很多高校在讨论要不要设具身智能本科专业。

杨剑飞觉得,机器人是高度系统化的工程领域,涵盖机械、电子、计算机等多个学科。

本科课程如果不聚焦,学生容易学得杂而不精。

打开网易新闻 查看更多图片

过去这些年,真正推动机器人教育进步的,其实是竞赛。

像RoboMaster这样的比赛,让学生在团队里完成整机设计、调试,这种实践训练比课堂有效得多。

他在大疆参与RoboMaster测试时就发现,全栈型人才大多来自顶尖战队。

所以说,本科专业只是个框架,关键是让学生有机会参与系统级工程,把机器人从零做成可运行的产品。

打开网易新闻 查看更多图片

具身智能的发展,不是单纯堆技术那么简单。

杨剑飞的经历和洞察告诉我们,这是个需要感知物理世界、适配人类需求、构建生态协同的系统工程。

国内有硬件和工程化的优势,只要补齐开源模型、数据生态的短板,再做好人才培养的实践落地,大概率能在这个领域实现突破。

未来,当杀手级应用出现,分布式数据体系建立起来,具身智能或许就能迎来自己的“ChatGPT时刻”,真正走进千家万户。

打开网易新闻 查看更多图片