5月30日全球顶尖学术期刊《Nature》(《自然》),封面文章刊登了由我国清华大学研究团队发表的论文《面向开放世界感知具有互补通路的视觉芯片》(A Vision Chip with Complementary Pathways for Open-world Sensing)。
该重磅研究成果报道获等多家权威媒体转发,据新华社报道,清华大学类脑计算研究中心团队研制出了世界首款类脑互补视觉芯片“天眸芯”(Tianmouc),这是该团队继异构融合类脑计算“天机芯”后,第二次登上《自然》封面,标志着在类脑计算和类脑感知两个方向上均取得了基础性突破。
这是一款全面超越现有传统图像传感器和神经形态传感器的视觉传感器芯片,是智能感知芯片领域的一个重大突破,不仅为智能革命的发展提供了强大的感知技术支持,还为未来自动驾驶、具身智能等重要应用,开辟了新的道路。“天眸芯”的加入将能够进一步完善类脑智能生态,有力推动人工通用智能的发展。
清华大学施路平教授、赵蓉教授为论文共同通讯作者,此外精密仪器系杨哲宇博士(现北京灵汐科技有限公司研发经理)、精密仪器系 2020 级博士生王韬毅、林逸晗为论文共同第一作者。研究团队依托清华大学精密仪器系的类脑计算研究中心。
▲论文《Nature》网站页面&研究团队,来源:人民日报(张兆基摄)
该新型视觉传感器芯片长什么样?有什么特点?有什么优势?
目前,我们主流中使用的视觉传感器,主要是CMOS图像传感器和CCD图像传感器。
然而现有图像传感器在开放世界中处理动态、多样化和不可预测的场景时,存在许多的不足,如向高速、高分辨率、大动态范围和高精度方向发展,受到功率和带宽的限制。
论文通讯作者、清华大学精密仪器系教授施路平在媒体采访中介绍,在开放世界中,智能系统不仅要应对庞大的数据量,还需要应对如驾驶场景中的突发危险、隧道口的剧烈光线变化和夜间强闪光干扰等极端事件。而传统视觉感知芯片面对此类场景往往出现失真、失效或高延迟,限制系统的稳定性和安全性。
“该范式借鉴了人类视觉系统的基本原理,将开放世界的视觉信息拆解为基于视觉原语的信息表示,并通过有机组合这些原语,模仿人视觉系统的特征,形成两条优势互补、信息完备的视觉感知通路。”
与传统图像传感器相比,人类视觉系统在开放世界环境中以其多功能性、适应性和鲁棒性而脱颖而出。人类视觉系统将视觉刺激解释为多种视觉,如颜色、方向和运动,并以互补的方式将其分配给腹侧和背侧通路。
当前已有一系列模仿人类视觉系统特定特征的器件,包括硅视网膜、神经形态视觉传感器、脉冲频率调制和近传感器计算芯片等。然而,在有限的功率和带宽的限制下,实现具有高空间分辨率、高速、高精度和大动态范围的图像传感器仍然存在挑战。
因此,研究团队提出一种受人类视觉系统(HVS)多级特性启发的互补感知范式,该范式涉及将视觉信息解析为基于视觉原语的表示,并通过有机组合这些原语,模仿人视觉系统的特征,形成两条优势互补、信息完备的视觉感知通路:用于准确认知的面向认知的路径和用于快速认知的面向行动的路径。
为了实现这一范式,研究团队开发了世界首款类脑互补视觉芯片「天眸芯」(Tianmouc),该芯片结合了混合像素阵列和并行异构读出架构,利用互补视觉通路的特性,可以在极低的带宽(降低 90%)和功耗条件下,实现每秒 10000 帧的高速、10bit 的高精度、130dB 的高动态范围视觉信息采集。它不仅突破了传统视觉感知范式的性能瓶颈,而且能够高效应对各种极端场景,确保系统的稳定性和安全性。
下图为类脑互补视觉芯片「天眸芯」的测试系统。被处理的数据首先会传输到 FPGA 版上,FPGA 板采集原始数据,然后通过 PCIe 传输到主机,主机再负责数据处理,以完成测试等任务。
▲“天眸芯”(Tianmouc)芯片测试系统
基于 Tianmouc 芯片,研究团队将其与自动驾驶系统集成,展示了其即使在开放道路上具有挑战性的极端情况下也能实现准确、快速和稳健感知的能力。基于基元的互补传感范式有助于克服为各种开放世界应用开发视觉系统的基本限制。
“天眸芯”(Tianmouc)互补视觉芯片怎么设计?采用90nm CMOS背照式技术制造!
在物理传感系统中,想实现互补传感范式有几个必须解决的挑战。首先,设计像素阵列至关重要,这需要同时解析同一焦平面上相应图元的光电信息转换。其次,两条路径的读出架构必须包含异构构建块,这些构建块可以使用不同的数据分布和格式对电信息进行编码。
如图 2 所示,「天眸芯」采用 90 nm CMOS 背照式技术制造,由两个核心部分组成:
- 用于将光学信息转换为电信号的混合像素阵列;
- 用于构建两个 CVP 的并行异构读出架构。
受感光细胞的启发,混合像素阵列包括锥体和杆体像素,具有不同的特性,如颜色、响应模式、分辨率和灵敏度。这些像素可以将视觉信息解析为特定的颜色(红色、绿色、蓝色)和白色光谱,充当颜色对立图元。
研究团队对「天眸芯」的量子效率、动态范围、响应速度、功率和带宽等性能指标进行了全面的评估。该芯片在 COP 和 AOP 中均表现出较高的量子效率,530 nm 最高可实现 72% 的 AOP 和 69% 的 COP。「天眸芯」通过利用互补的 COP 和 AOP 中不同增益模式的动态范围来实现高动态范围。
可以说,全面超越了现有的神经形态传感器和传统图像传感器,同时仍能保持低功耗和低带宽消耗。
以自动驾驶为示例,“天眸芯”(Tianmouc)的表现有多强悍?
「天眸芯」的互补感知范式为自动化系统提供了巨大的想象空间,它可以作为感知算法的优质数据源。为了在开放世界场景中评估这些能力,研究人员开发了一个集成「天眸芯」的汽车驾驶感知系统(图 4a),以评估在开放道路上行驶,涉及各种极端情况,例如强光干扰、高动态范围场景、域偏移问题(异常物体)和具有多个极端情况的复杂场景。
▲图 4:开放世界感知实验。
为了利用天眸芯架构的优势,作者设计了一种多路径算法,专门用于利用 AOP 和 COP 的互补特性。在感知层面,图元的完整性使得原始场景的重建和对极端照明的适应成为可能。同时在感知层面,AOP 提供对变化、纹理和运动的即时感知,而 COP 提供精细的语义细节。通过同步这些结果,我们可以让 AI 系统全面了解场景。
图 4b 所示的第一种场景评估了突然强光环境的感知能力,在光照快速变化的情况下,传感器的鲁棒性受到了考验。天眸芯对这种强光表现出了极强的适应能力,同时在正常情况下也保持了较高的感知性能。对于实时高动态范围感知(图 4c),两条通路的互补灵敏度使天眸芯能够感知高亮度对比度而不会牺牲速度。
在感知层面,AOP 上的高速光流滤波器补充了异常检测能力,其中 AOP-TD 和 AOP-SD 之间的协作可以精确计算运动方向和速度以识别异常(图 4d)。图 4e 显示了自然光照昏暗、交通环境混乱、人造光突然干扰的复杂场景,需要在采样速度、分辨率和动态范围方面具有不同的感知能力。CVP 上的算法提供了互补和多样化的结果,为这些场景中的进一步决策提供了充足的空间。
根据 mAP_0.50(平均精度),与图 4 中所有情况下仅使用单一路径相比,CVP 具有更优的整体检测性能。值得注意的是,它在实现这一目标的同时消耗了不到 80 MB s^(-1) 的带宽和 328 mW 的平均功耗。实验结果表明,天眸芯可以有效适应极端光环境并提供领域不变的多级感知能力。
天眸芯擅长捕捉复杂的认知细节,同时可对快速不可预测的突发情况和运动作出响应。它提供高速、高动态范围和高精度,同时保持了自适应低带宽的特性。同样重要的是,它的高可扩展性允许通过先进的制造工艺实现高级空间分辨率,从而促进具有低功耗和带宽要求的分辨率敏感应用。作者认为,新的范式为开发用于开放世界应用的先进计算机视觉理论、算法和系统开辟了一条新途径。
本文部分资料来自:
机器之心《清华「天眸芯」登Nature封面:全球首款类脑互补视觉芯片》
神经形态感存算一体电子《清华大学最新Nature:“天眸芯”——世界首款受人类视觉系统启发的互补型视觉芯片》
上海证券报《芯片重磅!世界首款!我国科学家研制》
由动感传感整理,转载请注明传感器专家网