欢迎星标 果壳硬科技

编者按

2023年6月,未来光锥联合果壳在线下组织了一场。我们邀请了130+位科研和AI产业人士,喝酒畅聊科学研究的第五范式。

2024年,未来光锥和果壳将继续组织 AI 相关线下活动。新科技浪潮下,AI 必将是值得长期关注的话题。欢迎您扫描文末企业微信二维码添加小助手,或关注果壳硬科技,期待线下与您碰面畅聊与AI有关的一切。

以下是中国科学院大学副研究员王赫,也是参加创客松活动的话题贡献者,活动当天演讲内容的文字整理:

以下是参加上述活动时候,我的个人讲演内容的 PPT 和稿件摘录。

打开网易新闻 查看更多图片

各位老师好,我是来自中国科学院大学国际理论物理中心(亚太地区)的XX。很高兴有机会在这样的一个活动当大家介绍一下,我们科学界是如何理解AI ,如何运用AI以及如何理解AI for science 的。

我所从事的研究领域是引力波天文学,在引力波天文学当中,关于AI的应用已经是非常的广泛了。引力波的数据处理,正如这里图像所看到的,从非常复杂的引力波时序观测数据出发,然后我们需要在数据当中去搜寻到引力波信号,然后在引力波波形特征当中,要对其背后潜藏的物理信息挖掘出来,这需要进行统计推断,或者说叫做参数估计。那么引力波的这些物理参数信息,有望直接揭示出潜藏在宇宙中关于四种基本相互作用力,或者是大统一理论/量子引力理论的检验。

简而言之,需要大家明白一个关键,在重大科学发现的过程背后,是非常依赖于数据当中究竟能够给我们能够带来什么样的物理潜在信息,那么这个过程是非常依赖于所谓的统计推断,给出某些特定关键参数信息的具体值和它的可能取值的范围。

打开网易新闻 查看更多图片

说得再简单直白一点,就是我有一串数据。根据这一串数据,我需要它映射到某些特定参数的分布,正如图中有两个维度的分布图像。这个过程准确来说叫做贝叶斯估计。而现在大火的AIGC生成模型刚好就可以对应到这样的映射,比如下方的一串文本,它可以生成一个高分辨率的图片。图片当中的每一个像素可以看做是一个独立的物理参数,那么这样就可以直接将物理场景中想要完成的映射可以交给一个生成式模型来实现。但这里首先有一个不确定性量化的问题,每一个像素作为物理的参数维度,给出其对应的确定值是远远不够的,还需要给出每一个维度对应的不确定度,而一张图片的生成一定是确定的一个参数取值,所以在科学上,我们对每一个像素级的参数,不仅仅要求它在整体的图像上要符合我们的要求,事实上对每一个像素点的可能取值,即其概率分布也是有更高更严格的要求。

生成模型还有另外一个重要的问题,就是到底什么是一个可控可信的模型。比方说text-to-image这样的问题,“一直在奔跑的狗”图像生成后可能是给出一只在街道上奔跑的柯基狗的图像。让人疑惑的问题就是图像会脑补出这只狗是一只柯基狗,而且还会脑补出它的像素背景是在某不存在的街道上,然而这个文字信息并没有提供给模型。对于科学应用来说,这样不可控的结果生成是致命的,科学分析结果所关注的信息来源或者误差来源一定是非常清楚而且可解释的。

以上就是我们在科学研究过程当中所发现的非常具体的关于AI for science 的经验和问题。最后是想提及的是,在我们具体的科学研究过程当中,免不了经常是一个跨学科的合作过程,CS领域和某小方向科学领域的研究者相互合作,将是未来的常态,但是这个合作模式,实际上还是有很多非常具体的潜在问题存在。比方说不同学科领域内,对于数据和相关软件的开源程度有着很大的差异,相当大程度上实际上并不像CS领域那样有着非常良好的开源共享生态。另外跨界过程当中,不同领域的研究人员对各自的学术成果的形式也有不同的需求,比方说AI顶会和大方向学科领域顶刊内之间究竟该如何权衡等问题,最后也是经常会老生常谈的,比方说跨领域专业知识如何在保持各自核心竞争力的前提下互相分享,互相促进,以确保利益共赢的同时,都可以成为AI for science 领域内的experts。

- 完 -

PPT 可见“原文链接”,活动宣传照片:

打开网易新闻 查看更多图片

王赫 | 作者

翻滚吧土豆君 | 来源

如果你是投资人、创业团队成员或科研工作者,对果壳硬科技组织的闭门会或其它科创服务活动感兴趣,欢迎扫描下方二维码,或在微信公众号后台回复“企业微信”添加我们的活动服务助手,我们将通过该渠道组织活动——