近期,中国科学院上海光学精密机械研究所微纳光电子功能材料实验室在利用随机森林算法实现二维材料层数和缺陷识别研究中取得新进展,揭示了机器学习算法在二维材料光谱学研究领域的应用潜力。

机器学习是人工智能领域的重要分支,其基本思想是基于数据构建统计模型,并利用模型对数据进行分析和预测。随着大数据技术的快速发展,以数据驱动的机器学习算法在材料研究领域蓬勃兴起。二维材料的Raman光谱对分子键合及样品的结构较敏感,可用来进行化学鉴别、形态与相、内压力/应力及组成成份等的研究和分析。尽管Raman光谱提供了较丰富的信息,但如何挖掘信息深度、利用多种信息进行综合决策,仍需进一步的研究。

该研究中,研究人员利用MoS2的Raman频率、强度等特征信息,通过重采样过程,得到了包含不同空间位置信息的子训练集;通过学习过程,建立了由一定数量决策树组成的随机森林模型。当有新的样本点进入模型进行预测和判断时,随机森林中的每棵决策树会进行独立判断,继而通过多数表决的方式给出相对准确的预测结果。除了能够判断单层和双层样品外,模型还能够对样品生长过程中易引入的裂痕和随机分布晶核进行预测。该研究工作提出的方案将机器学习算法引入二维材料光谱学的研究中,也可扩展到其他材料,为不同领域的材料表征提供解决方案。

相关研究成果以Machine Learning Analysis of Raman Spectra of MoS2为题,发表在Nanomaterials上。研究工作得到国家自然科学基金委、中科院、上海市科委的支持。

打开网易新闻 查看更多图片

图1.随机森林算法中学习过程的基本结构

图2.随机森林算法中预测过程的基本结构和一些区域层数识别的结果

温馨提示:近期,微信公众号信息流改版。每个用户可以设置 常读订阅号,这些订阅号将以大卡片的形式展示。因此,如果不想错过“中科院之声”的文章,你一定要进行以下操作:进入“中科院之声”公众号 → 点击右上角的 ··· 菜单 → 选择「设为星标」