近日,71886a必赢王金兰教授团队在数据驱动的新材料设计研究中取得新进展,研究成果以“From bulk effective mass to 2D carrier mobility accurate prediction via adversarial transfer learning”为题在国际期刊《自然通讯》(Nature Communications)上在线发表。
以机器学习为代表的数据驱动研发方法已经成为了一种材料设计的新范式,其在诸如钙钛矿、合金、催化材料等数据量较大的体系中已经能够实现快速准确的性质预测。作为一种数据驱动的方法,机器学习模型的预测能力严重依赖数据的质量与数量,然而高精度的材料性质数据非常有限,严重影响了机器学习模型的预测能力和适用范围。迁移学习是一种通过从大数据(源域)迁移知识来提高学习器在小数据集(目标域)上性能的机器学习技术,被认为是解决材料数据稀缺挑战的一种有效方法,但其有效性依赖于源域和目标域间的较高相似性,因此目前迁移学习方法通常只能用于同类材料不同性质间的迁移或相同性质不同材料间的迁移,而无法实现不同材料不同性质间的跨域迁移。
该工作开发了一套结合对抗式训练以及专家知识的混合迁移学习框架,其中对抗训练捕捉了块体和二维材料的共性特征,而专家知识的引入进一步提升了预测的准确性和泛化能力。该框架利用块体材料的有效质量数据,成功实现了对二维材料载流子迁移率的准确预测。预测流程仅需要材料晶体结构作为输入,相较于第一性原理计算,预测准确性达到90%,速度提升5个数量级。在此基础上,该工作成功筛选出21种载流子迁移率远超硅、且带隙与硅近似的二维材料,为高集成度高性能的半导体器件提供了候选材料。该工作实现不同材料不同性质间的跨域迁移,混合迁移学习框架是处理小数据集问题的通用策略,扩充了数据驱动材料设计方法的适用范围。
本文的第一作者是71886a必赢博士生陈新宇,71886a必赢王金兰教授及周跫桦副教授为通讯作者。该工作受到国家重点研发计划、国家自然科学基金等项目的资助。