推进材料信息学应用,加快下一代复合材料的开发

将机器学习与基于物理的方法相结合,可以将产品的上市时间缩短多个数量级,这为生物材料、耐火复合材料、太空应用和储氢罐等领域的创新开辟了新的可能。

采用Schrödinger 的材料信息学(MI)工具,可以加速开发汽车、航空航天、电子等领域所需的高性能复合材料使用的新型材料和配方(图片来源:Schrödinger)

材料信息学(MI)是材料行业实现数字化转型的基础,它利用数据基础设施、机器学习(ML)和AI解决方案来开发新的材料并优化其加工方式。根据IDTechEx 的说法,材料信息学是一种范式转变,能显著缩短上市时间,而更进一步的是,它不仅能够加快创新步伐,针对建议的候选材料实现所需的性能,而且还能够实现逆向开发,即根据输入的所需性能来推荐新的材料。

2021年,东丽工业公司(日本东京)公布了一个“如何将MI应用于复合材料”的案例——该公司利用MI开发了一种新的高性能碳纤维增强聚合物(CFRP)预浸料,该预浸料具有卓越的阻燃(FR)性能,适用于先进的航空航天应用。


按成熟度划分的材料信息学(MI)的目标应用(图片来源:IDTechEx 的“材料信息学 2022-2032”)

“这是一种完全不同的方法。”Schrödinger(美国纽约州纽约市)的材料科学信息学产品经理 Anand Chandrasekaran表示。该公司与客户合作,采用其预测计算工具开发包括复合材料在内的未来材料。“我们不仅在材料性能预测方面要比传统的试验方法快了多个数量级,还实现了不同类型的构思。现在,你可以从10000或100000 种可能的结构着手,或者查看可以购买的所有可能的分子,将这些不同的集合放入一个数据库中,然后使用ML就能更有效地评估和筛选实际用于合成和测试的材料。”

Chandrasekaran补充说,Schrödinger的平台还将ML和基于物理的方法相结合,实现数据集的数字化生成和验证,这开辟了一个充满各种可能性的新视野。用于训练ML模型的现有数据集可能很薄,包括生物材料、耐火和高温复合材料、太空应用的新材料、低温储氢等。

1实现更可持续的高性能复合材料

在深入探讨MI工作原理的细节之前,有必要了解它的使用方式及其原因。Schrödinger 的网站给出的解释是:各行各业的研发科学家们在开发高性能、多功能以及满足社会对可持续性要求的下一代聚合物和复合材料方面面临着挑战。该公司的数字平台在分子和原子尺度上对生物基聚合物和添加剂进行模拟,使科学家们能够理解和预测性能。它还可以自动筛选生物基聚合物,预测聚合物混合物的结构、混溶性(混合和形成均匀溶液的能力)和性能。它还可以模拟吸水率并预测玻璃化转变温度(Tg)、固化过程中的热稳定性、热膨胀和聚合物的凝胶点,为高性能应用开发新的树脂配方。

“现在提出了许多生命周期问题。”Schrödinger的聚合物总监 Andrea Browning 说道。她与 Chandrasekaran及其同事在基于物理的工具方面展开合作,为聚合物和复合材料客户提供一系列功能。“这些客户正在关注的输入单体与过去所考虑的不同。我们能够利用他们过去的数据来了解与新的单体可能的联系,包括来自他们以前没有考虑过的不同来源。MI使你能够利用的,将超出传统试验性配方研究所能做到的,因此,您可以将其用作发现工具。”

“为阻燃性、塑化或其他目标而改进添加剂,是MI为改进而提供新的可能性的另一个方面。”Browning 说道,“这可能包括寻找更适合材料整个生命周期的新的添加剂。在探索可能使用的其他材料时,可以再次利用你可能拥有的数据集,然后将这些新材料的特性与化学品联系起来。这为您提供了更多的方法来研究如何组合和使用新的化学品来实现性能和可持续性目标。”

2探索下一代的太空材料

在如何将MI用于复合材料方面的一个例子是,位于美国爱德华兹空军基地的美国空军研究实验室(AFRL)航空航天系统局的研究化学家 Levi Moore 博士及其团队发表的一篇文章,该文章介绍了如何使用Schrödinger平台来理解和探索用于聚氰脲酸酯树脂的新配方。这些热固性聚合物由氰酸酯单体组成,具有卓越的阻燃性能,这对于航空航天中的高温(HT)应用非常重要。多方面的消息表明,Tg大约为300℃,炭化率(char yields)>70%,后者对陶瓷基复合材料(CMC) 很有吸引力,或者,它们可能包含硅(Si),可以获得额外的HT和炭化率(char yield)优势。

Moore 的团队想探索聚氰尿酸酯的反应化学,但这很有挑战性,因为固化/交联通常很复杂,需要同时考虑多个因素。具体来说,Moore 希望更好地了解水分吸收情况。尽管这对于聚氰脲酸盐来说是低的,但如果水温迅速升高,可能会导致失效。

他的团队使用Schrödinger的计算平台来应对这些挑战。正如Moore在之前的一篇文章中解释的那样:“我们已经能够观察到水扩散到交联聚合物基质中,并看到水分子最容易被特定化学基团吸引的地方。而要作这样的试验,需要使用只有国家实验室才能提供的极其复杂的装置,即便如此,也只能在宏观尺度上看到水,而不能模拟提供精细的原子细节。”他补充说,“这种数字模拟减少了我们需要合成的新分子的数量,从而可以实现更高效、更低资源消耗的迭代周期。”

聚氰脲酸盐只是Moore及其同事应用Schrödinger的MI工具的几个领域之一。AFRL的研究人员还在探索增材制造和3D打印的潜力,以将现有材料重新配置为新的、更复杂的形状,这可能会增强它们对恶劣环境的耐受性。通过出版物、网络研讨会和访谈,AFRL提供了一个“航空航天公司如何将MI加入其研究周期中”的示例。

Moore在之前的采访中强调了未来材料建模的一个方向:“最大的挑战将是系统的最终目标,你可以输入所需的材料属性,系统将能够在该空间中找到解决方案。如果该解决方案不存在,那么它可以迭代新的、尚未被发现的材料,并输出具有所需性能的目标来合成分子。”

3MI的工作原理

Chandrasekaran表示,一种方法是:结合使用ML与现有数据集,以预测潜在的新材料或找到改善现有材料特性的潜在机制。这些ML技术相当新,大约在过去的8年中被开发出来。“在 Schrödinger,我们正在开发ML技术,这些技术采用特定材料(比如,可以是聚合物、聚合物加添加剂、分子或分子与溶剂的混合物)并将该复杂的材料分解成其各个组分和结构。然后,我们有特殊的表征技术,该技术能以一种可以被计算机算法理解的方式来表征每个结构。一旦该材料被算法理解,我们就可以找到结构与材料成分及感兴趣的属性之间的相关性。我们可以预测性能并了解属性如何变化。”


材料信息学的支柱(图片来源:Schrödinger)

“但是,当你拥有非常小的数据集时,这些ML预测可能会很糟糕。”Chandrasekaran说道,“这是因为,ML是基于查看过去数据的统计相关性来作出未来的预测。但是,一旦我们将 ML 与基于物理的方法相结合,那么我们就可以在第一性原理层面上获得真正强大的材料描述符——这意味着你不必对过去的数据或统计模型做出任何假设。相反,从量子力学和分子动力学的基础知识出发,我们可以生成材料的特性。即使你无法生成所需复合材料的完全相同的属性,也有许多属性是非常好的描述符,或者与复合材料制造商可能感兴趣的最终属性具有非常强的相关性。”

“因此,通过将ML和这些基于物理的方法结合使用,我们可以生成自己的数据集,并查看哪些属性与实际的试验值相关。”他解释道,“然后,我们拥有一种强大的方法,它将第一性原理方法与统计方法相结合,使研究人员能够设计出全新的材料、新的添加剂和新的复合材料。”

4SABIC加快聚合物开发速度

这种将ML与基于物理的方法结合使用的一个例子是Schrödinger 最近与 SABIC的合作。“我们在他们内部的Tg、CTE(热膨胀系数)和介电性能等数据集上使用了ML,以产生新的单体和共聚物。”Chandrasekaran 说道,“我们对数以万计的新的潜在重复单元和多态单元进行了预测,然后根据ML的排名,获得了表现最佳的单元。接着,我们通过基于物理的模拟对其进行了验证,最终,该公司合成了最有前景的聚合物。”


DeepAutoQSAR 是一种基于图神经网络和其他AI方法的Schrödinger MI工具,非常适合包含500多个数据点的数据集,有助于在物理测试之前筛选出可能的新配方(图片来源:Schrödinger)

Chandrasekaran和Browning表示,设计新聚合物的传统方法在很大程度上依赖于缓慢而昂贵的试错试验。除这种复杂性外,当研究人员改进聚合物的某个方面时,通常会削弱其他方面。因此,设计新的聚合物就像解决一个复杂的难题,需要同时优化多种特性。相反,SABIC Specialties 的树脂设计和孵化团队(为各种复合材料应用提供聚合物、配混物和先进材料)与Schrödinger的材料科学团队合作,构建了准确的 ML 模型来加快开发速度。

SABIC策划了一个包含5个目标属性的物理数据集,这5个目标属性与聚合物如何响应机械应力、温度、电气和光学条件相关。然后,该团队成功地训练并验证了仅使用分子结构作为输入即可准确预测这5个聚合物属性的ML模型。接着,Schrödinger和SABIC使用这些ML模型来探索新的聚合物结构,这些结构尚未经过试验测试,但却表现出了对实际应用有用的聚合物特性。


Schrödinger的集成MI平台 LiveDesign,在单个基于浏览器的协作平台中利用ML来提供对试验数据、计算建模和数据分析的访问,以帮助公司开发新的材料和想法(图片来源:Schrödinger)

该团队生成了10000多种结构,部署了经过训练的ML模型来预测聚合物特性,并应用多参数优化(MPO)排名标准来识别具有首选特性的聚合物结构。使用 Schrödinger 的 LiveDesign MI 平台,该团队将设计空间缩小到1000种结构,然后精确定位,筛选具有良好性能的可市售的结构,将其范围缩减到10个。

为进一步增强对这10种候选结构的信心,SABIC和Schrödinger使用基于物理的方法对它们进行了测试,结果与ML模型预测的结果相一致。然后,SABIC对 10种候选结构中最具商业可行性的3种进行了合成和物理测试,它们都满足了移动、基础设施、5G、医疗设备、涂料等目标应用领域对更高性能材料的所有初始标准要求。

SABIC表示,这种方法可以将聚合物的创新时间从几年缩短到几个月。更进一步,这种AI驱动的工作流程还激发了科学家利用计算工具来测试仅通过试错试验不可测试的更多新的结构。

5一种变革性方法

“当我们将10000种聚合物结构缩减到前10种聚合物用于基于物理的仿真时,对每一种聚合物结构的仿真可能需要一天左右的时间。”Chandrasekaran 说道,“但是,要通过试验或直接合成和测试的方法来获得聚合物,至少需要一个月或更长的时间。因此,这比单纯的试验快了好几个数量级,这确实是变革性的。”

“但如果只能进行试验,甚至无法做到这一点。”Browning补充道,“你会把那个领域的专家召集到一起,他们会决定尝试5种、20种或30种——只要你有预算和时间。”

“这样做需要花费时间。”她继续说道,“一旦你缩小了范围,就需要时间来寻找成分,合成聚合物。如果你正在做一些真正新的事情,可能会有多次迭代,才能确保你能制造出想要的聚合物。相反,我们以数字方式进行所有操作,可以获得成功概率更高的子集,您可以对最有信心的子集进行试验和验证,这个周期要短得多。”

Chandrasekaran表示,这还为以前不可能实现的新创新带来了可能。“假设你有一项非常具有挑战性的任务,比如,因环境法规要求,需要将一种成分替换为另一种能够提供相同或更好属性但在毒性或可持续性方面不再有问题的成分,使用这种MI方法,就可以生成一个巨大的可行的化合物库,而且可以买到并能获得批准。然后,您可以运行ML并预测哪些成分和添加剂最有可能帮助实现所需的相同或更好的属性。”

“因此,您可以考虑可测试的所有可能的分子以及可以使用的聚合物,您可以轻松列出100000种化合物,然后在几分钟内使用ML进行预测。因此,这是一种完全不同的方法,可以使你以不同的方式开始构思。你可以绘制单体并查看可供购买的分子的所有现有来源,然后将所有这些放入数据库中,使用ML更有效地扫描该数据库以查找感兴趣的添加剂或分子。”Chandrasekaran 说道。

6储氢罐及其他可能的应用


采用MI,可以为太空飞行器和零排放飞机应用的低温液氢罐加快开发所需的新型复合材料(图片来源:Infinite Composites,柯林斯航空航天公司的 COCOLIH2T 项目)

MI可能产生重大影响的另一个领域是当前对一些聚合物的研究,这些聚合物能够抵抗低温并防止液氢(LH2)渗透到复合材料层压板中,可以在零排放飞机中用作新的存储解决方案以及用于制作航天器所需的无内衬储罐。MI可以在不经过多年试验的情况下解锁新的使能材料。“没错,这就是目标。”Chandrasekaran 说道,“Schrödinger已经有一款名为 Formulations Machine Learning 的产品,任何科学家都可以在台式机或笔记本电脑上进行ML,并调整组分、成分和化学成分,以及获得非常准确的性能预测。你可以对整个数据库进行预测,然后只对表现最好的分子进行试验。”

这与Schrödinger的其他MI工具和平台都是基于台式机/笔记本电脑的软件,根据它们的格式和用途具有不同的许可证。“所有数据都保留在该公司的系统内,无任何东西进入云端。”Chandrasekaran说道,“该公司使用的所有数据以及所有IP和重要配方,都保留在台式机或笔记本电脑中,所有分析和ML都可以在用户的机器上本地完成。”

Browning表示,这些工具的应用范围非常广泛。“我们现在谈论的是聚合物和聚合物复合材料,但这种方法可以做的事情要广泛得多。

Browning补充说,与10年前相比,MI取得了长足进步,包括围绕它的相关技术。“比如,我们讨论了使用基于物理的仿真来增强MI功能,这些已经取得了长足进步。10年前可能看到这一点并说这不适合他们的人,我想说,现在情况已经大不相同了。易用性和可能的结果都确实取得了进步。”

“我们不只是让客户下载软件并自行运行,我们真的很想与他们合作,以确保这个工具对他们有价值。因此,我们帮助客户格式化数据并为他们的案例构建问题,然后与他们合作,从这些工具中获得最大价值。”Chandrasekaran 说道。