复杂材料特性的逆向设计,在解决软机器人、生物医学植入物和织工程等方面具有巨大潜力。尽管机器学习模型提供了此类逆映射,但它们通常仅限于线性目标属性。
近日,苏黎世联邦理工学院(ETH Zurich)的研究人员为了定制非线性响应,证明了在周期性随机 cellular 结构的全场数据上训练的视频扩散生成模型,可以成功地预测和调整它们在大应变状态下的非线性变形和应力响应,包括屈曲和接触。
成功的关键是打破直接学习从属性到设计的映射的常见策略,并将框架扩展为内在估计预期变形路径和全场内应力分布,这与有限元模拟非常一致。因此,该研究有可能简化和加速具有复杂目标性能的材料识别。
该研究以《Inverse design of nonlinear mechanical metamaterials via video denoising diffusion models》为题,于 2023 年 12 月 11 日发布在《Nature Machine Intelligence》上。
由于增材制造能够跨尺度地操纵多材料和 cellular 结构,创建具有定制特性的材料在各个学科中都很受到欢迎。工程师和设计师现在不必从有限的天然材料目录中进行选择,而是可以使用所谓超材料的大幅扩展的设计和性能空间,这些材料的设计目的之一是实现以前无法实现的机械性能。
现有的大多数方法都仅限于线性材料属性。最近提出的非线性扩展,但涉及计算量大的模拟。还没有适合复杂机械设置的拓扑优化技术,包括大变形、非线性材料行为(包括塑性、结构屈曲和摩擦接触)。
非线性设置显著增加了从属性到结构的(逆)映射的复杂性。
扩散模型因其能够基于文本描述符生成看似逼真的图像而受到关注,著名的代表是 DALL-E 2,最近已扩展到生成短视频序列,并取得了显著的效果。这也在机械优化的背景下得到了证实。
从线性到非线性材料属性的转变可以在高水平上与从图像生成到视频生成进行比较。在这两种情况下,都必须学习新的数据维度,这需要一些一致性概念——无论是时间意义上的还是机械意义上的。
视频去噪扩散模型
用于模型训练的数据集的生成如下图所示。
图 1:超材料生成过程。(来源:论文)
去噪扩散模型架构如图 2 所示。允许在给定的非线性应力-应变响应上对模型进行机械激励调节。11 个应变步骤的条件有效应力与相应的全场响应直接相关,因为机械平衡要求任何应变水平下的有效总体应力与 UC 中任何像素行的所有像素应力值的平均值相匹配。
与视频生成不同,在视频生成中,单词作为条件并不直接对应于特定的图像帧,这里可以通过(可学习的)线性层将每个压力值转换为高维 token 嵌入,并通过相应应变步骤的空间注意模块中的交叉注意将其与像素表示融合,从而在模型架构中利用这种联系。
在所有应变步骤的后续时间注意力层中,研究向应变步骤和标记嵌入添加相对位置编码,以便模型接收有关应变步骤顺序的信息,并且在应变步骤上应用「伪时间」交叉注意。
最后,通过向扩散时间嵌入(需要作为模型的输入来指示扩散时间步长)中添加 token 的潜在表示来增强条件。
图 2:去噪扩散模型架构。(来源:论文)
看不见的应力-应变响应的逆向设计
与其他深度学习框架相比,该研究设置的一个关键优势是它能够提供对生成的超材料的变形机制和相关应力响应的物理洞察。通过反转以所需应力-应变曲线为条件的扩散过程,不仅获得了潜在的设计,还获得了在整个变形路径中施加应变的预测全场 σ22 分布。
与其他方法相比,该框架将逆向设计和正向预测统一在单个模型中,而不需要临时的辅助模型来评估预测设计的性能。这还允许采用进一步的设计标准。
为了评估模型的泛化能力,研究人员接下来检查其在训练数据中未密切表示的响应上的性能。研究人员创建了四个不同应力-应变响应的基准示例,涵盖了工程感兴趣的各种材料响应,并包括重要的接触和屈曲机制。
首先,生成具有高刚度、强(非线性)硬化和大变形能力的设计,例如在冲击应用中使用的设计。研究人员将模型的有效应力响应比训练集中最硬的样本高出 20%。
图 3:训练数据集中未表示的四种应力-应变响应的超材料合成。
其次,考虑一个更复杂的目标响应,该响应在加载路径的中途表现出突然的刚度增加(施加应变为 10%)这需要改变变形模式。
第三,考虑更奇特的目标,即在 15% 应变之前实现高度柔顺响应,然后硬度显著增加。生成的设计并不像之前的目标那样接近( ϵ = 14.1%),但它在训练集中的表现明显优于最佳匹配 (ϵ = 39.6%)。
第四,考虑具有显著软化的响应。模型的设计再次优于最佳匹配(ϵ = 2.4% 与 ϵ = 8.3%)。
几个未来研究方向
当前设置中提出的框架仅限于为训练期间使用的特定边界条件和本构律生成响应。原则上,通过不仅根据目标属性调节模型,而且根据不同的负载场景和(基础)材料响应调节模型,可以直接扩展当前框架。这需要额外的训练数据,并且可能会延长训练时间。在潜在空间中操作并逐步增加分辨率可以平衡增加的计算复杂性,为未来的研究提供一个有趣的方向。
此外,桁架等替代设计空间为三维结构和低填充率提供了更紧凑的设计参数化。由于桁架自然可以用图表示,因此主要用于分子设计的图扩散模型可以作为可行的模型架构。
最后,所提出的框架允许扩展到流体动力学等相关领域,同时充当替代模拟器和非线性优化器。