ChatGPT 和其他深度生成模型被证明是不可思议的模仿者。这些 AI 超级模型可以通过自动学习数百万个以前作品的例子来创作诗歌、完成交响曲并创建新的视频和图像。这些功能强大且用途广泛的工具擅长生成与他们以前见过的一切相似的新内容。
但正如麻省理工学院的工程师在一项新的研究中所说,如果你想在工程任务中真正创新,相似性是不够的。
“深度生成模型(DGM)非常有前途,但也存在固有缺陷,”该研究的作者、麻省理工学院机械工程研究生Lyle Regenwetter说。“这些模型的目标是模仿数据集。但作为工程师和设计师,我们通常不想创造一个已经存在的设计。
他和他的同事们认为,如果机械工程师希望人工智能帮助产生新的想法和设计,他们必须首先将这些模型的重点重新放在“统计相似性”之外。
“许多这些模型的性能与生成的样本与模型已经看到的样本在统计学上的相似程度密切相关,”麻省理工学院机械工程助理教授Faez Ahmed说。“但在设计中,如果你想创新,与众不同可能很重要。
在他们的研究中,Ahmed 和 Regenwetter 揭示了深度生成模型在解决工程设计问题时的陷阱。在自行车车架设计的案例研究中,该团队表明,这些模型最终会生成模仿先前设计的新车架,但在工程性能和要求方面却步履蹒跚。
当研究人员向DGM提出相同的自行车车架问题时,他们专门设计了以工程为中心的目标,而不仅仅是统计上的相似性,这些模型产生了更具创新性,性能更高的车架。
该团队的结果表明,以相似性为重点的人工智能模型在应用于工程问题时并不能完全转化。但是,正如研究人员在他们的研究中所强调的那样,通过对适合任务的指标进行一些仔细的规划,人工智能模型可能是一个有效的设计“副驾驶”。
“这是关于人工智能如何帮助工程师更好、更快地创造创新产品,”艾哈迈德说。“要做到这一点,我们必须首先了解要求。这是朝着这个方向迈出的一步。
该团队的新研究最近在网上发表,并将发表在12月的《计算机辅助设计》杂志上。这项研究是麻省理工学院-IBM Watson AI实验室的计算机科学家与麻省理工学院DeCoDe实验室的机械工程师之间的合作。该研究的合著者包括麻省理工学院-IBM Watson AI实验室的Akash Srivastava和Dan Gutreund。
构建问题
正如 Ahmed 和 Regenwetter 所写,DGM 是“强大的学习者,拥有无与伦比的能力”来处理大量数据。DGM 是一个广义术语,指的是任何经过训练的机器学习模型,该模型经过训练以学习数据分布,然后使用它来生成新的、统计上相似的内容。广受欢迎的 ChatGPT 是一种称为大型语言模型 (LLM) 的深度生成模型,它将自然语言处理功能整合到模型中,使应用程序能够生成逼真的图像和语音以响应对话查询。其他流行的图像生成模型包括 DALL-E 和 Stable Diffusion。
由于 DGM 能够从数据中学习并生成逼真的样本,因此越来越多地应用于多个工程领域。设计师使用深度生成模型来绘制新的飞机框架、超材料设计以及桥梁和汽车的最佳几何形状。但在大多数情况下,这些模型模仿了现有设计,而没有提高现有设计的性能。
“与DGM合作的设计师有点错过了这个樱桃,那就是调整模型的训练目标,以专注于设计要求,”Regenwetter说。“因此,人们最终会生成与数据集非常相似的设计。
在这项新研究中,他概述了将DGM应用于工程任务的主要缺陷,并表明标准DGM的基本目标没有考虑到特定的设计要求。为了说明这一点,该团队引用了一个简单的自行车车架设计案例,并证明问题可能早在最初的学习阶段就出现。当模型从数千个不同尺寸和形状的现有自行车车架中学习时,它可能会认为两个尺寸相似的车架具有相似的性能,而实际上,一个车架中的一个小脱节(太小而无法注册为统计相似性指标的显着差异)使车架比另一个车架弱得多, 视觉上相似的框架。
研究人员将自行车的例子向前推进,看看DGM在从现有设计中学习后会实际生成什么设计。他们首先测试了传统的“香草”生成对抗网络(GAN)——一种广泛用于图像和文本合成的模型,并且经过调整只是为了生成统计上相似的内容。他们在包含数千个自行车车架的数据集上训练了该模型,包括商业制造的设计和由业余爱好者设计的不太传统的一次性车架。
一旦模型从数据中学习,研究人员就要求它生成数百个新的自行车车架。该模型产生了类似于现有框架的逼真设计。但是没有一个设计在性能上有显着的改善,有些甚至有点逊色,框架更重,结构更差。
然后,该团队对另外两个专门为工程任务设计的DGM进行了相同的测试。第一个模型是艾哈迈德之前开发的模型,用于生成高性能翼型设计。他建立了这个模型来优先考虑统计相似性和功能性能。当应用于自行车车架任务时,该模型生成了逼真的设计,这些设计也比现有设计更轻、更坚固。但它也产生了物理上“无效”的框架,其组件在物理上不可能以不可能的方式不太合适或重叠。
“我们看到的设计明显优于数据集,但也看到了几何不兼容的设计,因为模型没有专注于满足设计约束,”Regenwetter 说。
该团队测试的最后一个模型是 Regenwetter 为生成新的几何结构而构建的模型。该模型的设计优先级与以前的模型相同,增加了设计约束的成分,并优先考虑物理上可行的框架,例如,没有断开或重叠的杆。最后一个模型产生了性能最高的设计,这些设计在物理上也是可行的。
“我们发现,当一个模型超越统计相似性时,它可以提出比现有设计更好的设计,”艾哈迈德说。“这证明了人工智能可以做什么,如果它在设计任务上被明确训练的话。
例如,如果DGM可以在性能、设计限制和新颖性等其他优先事项下构建,Ahmed预计“许多工程领域,如分子设计和民用基础设施,将受益匪浅。通过揭示仅依赖统计相似性的潜在陷阱,我们希望在多媒体之外的生成式人工智能应用中激发新的途径和策略。