任何曾经尝试过将家庭大小的行李装进轿车大小的行李箱的人都知道这是一个难题。机器人也在为密集的包装任务而苦苦挣扎。
对于机器人来说,解决包装问题需要满足许多限制,例如堆放行李箱,以免行李箱从后备箱中翻出,重物不会放在较轻的物体上,以及避免机械臂与汽车保险杠之间的碰撞。
一些传统方法按顺序处理此问题,一次猜测满足一个约束的部分解决方案,然后检查是否违反了任何其他约束。由于要采取一长串行动,还要打包一堆行李,这个过程可能非常耗时。
麻省理工学院的研究人员使用了一种称为扩散模型的生成式人工智能来更有效地解决这个问题。他们的方法使用一组机器学习模型,每个模型都经过训练以表示一种特定类型的约束。这些模型组合在一起,生成保压问题的全局解决方案,同时考虑所有约束条件。
他们的方法能够比其他技术更快地产生有效的解决方案,并且在相同的时间内产生更多成功的解决方案。重要的是,他们的技术还能够解决具有新颖的约束组合和大量对象的问题,这是模型在训练过程中看不到的。
由于这种普遍性,他们的技术可用于教机器人如何理解和满足包装问题的整体约束,例如避免碰撞的重要性或希望一个物体紧挨着另一个物体。以这种方式训练的机器人可以应用于不同环境中的各种复杂任务,从仓库中的订单履行到在某人家中整理书架。
“我的愿景是推动机器人完成更复杂的任务,这些任务具有许多几何约束和需要做出的更连续的决策——这些都是服务机器人在我们非结构化和多样化的人类环境中面临的问题。借助强大的组合扩散模型工具,我们现在可以解决这些更复杂的问题并获得很好的泛化结果,“电气工程和计算机科学研究生、关于这种新机器学习技术的论文的主要作者Zhutian Yang说。
她的合著者包括麻省理工学院研究生毛佳媛和杜一伦;Jiajun Wu,斯坦福大学计算机科学助理教授;麻省理工学院脑与认知科学系教授、计算机科学与人工智能实验室(CSAIL)成员Joshua B. Tenenbaum;麻省理工学院计算机科学与工程教授、CSAIL成员托马斯·洛萨诺-佩雷斯(Tomás Lozano-Pérez);资深作者莱斯利·凯尔布林(Leslie Kaelbling),麻省理工学院松下计算机科学与工程教授,CSAIL成员。该研究将在机器人学习会议上发表。
约束复杂化
连续约束满足问题对机器人来说尤其具有挑战性。这些问题出现在多步骤机器人操作任务中,例如将物品装入盒子或摆放餐桌。它们通常涉及实现许多约束,包括几何约束,例如避免机器人手臂与环境之间的碰撞;物理约束,例如堆叠物体以使其稳定;以及定性限制,例如将勺子放在刀的右侧。
可能存在许多约束,并且它们因问题和环境而异,具体取决于对象的几何形状和人类指定的要求。
为了有效地解决这些问题,麻省理工学院的研究人员开发了一种名为Diffusion-CCSP的机器学习技术。扩散模型通过迭代优化其输出来学习生成类似于训练数据集中样本的新数据样本。
为此,扩散模型学习对潜在解决方案进行小幅改进的过程。然后,为了解决问题,他们从一个随机的、非常糟糕的解决方案开始,然后逐渐改进它。
例如,想象一下将盘子和器皿随机放置在模拟桌子上,使它们在物理上重叠。物体之间的无碰撞约束将导致它们相互推开,而定性约束将把盘子拖到中心,对齐沙拉叉和餐叉等。
扩散模型非常适合这种连续的约束满足问题,因为可以组合多个模型对一个物体姿态的影响,以鼓励所有约束的满足,杨解释说。通过每次从随机的初始猜测开始,模型可以获得一组不同的良好解决方案。
携手合作
对于Diffusion-CCSP,研究人员希望捕获约束的相互关联性。例如,在打包时,一个约束可能要求某个对象紧挨着另一个对象,而第二个约束可能指定其中一个对象必须位于何处。
Diffusion-CCSP 学习一系列扩散模型,每种类型的约束都有一个模型。这些模型是一起训练的,因此它们共享一些知识,例如要打包的对象的几何形状。
然后,这些模型协同工作以找到解决方案,在本例中为要放置的对象的位置,这些解决方案共同满足约束。
“我们并不总是在第一次猜测时就能找到解决方案。但是,当您不断完善解决方案并发生一些违规行为时,它应该会引导您找到更好的解决方案。你会从做错的事情中得到指导,“她说。
与其他方法相比,针对每种约束类型训练单个模型,然后将它们组合起来进行预测,大大减少了所需的训练数据量。
但是,训练这些模型仍然需要大量数据来证明已解决的问题。Yang说,人类需要用传统的慢方法解决每个问题,这使得生成此类数据的成本高得令人望而却步。
相反,研究人员通过首先提出解决方案来扭转这一过程。他们使用快速算法生成分段框,并将一组不同的 3D 对象拟合到每个分段中,确保紧密包装、稳定的姿势和无碰撞的解决方案。
“通过这个过程,数据生成在仿真中几乎是即时的。我们可以生成数以万计的环境,我们知道这些问题是可以解决的,“她说。
使用这些数据进行训练后,扩散模型协同工作,以确定机器人夹持器应放置物体的位置,这些夹持器在满足所有约束的同时完成包装任务。
他们进行了可行性研究,然后用真正的机器人演示了Diffusion-CCSP解决了许多难题,包括将2D三角形拟合到一个盒子中,使用空间关系约束打包2D形状,堆叠具有稳定性约束的3D对象,以及使用机械臂打包3D对象。
他们的方法在许多实验中优于其他技术,产生了更多既稳定又无碰撞的有效解决方案。
未来,Yang和她的合作者希望在更复杂的情况下测试Diffusion-CCSP,例如可以在房间内移动的机器人。他们还希望使Diffusion-CCSP能够解决不同领域的问题,而无需对新数据进行重新培训。
佐治亚理工学院交互式计算学院助理教授、NVIDIA AI 研究科学家 Danfei Xu 表示:“Diffusion-CCSP 是一种机器学习解决方案,它建立在现有强大的生成模型之上,他没有参与这项工作。“它可以通过组合已知的单个约束模型来快速生成同时满足多个约束的解决方案。尽管它仍处于开发的早期阶段,但这种方法的持续进步有望在各种应用中实现更高效、安全和可靠的自主系统。
这项研究部分由美国国家科学基金会、空军科学研究办公室、海军研究办公室、麻省理工学院-IBM Watson 人工智能实验室、麻省理工学院智能探索中心、大脑、思维和机器中心、波士顿动力人工智能研究所、斯坦福大学以人为本的人工智能研究所、ADI公司、摩根大通公司、 和 Salesforce。