麻省理工学院的一组研究人员最近开发了一个人工智能模型,它可以获取指令列表并生成一个成品。未来对建筑和机器人领域的影响巨大,但团队决定从我们现在都需要的东西开始:披萨。
pizza GAN是麻省理工学院计算机科学与人工智能实验室(CSAIL)和卡塔尔计算研究所(QCRI)天才们创造的最新神经网络,它是一个生成性的对抗性网络,可以在披萨烹饪前后创建披萨的图像。
不,它实际上不是做一个你可以吃的披萨——至少,现在还做不到。当我们听到机器人在食品工业中取代人类时,我们可能会想象波士顿动力机器在厨房里走动,翻转汉堡,做薯条,然后大喊“点餐”。但事实要温和得多。
实际上,这些餐馆使用的是自动化技术,而不是人工智能。汉堡翻转机器人不关心它的抹刀上是否有真正的汉堡或冰球。它不了解汉堡包,也不知道成品应该是什么样子。这些机器在家里,就像在汉堡店把包装盒关在亚马逊的仓库里一样。他们不是智能的。
麻省理工学院和QCRI所做的是创建一个神经网络,它可以查看比萨饼的图像,确定配料的类型和分布,并在烹饪前确定比萨饼分层的正确顺序。它理解任何人工智能都能理解,做披萨从头到尾应该有的过程。
联合小组通过一种新颖的模块化方法完成了这一任务。它开发了人工智能,能够根据添加或删除的成分来可视化比萨饼应该是什么样子。例如,你可以给它看一张比萨饼的图片,然后让它去掉蘑菇和洋葱,它就会生成一张修改过的披萨图片。
研究人员称:
从视觉角度来看,每一个指令步骤都可以被视为通过添加额外的对象(例如添加配料)或更改现有对象(例如烹饪菜)的外观来更改菜的视觉外观的一种方法。
为了让机器人或机器有一天能在现实世界里做披萨,它必须了解披萨是什么。到目前为止,人类,即使是CSAIL和QCRI里真正的人类,在机器人中复制视觉的能力也比味蕾强得多。
例如,Domino’Pizza目前正在测试一种用于质量控制的计算机视觉解决方案。它在一些地方使用人工智能来监控从烤箱里出来的每一个比萨饼,以确定它们是否看起来足够好,能够满足公司的标准。像浇头分配、甚至烹饪、圆度之类的东西也可以通过机器实时学习来测量和量化,以确保客户不会得到一个糟糕的披萨。
麻省理工学院和QCRI的解决方案整合了烹饪前的阶段,并确定了适当的分层,以制作美味、诱人的披萨。至少在理论上,我们可能离一个端到端的人工智能解决方案还需要好几年的时间来准备、烹饪和供应比萨饼。
当然,一旦机器人了解了配料的细微差别、操作说明以及项目最终结果应该如何出现,那么比萨饼就并不是机器人唯一能做的事了。研究人员得出结论,PizzaGAN背后的人工智能模型可能在其他领域也有用武之地:
虽然我们只是在比萨的背景下对我们的模型进行了评估,但我们相信,对于其他自然分层的食物,如汉堡、三明治和沙拉,类似的方法是有希望的。除了食物,我们还将有趣地看到我们的模型在数字时尚购物助理等领域的表现,其中一个关键的操作是不同层次衣服的虚拟组合。
但是,老实说,我们都不会正式进入人工智能时代,除非有一天,我们可以得到一个体面的砖炉玛格丽塔比萨饼自制机器人。