DeepMind的AI可以“想象”一个基于单张图片的世界

时间:2018-01-02 06:24:32166网络整理admin

Udo Siebig / ALAMY By Chelsea Whyte人工智能现在可以把自己放在别人的鞋子里 DeepMind已经开发出一种神经网络,可以根据单个图像自学“从不同的角度”想象一个场景给定一个场景的2D图片 - 比如,一个有砖墙的房间,以及一个颜色鲜艳的球体和地板上的立方体 - 神经网络可以从不同的有利位置生成3D视图,渲染对象的两侧和改变阴影落下的地方以保持相同的光源该系统称为生成查询网络(GQN),可以从静态图像中梳理出细节,以猜测空间关系,包括摄像机的位置 “想象一下,你正在看着山珠穆朗玛峰,你移动一米 - 山不会改变大小,告诉你它与你的距离,“在Deepmind领导该项目的Ali Eslami说 “但如果你看一个杯子,它会改变位置这类似于它的工作方式,“为了训练神经网络,他和他的团队展示了来自不同视点的场景图像,它用于预测从背后或侧面看起来像什么该系统还通过关于纹理,颜色和光照的背景教导自己这与当前的监督学习技术形成对比,其中场景的细节被手动标记并馈送到AI AI还可以控制虚拟空间中的对象,将其对空间关系的理解应用于移动机器人手臂以拾取球的场景 DeepMind的Danilo Rezende表示,即使我们没有意识到这一点,它也会像我们一样学到很多东西,他也参与了这个项目通过在训练中显示神经网络的许多图像,它可以消除类似物体的特征并记住它们 “如果你看一下模型,我们可以识别人工神经元组,计算图中代表物体的单位,”Rezende说系统围绕这些场景移动,预测事物应该在哪里以及它们应该是什么样的,并调整其预测何时不正确在看到从不同视点拍摄的几张照片之后,它能够使用此功能来计算迷宫的布局期刊参考文献:Science,DOI:10.1126 / science.aar6170阅读更多:神经网络的迅速崛起及其为什么会统治我们的世界更多关于这些主题: