AI不用地图标注和GPS也能认路？-地图标注|微信高德百度地图标注|地图标记-做地图手机站(m.ZuoMap.com)

是的，谷歌DeepMind又在搞作业。
这次，是用深度强化学习和神经网络来树立导航系统。无需标示好的地图标注指引，AI只是依托街景相片的图画识别就能抵达目的地。类似于AlphaGo Zero的没有棋谱，也能学会下棋。
留意，这无关乎驾驭，只是关乎导航——穿越实在城市，抵达指定的经纬度坐标。整个过程不触及交通数据（周围有没有车和人），也没有对车辆操控建模。
但这现已满足杂乱了。在曼哈顿的5个区域、伦敦和巴黎市中心，AI能成功穿过杂乱的穿插路口、人行道、地道和各种拓扑结构。

地图标注

3月31号，DeepMind在ArXiv上发布了相关论文：Learning to Navigate in Cities Without a Map。大数据文摘大众号后台回复“导航”即可下载这篇论文。
DeepMind随后宣布的一篇博客文章称，AI做的这件事类似于一个小孩怎么记住周边的环境。小孩并不需求看一张地图，只需记住大街的视觉外观并沿途转向，就能前往朋友家、校园或杂货店。而且会越走越娴熟。假如走失了，他可以通过要害地标乃至太阳的朝向来认路。
这是人类的导航系统。
导航是一项重要的认知使命，有导航系统的人类和动物可以在杂乱的国际中远间隔穿行，而无需地图。一起，可以自我定位（“我在这儿”）和表述方针（“我要去那里”）。
那么，AI怎么学习在没有地图的城市中进行导航？
一个利器是谷歌街景视图（Google Street View）。这些图画数据是现成的。这样，AI不必真的到某个城市里穿行，只需在街景里游荡就可以了。运用街景视图建模的优势在于，这些相片以人眼视角拍摄，也就是说，假如一个人站在相同的地理方位，他看到的图画就和模型看到的相同。
依托街景图画而不是地图
研讨人员树立了一个根据神经网络的人工智能体，学习运用视觉信息（来自街景图画的像素）在多个城市中导航。当AI抵达方针目的地（例如，指定的经纬度坐标）时，该AI就会得到奖赏。
比如一个7×24小时无限循环作业的快递员，要不断地抵达指定地点，可是又没有地图可以看。
跟着时刻的推移，AI学习以这种办法跨过整个城市。通过在多个城市的练习和学习，在习惯新的城市时AI的体现非常好。
AI在巴黎街景中练习。街景图画与城市地图叠加，显现方针方位（赤色），署理方位和视界（绿色）。请留意，AI不会看到地图，只能看到方针方位的纬度/经度坐标。
与传统的依赖清晰映射和探究的办法（例如试图本地化并一起绘制地图）相反，DeepMind让AI只运用视觉观察，而不运用地图、GPS定位或其他辅佐工具。
用到的技能是，构建了一个神经网络署理，用于输入从环境中观察到的图画，并预测它应该在该环境中履行的下一个操作。运用深度强化学习进行端对端练习，类似于此前关于学习穿越杂乱3D迷宫，以及用无监督辅佐使命进行强化学习来玩游戏的研讨，可是运用到的数据规划比小型模仿迷宫环境要大得多。
神经网络由三部分组成：
可以处理图画并提取视觉特征的卷积网络
特定场所的循环神经网络，其隐含使命是记住环境，并学习“这儿“（署理的当时方位）和”那里“（方针的方位）
产生关于署理行为的导航战略的场所不变循环网络。特定于言语环境的模块被规划为可交换，而且如其称号所示，对于署理导航的每个城市都是唯一的，而视觉模块和战略模块可以是言语环境不变的。
CityNav (a)
MultiCityNav特定城市建模 (b)
练习和转移到新城市 (c)
就像在Google Street View界面中相同，AI署理可以在恰当的方位旋转，或许在可能的情况下前进到下一个街景。与谷歌地图标注和街景环境不同，AI不会看到小箭头，本地或全球地图，或闻名的Pegman：它需求学习区别敞开道路和人行道。方针可能在实在国际中间隔数公里，AI要通过数百个街景图才干抵达。
Pegman，谷歌街景视图中的虚拟小人
值得留意的是，这是一个可以转移到新城市的模块化神经网络架构。与人类相同，当AI访问一个新的城市时，我们会希望它有必要学习一组新的地标，但不必重新学习其视觉体现或其行为（例如，沿着大街向前走或在穿插路口处转向）。因而，运用MultiCity体系结构，DeepMind首先在许多城市进行练习，然后冻住战略网络和视觉卷积网络，并在一个新城市中只树立一个新的特定区域途径。这种办法使AI可以取得新的常识，而不会忘掉它现已学到了什么，类似于渐进式神经网络架构。
导航系统是研讨和开发人工智能的根底，也对了解人类的生物导航系统有协助。