利用全球定位改进导航

文 / Tilman Reinhardt‎,Google 地图软件工程师

在使用 Google 地图导航时,您始终会遇到这样一项挑战,即找到正确的前行方向。当然,导航应用会告诉您往北走,但很多时候您都在想,“我究竟身处何处?哪条路指向北?” 多年以来,我们一直试图利用 GPS 和指南针等工具来提高蓝点的精确度,但却最终发现这两种工具都存在物理局限,由此使得我们很难攻克这一挑战,这在城市环境中表现得尤为显著。

我们正在尝试使用一种名为全球定位的技术来解决此问题,该技术集视觉定位服务 (VPS)、街景和机器学习于一身,能够更精确地识别位置与方向。这项技术以智能手机的摄像头作为传感器,能够提供一种更强大且更直观的方式,以帮助人们快速确定前行方向。

image

由于存在精确度与定位方面的局限,因此在城市环境中仅依靠 GPS 导航会受到限制。通过结合使用 VPS、街景和机器学习技术,全球定位则能针对您与前行方向的相对位置,提供更准确的周边环境信息

在本文中,我们将讨论在城市环境中导航所存在的一些局限,以及全球定位如何帮助克服这些困难。

GPS 的不足

定位是指确定设备与某个参考点的相对位置和方向的过程。各类技术实现定位的方式各有不同。GPS 依靠测量多个专用卫星发射的无线电信号的延迟来精确定位。然而,在纽约或旧金山等人口密集的城市环境中,由于天空可见度低且建筑物会反射此类信号,实现地理位置的精确定位便显得异常困难。这可能会导致地图上的定位颇为不准,这意味着您的位置可能会出现在街道的错误一侧,甚至是几个街区之外。

在城市环境中,GPS 信号会在建筑物表面形成反射

此外,GPS 还存在另一个技术短板:只能确定设备的位置,而无法确定方向。有时,移动设备中的传感器能够通过测量地球的磁场与重力场以及设备的相对位移而作出补救,从而大致估算出您所在的方向。但这些传感器易受到磁性物体(例如汽车、管道、建筑物乃至手机内部电线)的干扰,导致产生最高偏离 180 度的误差。

新型定位方法

为提高蓝点位置和方向在地图上的精确度,我们需要采用一种新型辅助技术。在街上行走时,您会将眼前所见与预计会见到的场景进行比较,以此确定自己的方位。全球定位集多种技术于一身,可让移动设备的摄像头根据您的意愿自行确定方向。

VPS 根据图像而非 GPS 信号来确定设备所处的位置。VPS 会先拍摄一系列位置已知的图像,并分析其关键视觉特征(例如建筑物或桥梁的轮廓),然后为这些视觉特征创建大量可快速搜索的索引,借此绘制出一张地图。为确定设备的位置,VPS 会将手机所摄图像的特征与 VPS 索引中的特征进行比较。然而,图像质量以及所摄地点都会对 VPS 定位的精确度产生巨大影响。这就提出了另一个问题:在哪里能找到全球范围内的大量高质量图像源?

进入街景

10 多年前,为帮助人们更深入地探索世界,我们在 Google 地图中推出街景模式。自那时起,街景模式便不断扩大其全球覆盖范围,让人们无论身在何处,都能预览前行路线,并能走进著名的地标与博物馆内部一探究竟。为借助 VPS 实现全球定位,我们将其与街景数据进行关联,以便使用从全球超过 93 个国家 / 地区收集并经过测试的信息。这个丰富的数据集为应用三角测量提供了数万亿个稳定的参考点,有助于更精准地确定设备位置,并指引人们前往目的地。

image2

匹配自多张图像的特征

尽管这种方法在理论上很有效,但使其达到相同的实践效果却是一大挑战。问题在于,在定位时,手机所摄图像与采集街景图像时的场景(可能是几个月前的场景)可能有所出入。例如,树木具有大量丰富的细节,但却会随季节变换乃至风的吹动而产生变化。为获得良好匹配,我们需筛除场景中会变动的部分,而重点关注不随时间变化的永久性结构。正因如此,这一新方法的核心要素便是利用机器学习自动确定需要关注的特征,优先选定可能属于场景中不变部分的特征,而忽略或会暂时变动的事物,如树木、光线的动态移动和建筑物。在我们使用机器学习来提高精确度的众多方法中,这只是其中一种。

将全球定位与增强现实相结合

当用户急需精确度时,便可开启全球定位这一附加选项。这种精确度的提升还能使用户获得大量新体验。我们目前正在测试最新功能,其中一项功能便是使用 ARCore(Google 用来构建增强现实体验的平台)体验,以便用户在 Google 地图上开启步行导航模式时,为其叠加方向指示。借助此功能,您只需扫一眼手机便可精确知晓前行方向。

尽管早期的研究成果前景无限,但我们仍需完成大量工作。我们仍有一项挑战尚待完成,即让这项技术在任何地点以及任何条件下均可适用,例如在深夜、暴风雪或暴雨天气。为确保我们构建的功能能够真正发挥作用,我们已开始召集一组精选的本地向导对其进行测试,这是全球 Google 地图爱好者组成的一个小群体,可为我们提供有关最大限度提高此方法实用性的反馈。

与 Google 智能镜头(使用镜头助您搜索所见之物)等其他由 AI 技术驱动的镜头体验类似,我们相信,凭借这项在现实环境中叠加方向的功能,您定能在使用手机中已有的技术时,既感兴奋又能体验到更大的实用性。我们期待继续开发这项技术,并持续挖掘智能手机摄像头的潜力,以便研发更多宝贵的新体验。

原文:Using Global Localization to Improve Navigation
中文:谷歌开发者公众号