文 陈鹏
人们每一次使用谷歌地图,呈现出的结果背后,实际都隐藏着一幅更复杂的图像。后台地图包含着许多信息:路口禁止左转、高速公路的入口、限速及交通状况等等。这些都是谷歌把人从A点导航到B点时要用的数据。
“如果看一下我们生活的这个世界,你会发现信息并不全在网上。”谷歌地图高级产品经理马妮科·古普塔表示,“我们正努力架起沟通现实世界与虚拟世界的桥梁,地图正是为此而造。”
一款相对准确的地图产品是如何出炉的?绝大多数人对此并不知情。《大西洋月刊》的科技编辑亚历克斯·玛德里加尔有机会亲赴谷歌地图办公室采访,揭示了谷歌地图的创建过程。这也是谷歌第一次对外展示“GT(地面实况)”项目。
谷歌开发地图的办公室并不起眼,位于山景城郊区一栋低矮的建筑里。和谷歌公司的其他部门一样,这里有免费的食物、乒乓球台以及各种地图卡通画。
前美国宇航局工程师迈克尔·威斯马利克是地图项目的骨干工程师之一。“创建地图需要几个步骤:首先通过合作伙伴获取地理数据,接着用一系列方法把它们转化成适当的格式,并与其他数据合并;最后是数据处理,通过技术人员的分析整合,产出比单独数据的总和更有价值的信息。”
谷歌地图依赖的一个重要数据源是美国人口统计局的“泰格(Tiger)”数据库。在外人眼中,“泰格”的地图数据已经很不错了,所有的道路得以展现,高速公路也被标记出来了。但仔细看的话,就会发现“草图”与现实世界有一些不符的地方。谷歌便会使用从其他数据源获得的数据,例如美国地质调查局,综合多方信息,画出一张相对准确的地图。
这还远远不够,至于更微观一些的信息如商场的位置、游泳池在哪、街道的拐角、交通标志,GT项目还有一个独家数据源解决地图的准确难题——谷歌街景的录像车。地图小组依靠谷歌街景,如今每两周发布的图像数据比2006年拥有的总和还要多。谷歌街景由专用街景车拍摄,这些街景车至今已经100多个城市的街道上驶过了500多万公里。每次行驶会产生两种有用的数据;一是其走过的路线,可以作为某条路可走的证据;二是拍摄的照片,谷歌可以通过算法提取出交通标志,然后把这些标志贴到后台地图中。
这些图片中还包含有海量文字信息,从中提取文字信息是一个巨大的挑战。运用光学字符识别(OCR)等图片识别技术,谷歌就能快速从街景车拍摄的图片中提取交通标志、街道名称、地址等有用信息。随着光学字符识别水平的不断提高,任何在街上看到的文字都将成为谷歌为现实世界设立的指引。
谷歌地图工程副总裁布莱恩·麦克伦敦解释说:“我们现在有600万个商业机构以及2000万个地址的‘视野码’,可以很精确地知道我看到的是什么,通过标识匹配来知道肯德基的标志。”
当谷歌的街景录像车已经行驶800万公里时,许多物流公司,例如联邦快递,每年的行驶里程高达50亿公里。能够拿到这些地理数据的公司,显然更有可能在地图制造行业处于领先地位。
加载中,请稍候......