Foursquare 的野心:大数据时代的 “活点地图”
这还不止,Foursquare 还想要根据过去的 “行动历史” 以及朋友的喜好提供未来行动的指引,Foursquare Explore 服务,可以发现身处的城市周边都有什么值得一去的地方。他们还有怎样的 “地图” 美梦?处理这些数据的工具又是什么?
大野心:精细的 “多边形区域” 框架
Foursquare 正在和多个公司合作,为他们提供地理位置信息以及周边商家评价反馈。同时,他们也通过这些合作伙伴收集更多的地理位置信息——人们对什么地方感兴趣,对什么地方不喜欢。Instagram, Bing, Flickr, Quora, Path, Soundtracking, Evernote……都是他们的合作伙伴,导入数据的量级可想而知。
Foursquare 的工程师 David Blackman 日前接受采访时透露,Foursquare 正在为完善 “活点地图” 的框架,让更多应用和公司能够在此基础上反战自己的 “杀手级” 服务。而这种框架,就是城市区域中的 “多边形”(polygon shape)——根据 “签到” 信息的大数据和地理信息编码汇总而成的城市区域边界。举个例子,不是 “广州” 或者 “北京” 的边界,而是广州的 “上下九” 区域,或者北京的 “五道口” 区域,他们不仅仅是一路名,一商圈,一行政区域,而是大部分用户所认为的区域边界。他用纽约的 “布鲁克林” 作为例子,Foursquare 所呈现的区域,并不是一般的网格状,而是,通过收集用户的签到信息整合的 “多边形边界”。
本来,他们需要到世界上的每个城市深入每个区域来了解这些细节的边界。不过通过收集 “签到”(需要输入地址)信息,或者是用户查找某地址所用的区域名字信息,他们可以足不出户地把这个工作交给世界。只要与现有的商家点评服务糟糕的区域识别稍作对比,就能想象到多边形框架的可怕之处——精准,而且 “懂你”。
解密地图背后的 “绘图工具”
Foursquare 目前有 100 多名员工,而负责地理信息数据的团队只有 3 人。这个小团队正在使用什么样的工具来构建地图的框架?
其中之一是 Google S2 ,提供地表地理信息数据索引的开源服务。Foursquare 目前的发现周边商家和去处的服务 Explore 就是基于 S2 的开源数据。而用户的签到信息,也是会覆盖在 S2 的地理信息上,方便 Foursquare 进行整合和地理分类。 而为了建立地理编码信息的数据库,Foursquare 还在使用 MapReduce 这种大规模数据集的运算模型。David Blackman 称,他们将 MapReduce 和 S2 结合起来,将世界分成数个模块,将签到的地理位置信息与 S2 结合一起,然后分成区域,这样就有了之前我们提及的 “多边形区域” 的模型了。
尽管如此,Foursquare 还是以来用户提供的大量地理位置数据来完善自己的推荐和地图内容,早前,Foursquare 曾经把这些数据整合成一个动态的 “签到” 地图:
Youku