Google 调教了人工智能,让你想要的 App 来找你 3 | 灵感早读
在本系列文章的前两篇中,我们讨论如何使用机器学习技术,把 app 自动归类到相关主题中,以及如何利用算法提供 app 私人推荐。在这篇文章中,我们讨论了利用机器学习算法对付应用商店里的垃圾信息以及滥用行为,为一亿多 Android 用户提供更安全可靠的 app 平台。
当 app 逐渐成为人们工作与生活的一部分时,确保商店搜到的 app 安全可靠十分重要,并且还要保证 app 提供的内容如实描述。因为商店中有一百多万的应用,同时每天都有大批的新应用上架,我们急需开发一个能灵活应变的算法,又快又准地找出捣乱分子。为了实现这个目标,我们采用了两种不同的方式,利用机器学习算法来大规模地打击垃圾和滥用行为。
发现「垃圾」应用并隔绝它们进入 Google Play 平台
正如我们的开发者条款所讲,我们不允许具有恶意、侵犯性或者违法的应用上架。尽管拥有明文规定,总会有人爱捣乱,发布应用损害用户权益。
从数量庞大的应用中找到这些触犯条款的应用简直像大海捞针,特别是因为每天都有成千上万的应用被提交审核。这就是为什么我们采用机器学习算法,来评估违规应用与潜在威胁。
我们利用各种看家算法本领,专门侦查对应的违规(例如限制级的内容、隐私和安全、知识产权、用户欺诈等等),这种方式相比人工审核更全面更可靠。
被我们算法挑出的应用,有些会送回开发者那重新处理,或者凉在一边直到可以检查出它是否安全,或者解除其威胁警告。因为应用审核过程结合了专家与算法分析,开发者可以在短时间内采取措施(例如版本更新或发布)。
预防篡改应用评分与排名
虽然应用本身可能没安全问题,有些搞事的人会模拟用户来刷分,以此操纵应用的评分和排名。为了呈现给用户真实客观的质量评分。我们致力于铲除这些捣乱行为。
然而,上有政策下有对策,这些搞事的人不断地适应并避开我们的对策,与我们建立起一种敌对关系。
如此一来,比起采用传统的监督学习算法,我们需要开发一个能灵活应变的方法,让我们迅速对付随机应变的捣乱分子。
为了达此目的,我们结合监督型与未监督型两种算法,利用未监管机器学习算法生成数据,然后把数据作为学习样本在监督型机器学习下做计算。
AppSo(公众号 AppSo)注:机器学习算法可分为监督学习与无监督学习。简单讲监督学习是已知标准答案,让机器学习解决问题的方法,而未监督学习过程中不提供标准答案,本系列第一、第二篇文章中提及的算法都属于监督型。
通过利用 Google Play 平台上发生的互动,交易等行为数据,我们的侦察算法可以识别出刷分刷榜等恶意行为。例如,恶意的刷分行为通常从同一个服务器上提交评价,而正常的评分行为通常来源广泛。
我们接着把刷分刷榜的人作为训练数据,开发一个算法模型来预测相似的捣乱分子。这个模型利用监管学习算法搭建,不断地拓展应用范围,消除 Google Play 上的刷分刷榜。
我们力争在加快应用审核的同时,不对用户的安全妥协,使 Google Play 成为对开发者和用户最佳的应用平台。上文提及的机器学习算法帮我们实现了这两个目标,而我们也会继续改进这些技术,保证让你不受刷分刷榜的应用所困扰。
致谢
以上研究是 Google Play 团队与 Yang Zhang、Zhikun Wang、Gengxin Miao、Liam MacDermed、Dev Manuel、Daniel Peddity、Yi Li、Kazushi Nagayama、Sid Chahar 和 Xinyu Cheng 的合作成果。译者李煜阳。
延伸阅读:
Google 开发者(微信公众号谷歌开发者)Google 推出 MultiModel,可同时学习 8 种不同任务
本文由让手机更好用的 AppSo 授权翻译,关注公众号 AppSo,回复「榜单」,获取 2016 年最赞的 10 个 Android 应用。