为了拯救吃货,这位日本程序员做了一个拉面馆定位器
吃货们往往都会遇到这样一个窘境:深夜看到一些报复社会的美食照片,愤懑之余自然会好奇它们的出处。可单纯靠图片一般都很难获知它们到底是出自哪家餐厅,这无疑给以后的觅食带来了很大的难度。
不过现在通过机器学习软件,或许以后单纯靠照片,就真的可以辨别出它出自哪家门店了。
Google 官方博客近期介绍了一项实验成果,来自日本 NTT Comware 道路监测系统研究开发的土井賢治,借助 Cloud AutoML 技术,将关东地区约 41 家日本次郎拉面店(ラーメン二郎)的 48000 张实拍拉面照片导入到程序中,从而辨别每碗拉面的 “出身”;而次郎拉面店则是日本地区非常著名的连锁拉面品牌,以提供份量十足的拉面配料而闻名。
这些照片都已经提前标注好了位置数据,所以在经过 24 小时的 AutoML 数据训练后,最终出炉的 AI 已经能很精准地对拉面照片进行辨别了,准确率达到了 94.5%。
这个检测方式的过程也十分有趣。据日本媒体 HRナビ 报道称,最初土井賢治受到同事项目启发,便使用 Apache MXNet 深度学习技术框架来进行实验,样本则是从 Twitter 和 Instagram 收集到的 33000 张照片,那时候的准确率已经达到了 87%。
他还专门在 Twitter 上开通了一个 ID 为 jirou_deep 的机器人账号,上面就有大量自动识别拉面照片的案例。
而现在转而使用 Cloud AutoML 技术后,准确率进一步提升到了 94.5%。
起初,土井賢治认为 AI 是将碗的形状和桌面的颜色来作为参考目标,以便有效针对不同餐厅进行分类,然而这对于一家连锁餐厅来说有些不切实际,毕竟大家用的都是同一套的模板,也不可能让 AI 靠 “味觉” 来对拉面进行辨别。
目前真正的检测手法还在研究当中,但最大的可能性应该是根据不同餐厅拉面的叉烧体积和配料差异来进行区分的。虽然从图片来看,次郎拉面馆的制作手法都比较粗犷,但要说叉烧在形态上的微小差异,大概真的只有机器学习才能察觉吧。
不过就如开头所说,对于一些没加地理位置标签的美食照片来说,现在借助 AI 的确可以更有效地查找对应的餐厅位置。
这背后也少不了 Cloud AutoML 和图像识别技术的协助,除了这项实验,Cloud AutoML 技术也有一些比较成熟的项目,比如迪士尼乐园便会通过建立好的图像模型,就可以很方便地对商品进行品类或角色的划分。
事实上,Cloud AutoML 所面向的也正是一些没有太多 AI 技术背景的开发人员和企业,像微软也有类似的名为 Custom Vision 的图像识别服务,目的就是在于将一些重复性较高的工作交给机器来实现。
虽然从原理来看,前期依旧需要做人工调试工作,但对于有特定分类需求尤其是图像分类的商家来说,只需要上传一些照片做样本,就可以很快速地建立一个定制化的机器学习模型。不得不说,这种自动化服务对于降低人力成本来说的确十分有效。
题图来源:LINE BLOG