利用图像识别,这个 App 想成为视力受损用户另一双眼睛
智能设备的发展,使得我们有了很多以前从未有过的感知世界的方式。而对于残障人士来说,这些新技术就像传播学大师麦克卢汉所言,成为他们 “人体的延伸”,帮助他们过上更加便利的生活。一个名为 BlindTool 的 Android 应用,就通过图像识别的方式,让视力受损的用户能够更方便地 “看” 到这个世界。
BlindTool 的开发者 Joseph Paul Cohen 是麻省大学波士顿校区的一位博士。App 的使用非常简单,用户只要将手机摄像头对着物品,它就能够进行识别并且用语音播报出来。听起来,这个 App 还真的像一双眼睛。
几年前我和一位盲人程序员一起工作,这让我开始关注到视力受损人群的需求。我当时有一个想法,就是通过某种技术来帮助他们 “看见” 这个世界,但是那时候还未能实现。
而现在,图片识别技术已经发展到一个新的高度,之前爱范儿的副主编就曾利用 Google 来找出奇葩的 12306 验证码答案。微软在今年也公布一项里程碑式的成果:它的图像系统识别图片的错误率比人类还要低。
不过这些技术的背后,需要的是强大的计算机或者云端服务的支持。对于 BlindTool 这种自成一体的小应用来说,这并不现实。于是在 BlindTool 中,测试图片的种类仅有 1000 种(与之相比,最先进图片识别系统图片类别数是 37000)。
Cohen 解释,这样做可以保证图片识别的速度。“就算只是 5 秒钟,都会让我对它很心烦”。经过优化,现在 BlindTool 已经可以做到在 1 秒内完成识别和播报了。
不过这同时带来了一个严重问题:识别不准确。BlindTool 目前的解决方法是只有确定度在 30% 以上才会有语音播报,而如果十分肯定——即 90% 以上则会有震动反馈。
虽然有人不断吐嘈互联网和新技术带来的负面影响,但不可否认的是,对于少数人群,它们带来的是生活上翻天覆地的变化。
题图来自:nytimes
插图来自:fastcodesign