利用图像识别，这个 App 想成为视力受损用户另一双眼睛

智能设备的发展，使得我们有了很多以前从未有过的感知世界的方式。而对于残障人士来说，这些新技术就像传播学大师麦克卢汉所言，成为他们“人体的延伸”，帮助他们过上更加便利的生活。一个名为 BlindTool 的 Android 应用，就通过图像识别的方式，让视力受损的用户能够更方便地“看”到这个世界。

BlindTool 的开发者 Joseph Paul Cohen 是麻省大学波士顿校区的一位博士。App 的使用非常简单，用户只要将手机摄像头对着物品，它就能够进行识别并且用语音播报出来。听起来，这个 App 还真的像一双眼睛。

几年前我和一位盲人程序员一起工作，这让我开始关注到视力受损人群的需求。我当时有一个想法，就是通过某种技术来帮助他们“看见”这个世界，但是那时候还未能实现。

而现在，图片识别技术已经发展到一个新的高度，之前爱范儿的副主编就曾利用 Google 来找出奇葩的 12306 验证码答案。微软在今年也公布一项里程碑式的成果：它的图像系统识别图片的错误率比人类还要低。

不过这些技术的背后，需要的是强大的计算机或者云端服务的支持。对于 BlindTool 这种自成一体的小应用来说，这并不现实。于是在 BlindTool 中，测试图片的种类仅有 1000 种（与之相比，最先进图片识别系统图片类别数是 37000）。

Cohen 解释，这样做可以保证图片识别的速度。“就算只是 5 秒钟，都会让我对它很心烦”。经过优化，现在 BlindTool 已经可以做到在 1 秒内完成识别和播报了。

不过这同时带来了一个严重问题：识别不准确。BlindTool 目前的解决方法是只有确定度在 30% 以上才会有语音播报，而如果十分肯定——即 90% 以上则会有震动反馈。

虽然有人不断吐嘈互联网和新技术带来的负面影响，但不可否认的是，对于少数人群，它们带来的是生活上翻天覆地的变化。

题图来自：nytimes

插图来自：fastcodesign