微软牛津计划刚开放了表情识别 API,用来识别蒙娜丽莎会有什么结果?
日前,微软伦敦剑桥研究院的负责人 Chris Bishop 在 Future Decoded 的演讲上宣布:Project Oxford 中 emotion recognition(表情识别)API 的公开测试版正式开放给开发者使用。
Project Oxford 的表情识别 API 可以识别八种核心的的表情:生气、藐视、害怕、厌恶、开心、悲伤、惊喜以及面无表情。
(《Mad Max 5》的女主很生气)
(面无表情、略带微笑……)
微软科研组高级项目经理 Ryan Galgon 列举了几个应用场景。借助 Project Oxford 表情识别 API,市场营销人员可以估计消费者对商店展示、电影或者食物的情绪反应。开发者也可以将 API 应用于自己的 app 中,例如即时通讯 app 能基于照片中人物的表情而给出不同选项。
Project Oxford 由微软研究院主导开发,主要为 Azure 用户免费提供 API 服务,包括人脸识别、语音识别、图像识别和名为 LUIS(Language Understanding Intelligent Service)的语义分析。其中语音识别和 LUIS 都建立在 Bing 的语音识别和处理上。表情识别 API 属于人脸识别的一部分。
除了表情识别的 API 外,微软还开放了其他几个工具的公开测试版,比如 Spell check(拼写检查)API。
拼写检查 API 可以识别出像 “gonna” 这种英语俚语,品牌名、常见的名字错误以及一些很难发现的错误,比如 “four” 和 “for”。这个 API 的公开测试版现在就可以使用了。
Video, speaker recognition, custom recognition intelligent services 这些 API 的测试版在年底才开放,其中 custom recognition intelligent services 采用邀请制。
题图来自 3News