放弃百万年薪,施乐科学家如何实现增强现实梦想? | iSeed
如果要让机器人和人一样,首先得让它感受到人所能感受到的世界。从 Wii 开始,到 Kinect 再到 Project Tango 以及 Hololens,我们看到计算机视觉领域的飞速发展,开始让机器拥有自己的眼睛。因此本次 iSeed 访谈系列主题为 “为计算机安上眼睛”,我们采访了数家相关团队,将陆续发布。
从今年大公司的动态不难看出,AR(增强现实技术)目前正处于市场快速启动的阶段。从年初微软发布 Hololens,到 3 月 Oculus 两笔和 AR 有关的收购,再到 5 月苹果突然收购 Metaio,领头者的 AR 布局已相当明显。不久前,欧洲计算机图形学会主席 Dr. Werner Purgathofer 也表明:AR 会比 VR 更快普及,因为 AR 更容易落地。
在这热浪涌起之前三年,在施乐担任科学家的亮风台创始人廖春元放弃在美国的百万年薪和中产阶级的生活,带着全家回国创业。
2012 年 11 月,亮风台成立于上海,主要专注于 AR 底层技术研发,处于计算机视觉领域的上游。其增强现实开发平台 HiAR ,可以实现实时跟踪精度在 0.5 像素,速度达 125 帧/秒,跟踪倾斜角 80 度以上。此外,它还支持本地识别 2000 以上的图集,本地识别时间低于 100ms/帧。
这些数据表明,亮风台 HiAR 识别和跟踪的表现,是快速、稳定、流畅的。
- 0.5 像素:跟踪的精确度很高,视觉无法感知到误差;
- 125 帧/秒:跟踪很流畅,25 帧/秒是实时跟踪的要求
- 倾斜角 80 度以上:允许自然姿态操作,不要求正对图 像识别;
- 2000 张:100 毫秒/帧:在本地图片达到一个比较高的数量级的时候,依然保持很快的识别速度。
这一切都让亮风台有别于其他 AR 创业公司。
虽然 HiAR 的发布还不到 1 个月,但是 HiAR 的打磨则是从亮风台刚成立就开始的,甚至是从十几年前青葱少年选择人机交互就开始的。
从亮风台成立,到 HiAR 的推出,不论是初期的项目,还是后来全身心地专注于平台研发,经历了千万次的算法优化、产品完善,外界可能看到的是一次 Release,一个稳定的版本,而内部是无数次的版本迭代,无休止的测试,伴随开发人员的是不停的加班加点。
为了使开发者更便利地实现 3D AR 效果,亮风台决定在 SDK 中直接内置 3D 引擎。现在,HiAR SDK 的 3D 引擎,能支持最多原生 3D 动画格式,摆脱了第三方引擎的制约,达到帮助客户省时、省力、省钱的目的。
目前来说,网络也是制约 AR 普及化的障碍之一,用户担心流量,企业担心费用。为了提升用户体验,亮风台决定进一步支持离线 AR 功能,并且优化识别技术,提供更小空间更大本地量更快速的离线识别。
“千万人用上我的产品,比写一篇论文的成就感大多了。可能是对图像、视频等视觉媒体有种本能的情结,我从小就喜欢集邮、收集小人书等图片类的东西,长大后做 AR 和视觉交互是非常自然的。”
亮风台将自己定位于 AR 生态中的系统研发者
廖春元跟 AR 的正式接触可以追溯到 1996 年,当时他作为本科实习生参加了清华大学人机交互和媒体集成研究所研究小组,之后将近 20 年一直在做相关的工作。他觉得自己赶上了创业的大好时机——AR、人工智能技术已经落地,云计算给了智能机几乎无限的存储能力;中国坐拥世界上最大的互联网用户群;有一群深刻了解移动设备行业发展的小伙伴在身边支持(亮风台 4 位合伙人都是来自云南昭通一中的发小,连 “亮风台” 这个公司名也是取自云南的 “凉风台”)。
除了外部条件相对成熟外,内在因素也不可忽视。廖春元自认为自己有 “产品情结”,虽然在学术上得到了一定的成就,但还是希望自己做的东西能被千千万万人所使用,这种成就远远大于写一篇论文。所以,在廖春元的眼中,创业不是心血来潮,Just Follow My Heart。
做大事,怎能小富即安
亮风台创始人廖春元
回顾亮风台的发展,2012 年成立,初期靠做外包来养活自己;2013 年开始整合之前的研发成果,把 AR 底层技术模块整合到一起;2015 年 8 月推出 HiAR 开发平台,提供 AR 核心引擎、云识别、内容管理和前端浏览 App 等一系列服务。
看似顺理成章的背后,磨练是必不可少的。廖春元把这一成长过程归纳为四个阶段。
第一,认清公司目标。说起来容易,做起来却很难。2012 年,廖春元毅然决定辞职全家回国创业的时候,只有一个大的方向:移动+图像识别。
而这个大方向又包含了增强现实、人脸识别、手势交互、文字识别等很多子方向,一时间也是十分迷惘。“每一个感觉都很有前途,但是作为创业团队不可能都去尝试” 廖春元说道。到了 2013 年,Google、百度等搜索巨头开始推动图像搜索;“用户体验”、“交互” 这些昔日在人机交互研究领域的术语开始大众化。到了 2014 年,VR 大行其道,虚拟现实一时间风靡创业投资界,这时候他看到了和 VR 密切相关的 AR 呼之欲出,于是加快了在核心技术上的布局。
第二,认清团队的核心竞争力。公司的目标和团队的核心竞争力密切相关,尤其在创业初期。这方面,亮风台曾走过弯路,他们曾尝试开发一两款纯 2C 型的娱乐 App,结果在研发和运营过程中发现,这个不是自己这群 70 后大叔所擅长的东西,对产品的 ‘好’ 和 ‘坏’ 没有判断的把握。最后果断终止了研发,重新把重点转到了最有优势的地方——AR 底层核心技术。“目前看来,这样的调整是非常及时和正确的。”
此外,核心竞争力也在演化。廖春元不赞同 “团队基因是 XX,公司以后就只能 XX” 这样的说法。一个很好的例子是华为。华为是从电信基础设施起家的,10 年前他们的产品和终端用户基本不搭界。但他们也在慢慢向 2C 靠拢。果然,我们看到了现在华为在手机、路由器等消费产品上的成功。
第三,坚持和舍得。廖春元承认:“亮风台一路走来,也经历了很多诱惑。” 2012 – 2013 年间,他们承接了不少 AR 项目的外包工作,现金流不错,公司盈利不是问题,但负面效果也很明显。因为人手有限,核心技术积累就会延误,未来的竞争力受到了严重的影响。回归初心,廖春元意识到自己当初是希望把自己在人工智能、增强现实方面的一技之长应用在更广的世界。于是马上进行转型,2015 年完全放弃了 AR 的外包项目,全力以赴 AR 核心技术研发。
另一个层面的坚持是对价值观的坚持。“当前国内的 VC 和创业圈有相当的浮躁心理,大家都想一夜暴富、年少成名、20 岁登上人生巅峰迎娶白富美。各种操作、做假、2VC 项目层出不穷,一时间可能声势远远超过低头忙着做事的人,这时候要专注于你的核心要务。” 廖春元说。
第四,感恩。独木不林、孤掌难鸣。创业不能全靠单枪匹马打拼,需要调用各方面的资源,及各方支持。
如何招到美、法、韩资深人才
当然,作为一家相对先锋的创业公司,如何吸引到靠谱的人才是每个团队需要面对的问题,亮风台也不例外。人工智能、图像识别领域有一定的特殊性。在几年前这个领域还不温不火的时候,很多专业研究生毕业后纷纷转行,坚持下来的人很少,导致人才储备有限。而同时,这个领域的理论门槛又比较高,普通人至少需要 2~3 年才可能开始形成初步理论体系。
起先,亮风台坐收简历,但效果很差,猎头给了几百份简历才录取了一位。于是,他们决定从其他方面入手。首先把目光投向专业学术群、大学和研究所,通过老师、朋友、同学、同事推荐好的人选。其次,加大在学术圈的宣传力度,积极支持和参加各种学术活动,扩大影响力。最后,加快产品研发,用产品证明团队的实力,建立口碑,吸引志同道合的人。这一方法效果比较显著,至今已成功吸引到了来自美国、法国、韩国等知名大学的博士,以及来自 Microsoft、Facebook、华为等 IT 公司的专家。
目前,亮风台的团队包括四十多位开发人员,由计算机视觉、人机交互、移动互联网等业内大牛带领,是充满梦想、脚踏实地的增强现实研发梦之队。
我们离真正的 “人工智能” 还差很远
尽管图像识别发展至今已日渐成熟,尤其是深度学习极大地推动了图像识别的产品落地。一时间,“人工智能奇点来临”、“计算机很快要超越人类” 的叫嚣不绝于耳。但作为从业者,廖春元看的却比较冷静,他坦言计算机达到人的图像识别能力还有很长的路要走。特别是如何提高机器学习训练的泛化能力(Generalization),用少量的训练样本识别大量从来没有训练过的图片是个世界性的难题。就连深度学习鼻祖 Yann LeCun 也提醒人们不要过度乐观。
除此之外,国内与国外在行业和市场上也存在一定的差异,比如投资的热度;底层研发人员的数量;精品 AR 创意,以及较为成熟的工业用途解决方案的差异等。这一切都给发展中的亮风台带来一定的挑战。首先是如何针对市场需求,尽快把技术产品化;其次是如何面对一些大公司的竞争,最后是,作为一个新兴产业,如何教育市场、整合资源和推广产品。要解决这些难题,还需要全行业的努力以及共同的深耕。
值得高兴的是,国内的局面正在迅速改善,一些 AR 应用也已经落地。比如小熊尼奥、摩尔字母庄园、哈哈画报等。另外,由于在通用识别层面提高图像识别准确度的难度,因此,不得不 “分而治之”,在人脸、手势、肢体、文字、指纹、虹膜等方面深耕,这也形成了图像识别 “碎片化” 的特点。因此,与图像识别相关的 AR 也就具备了这种碎片化的特点,廖春元也认为这也是一个很好的创业领域。
创业就是战斗,是人生的高度浓缩
虽然图像识别和 AR 技术并不算一个很新的概念,但对于大众来说仍会给它们贴上 “高科技” 的标签,那么,如何提升自己在大众消费者中的认知度呢?廖春元认为,想要提高用户对某一领域的认知度,最好的办法是通过产品。“VR 已存在超过 50 年,但 Oculus Rift 的出现,才让 VR 这个词席卷全球;二维码也早已存在,但直到微信的出现,才让人们明白二维码的用处” 因此,对于 AR 也一样,与其对普通用户解释 AR 的概念,不如直接通过产品来诠释。当然,提升大众的认知非一日之功,需要各家厂商联合才能做到。
目前,亮风台已基于 AR 产业链与不同厂商进行合作,包括应用开发、内容制作、硬件、教育娱乐、互动营销、旅游文化等领域,期望能建立起完整的 AR 生态圈。
三年的创业之路给廖春元带来的益处不可谓不大,用他自己的话来说:
“其实创业之路每天都像战斗,是人生的高度浓缩。”
说起创业之路上最触动他的事时,他回忆道:“记得当初在美国的富士施乐硅谷研究院工作时,有很多非常资深的研究员。每届满 5 年的时候,员工都会收到一封精致的表扬信,刻在金属匾额上。2012 的一天,我一位同事在员工大会上接受了工作 20 年的贺信。但在那一瞬间,我回忆起六七年前我做实习生的时候,他就是这个样子,这么多年过去了,没什么变化。回到我自己,如果沿着研究这路走下去,我一眼可以看到我以后的样子:悠闲、平淡、没有激情。这让我最后下定决心辞职回国创业。”
“一路走来,合作伙伴们的鼎力支持与无数灯火通明连续加班的夜晚都历历在目。我认为自己是幸运的,能有机会做自己喜欢的事情,并得到家人和朋友的支持。”
最后,廖春元给其他创业者推荐了几本对他最有益的书:
- 《产品经理修炼之道》,系统梳理产品思维,帮助创业者把人机交互的研究经验和产品设计原则对应起来;
- 《从 0 到 1》和《创业维艰》,帮助创业者思考公司的管理和战略规划,理解成功创业者的心路历程,对自己面临的问题和困境更坦然。
PS:下一期 iSeed 系列访谈主题是:在虚拟世界中现实着,主要报道 “虚拟现实” 方向。如果你想参与到 iSeed 系列报道,或者有相关项目推荐,请发邮件到 [email protected],请注意在邮件标题写上 “iSeed 报道推荐”。