AI 普惠,vivo 为先
如果要评选过去三年里最重要的发明,那 ChatGPT 的票数无疑会遥遥领先。
自 2022 年 11 月 30 日以来,ChatGPT 已经上线 400 天了,从质疑到讶异再到恐慌和振奋,已经没有人会否认大语言模型带来的 AI 产业革命,是下一个千亿美元级别的机会。
▲ AI 绘制的钨丝灯泡发明场景. 图片来自:BlueLM
1831 年,迈克尔·法拉第发现了电磁感应,造就了发电机的发明。近半个世纪之后,托马斯·爱迪生发明了能够长久照明的钨丝灯泡,真正推动了电力在工作与生活中的广泛使用。
如果说 ChatGPT 打开了 AI 技术的应用思路,那么大语言模型时代的钨丝灯泡在哪里?
对于 vivo 的用户来说,可能就在自己的手机里。
AI 不该是少数人能施的魔法,而是更多人能享受的普惠
当我们聊起 ChatGPT 的时候,许多人聊的不是怎么去用 AI 提升生产力,而是怎么注册一个新账号。
受多重因素叠加影响,ChatGPT 不是一个信手拈来、唾手可得的工具,如果具体到我们日常生活中,尤其是形影不离的手机上,会发现虽然 AI 大模型的发展态势喜人,但真正好用的产品并不多——绝大多数大模型都属于「心愿单」排队的阶段,你需要申请内测才有机会用上,而且在使用时,他们可能会占掉你一整个屏幕,在应用之间反复横跳几次就体验全无。
这也是为什么 vivo 蓝心大模型值得关注的原因,这个由 vivo 自主研发的通用大模型已经接入到旗下最新的 OriginOS 4 中,下半年发布的 vivo X100 系列、iQOO 12 系列、iQOO Neo 系列和 S18 系列已经实装了这个系统,并搭载了蓝心小 V 人工智能助理,开机就能用。
跟其他大模型应用相比,根植于系统底层的蓝心小 V 采用了一个很有趣的设计——在手机屏幕边缘滑动就可以呼出,有一个专门的大模型聊天窗口,占用屏幕约三分之一的尺寸。你可以很方便地在这个窗口向小 V 发起咨询,无论是文生文、文生图还是图生图都能胜任,也可以实现全局的图片、文件检索,并且直接可以从小 V 的聊天框拖拽文件到微信、Word 里,用起来非常方便。
易使用、查询准的优异表现,依靠的是 vivo 蓝心大模型背后颇高的完成度。
考虑到智能手机是主要的产品体验入口,且使用场景复杂,因此蓝心大模型一开始就不是孤军作战,而是由五个不同参数的模型组合起来的大模型矩阵——覆盖 10 亿、70 亿、700 亿、1300 亿和 1750 亿五个参数量级。
其中,10 亿量级模型是主要面向端侧场景打造的专业文本大模型,具备本地化的文本总结、摘要等能力;70 亿模型是面向手机打造的端云两用模型,具有优秀的语言理解、文本创作能力;而 700 亿模型以及参数量级破千亿的模型,则是面向云端服务的主力模型,在 C-Eval、CMMLU、SuperCLUE 等榜单的 10 月测试结果中,均处于中文大模型的第一梯队。
现阶段,10 亿跟 70 亿两个参数的模型已经在多款 vivo 手机中实装,支持高通和 MTK 双芯片平台的部署,用来提炼文案、生成图片甚至梳理脑图,都是不错的选择。
这是综合考虑手机能耗、响应速度和使用安全等各方面之后权衡的结果,日常使用响应速度非常快。微信聊天时经常会聊到一些新知识点,这时候边缘右划调出蓝心小 V 科普一下或做个脑图会非常方便,后续随着更高参数大模型的开放,蓝心小 V 也有着更多的进化空间。
当然,vivo 也知道在日新月异的行业趋势面前,开源能够帮助蓝心大模型走得更远。目前,vivo 已经宣布将开源 70 亿参数量级的蓝心大模型 7B,这个模型采用了 2.6 万亿的 token 数进行训练,以中英文语料为主,是更适合中文情景下使用的产品。日后,说不定我们可以在许多 vivo 之外的产品上用上蓝心大模型,而这些宝贵的使用场景,也将促进蓝心大模型的迭代。
这些也是 vivo 蓝心大模型特质的具体表现——大而全、算法强、真安全、自进化、广开源。
为了让更多人直接体验到蓝心大模型,2024 新年伊始,vivo 就在上海、深圳、广州、杭州、武汉、南京等多个城市开启了蓝心大模型的线下体验活动。这也是第一次有厂商做大规模面向普通用户的 AI 体验活动,侧面也反映了 vivo 对蓝心大模型的自信。
用户可以通过手机快速让蓝心大模型画出新年心愿卡、写新年祝福语、生成新年头像等,这些都是过新年要花不少时间去张罗的工作,但 AI 的加入让这件事变得高效又有趣起来。vivo 用浅显易懂的方式,直接把大模型的使用场景带到用户面前。
vivo 副总裁、OS 产品副总裁、vivo AI 全球研究院院长周围表示:
我们举办这次活动,是希望有很多的人,可以了解最先进的人工智能技术和产品,用上蓝心小 V,帮助大家有更轻松地学习,更高效地工作和更美好的生活体验。
6 年时间、千人团队和不断地投入、创新和突破,才有了综合得分第一的蓝心大模型,我们希望实现 AI 普惠,真切地帮助到更多的人,共同促成生活与社会的进步。
试想一下,当搭载大模型的手机,在学习用户操作习惯之后,将不仅仅是通信工具,也能成为你的健康管理助手、旅行指南、购物推荐等——让生活更加便捷舒适,最终成为你的私人助理。同时大模型还将学会使用手机里的各类 app,比如制订旅行攻略、预订更合适的机票酒店;在购物时全程双向沟通,辅助用户挑选到心仪商品等,深入用户生活的方方面面,让 AI 真正走进千家万户。
如果你不在这些城市,也没有 vivo 手机,还可以下载「蓝心千询」app——这是 vivo 基于蓝心大模型开发的 AI 助理。相较蓝心小 V,虽然少了一些系统全局调用的能力,但同样可以体验到蓝心大模型的文生文、文生图等各项实用功能,支持 iOS 和 Android 双端,完全免费且无广告。
基于 AI 技术的应用,vivo 也不止于让大语言模型担任个人助理。
得益于蓝心大模型, OriginOS 4 更新了「vivo 看见」和「vivo 读谱」两个面向视障群体的无障碍能力——
其中,vivo 看见是一款支持环境描述、物品查找和拍摄辅助的视觉辅助产品,蓝心大模型的识图和理解能力,可以在多种场景下助力用户识别信息,并给出直观的描述,对于视障人士的日常生活非常有帮助。
而 vivo 读谱则拥有本地乐谱便捷导入、听曲成谱、乐谱朗读等能力,对于许多视障用户而言,音乐是理解世界的重要途径,有了大模型能力的支持,一个人也能享受音乐学习的乐趣。
在 vivo 看来,好产品必然是普惠的,即便是到了 AI 时代,我们依然能在 vivo 的产品理念和设计中找到这家公司一以贯之的人情味。
手机行业的长跑选手,在正确的赛道上先跑起来
自 2011 年进入智能手机市场至今,vivo 是手机行业的长跑型选手。
这家将「本分」根植于文化基因中的企业,当遇见长坡厚雪的赛道时,也会是最先跑起来的那一个。
实际上,自发布到落地,vivo 蓝心大模型只花了 60 天就在四个系列八款手机上部署,并且随着 OriginOS 4 的升级接入到更多的产品当中,放眼全球也是独一档的速度。
显然,人工智能就是那个千载难逢的机会,而 vivo 早在五年前就已经预见了。
2018 年的世界人工智能大会上,vivo 副总裁、OS 产品副总裁、vivo AI 全球研究院院长周围预测,手机行业将在两年后迎来变革,将会成为一个「自学习、自索引、自推荐的智能终端」——当时,AI 化的手机成为影像手机之后,vivo 又一个重金押注的赛道。
就在大会前两个月,vivo 宣布在深圳、北京、杭州、南京以及美国圣地亚哥,投资建立「vivo AI 全球研究院」,进行人工智能领域基础科学和颠覆式技术的创新研究,是中国第一个建立 AI 全球研究院的手机厂商。
也是在这一年,OpenAI 发表了题为《通过生成式预训练提高语言理解能力》(Improving Language Understanding by Generative Pre-Training)的论文,在其中首次介绍了基于转换器的生成式预训练模型系统(Generative Pre-trained Transformer),简称 GPT。
彼时的 vivo 不会想到,五年后,GPT 会成为奠定万亿美金产业的基石,但就在那时,vivo 已经意识到人工智能的本质——那就是信息交互方式的决定性变化。周围曾在演讲中提到:
它是一个金字塔,简单的说,人工智能是通过数据 + 算法,得到新的数据,最重要的是,精确识别出场景,把消费者需要的服务,精准、按时、按需推送给消费者,这个过程就是人工智能。
手机在出厂的时候,就内置了超过 100 个功能与服务,而随着技术的发展,这些功能将会全部被 AI 化——计算摄影是手机相机的 AI 化,蓝心小 V 则是语音搜索的 AI 化。人工智能的发展源流,就是 AI 从这些服务和能力的基础设施,变成这些服务和能力本身的历史。
尽管智能手机的进化才刚刚开始,但经过五年的积淀,vivo 已经在人工智能这条赛道上跑了很远。人工智能技术最需要积累的能力有四个——数据、人力、算法、算力。
在数据方面,2018 年 vivo 成立了图谱研究院,通过专业团队建设知识图谱,目前已积累了超过 2800TB 的数据;
在人力方面,vivo 从 2017 年开始就一直维持着一支 1000 人规模的专业人工智能团队,其中有超过 600 人专注研发大模型;
在算法层面,vivo 累计发表了 70 多篇人工智能相关论文,其中很多应用成果我们在 vivo 手机上已经可以用上了;
在算力层面,vivo 已经储备了能够训练出千亿级大模型的算力系统,并且在中文大模型领域已经有先发优势。
去年的这个时候,vivo 创始人沈炜在线上年会上发表了《埋头种因,基业长青》的致辞。这八个字,也可以说是 vivo 这家公司的真实写照。今天我们看到 vivo 手机中的优势能力,本质上都是这家企业十几年来埋头种下的因——设计如此,影像如此,AI 也是如此。
十年前,拍照还是一个高门槛的技术活,你需要买镜头选机身,还要学布光懂构图,拍好照片,后期也是一个大工程。但如今,你用 vivo X100 Pro 就可以拍出不逊于相机品质的照片,一部手机里有多个焦段的镜头,且按下快门后,无需软件后期就可以有好看的色彩影调和虚化效果——某种意义上讲,这也是一种技术普惠。
全球有数亿人,他们可能是因为产品设计、影像或性能,选择使用 vivo 的产品,他们是 vivo 在智能手机时代的同行者。未来,也会是这家公司在 AI 普惠时代的受益者。
因为我们都知道,这家信奉长期主义的公司,他们最好的时候不在当下,而在未来。