华为盘古大模型 3.0 发布,友商们该急起来了?
「AI for Industrise 大模型重塑千行百业。」
华为云官网上醒目地挂着一句关于华为盘古大模型的简单阐述。
今天下午两点半,华为开发者大会 2023 正式在东莞篮球中心召开。华为常务董事长、华为云 CEO 张平安在会上正式宣布推出华为盘古大模型 3.0。
▲ 图片来自:华为云
发布会刚开场,「不作诗,只做事」就显露在发布会屏幕上,似乎早早地为发布会定下了主基调。
事实上,华为盘古大模型的历史至今也才不到三年的时间。2020 年 11 月,华为盘古大模型在华为云内部立项成功,也完成了与合作伙伴、高校的合作搭建。2021 年,华为盘古大模型也正式对外公布,包括 NLP(自然语言处理)、CV(机器视觉)和科学计算大模型;后续又发布了矿山、药物分子、气象、海浪等行业大模型,深入金融、制造、政务、煤矿、铁路等 10 多个行业,支撑 400 多个业务场景的 AI 应用落地。
此大模型非彼大模型
此大模型非彼大模型,在 AI 大模型的「军备竞赛」中,华为盘古大模型凭借华为云计算算力、算法和数据的支持,并不满足深耕于常规的垂直大模型,而是极致追求能够处理多种任务和领域的通用大模型,提前地赢在了起跑线上。
纵览张平安的全程演讲,「行业」可谓是提及频率极高的词汇了。与 ChatGPT 为代表的大模型不同,华为盘古大模型的用户群体主要面向 To B/G 政务端客户,这也就意味着盘古大模型的技术模型要足够大,技术能力要足够强,技术风险要足够低,技术应用要足够广。
公开资料显示,华为云在刚开始打造盘古大模型的时候,团队就确立了三项最关键的核心设计原则:一是模型要大,可以吸收海量数据;二是网络结构要强,能够真正发挥出模型的性能;三是要具有的泛化能力,可以真正落地到各行各业的工作场景。
▲ 图片来自:华为云
当我们把时间维度拉到 2023 年的当下,我们会发现这些「规矩」依然流淌在华为云盘古大模型的血液里。
华为云官网显示,华为盘古大模型目前主要是由 NLP 大模型、CV 大模型、多模态大模型和科学计算大模型。其中 NLP 大模型是行业内首个千亿参数中文大模型,拥有 1100 亿密集参数,经过 40 TB 的海量数据训练而成。CV 大模型在业界首次实现了模型的按需抽取,实现了在 ImageNet 上小样本学习能力业界第一。
▲图片来自:Nature
发布会上也提到,昨天国际顶级学术期刊《自然》(Nature)杂志正刊发表了华为盘古大模型研发团队研究成果,这是中国科技公司首篇作为唯一署名单位发表的《自然》正刊论文。原来预测一个台风未来 10 天的轨迹,需要在 3000 台服务器的高性能计算机集群上花费 5 小时的仿真,但在华为盘古气象大模型的帮助下,研究者能够在 10 秒内就可以获得更精确的预测结果。
在煤矿领域,华为盘古矿山大模型也已经在全国 8 个矿井上使用,覆盖煤矿的采、掘、运等 1000 多个细分场景,让更多的煤矿工人也能在地面上工作,极大改善煤矿工人的工作环境。
▲ 图片来自:华为云
发布会上,张平安表示,华为盘古大模型 3.0 是一个完全面向行业的大模型系列,包括 5+N+X 三层架构,其中第二层的 L1 层是 N 个行业大模型,既可以提供使用行业公开数据训练的行业通用大模型,包括政务,金融,制造,矿山,气象等;也可以基于行业客户的自有数据,在盘古的 L0 和 L1 上,为客户训练自己的专有大模型。
所以在发布会上,华为云 EI 服务产品部部长尤鹏在展示华为盘古大模型 3.0 的实际使用效果时,并不像其他厂商一样直接在发布会上展示 AI 作诗成画的能力,而是结合各行业遇到的问题,强调如何运用华为盘古大模型 3.0 进行解决。
比如,在 To G 方面,华为与深圳市福田区政府进行合作,将盘古政务大模型运用到便民服务中。发布会上,尤鹏询问福田政务助手:「深圳市有哪些招商引资的政策?对新落户企业有哪些优惠?政策对象有哪些群体?」福田政务助手的回复基本能够做到实时回复且答案具有一定的条理性和逻辑性。
▲ 图片来自:华为云
此外,华为盘古大模型 3.0 在与 To B 的合作中也有着不俗的表现,比如,华为盘古大模型和美图进行了模特生成功能,用户可以根据搭配,选择不同的穿衣风格。又或者华为与天眼查共同发布新产品天眼妹,打造可信商业助理,这也是业界首个基于「可信数据+可信算法」的面向个人端的可控大模型数据产品。
现如今,通过模型泛化,华为盘古大模型 3.0 能够解决传统 AI 作坊式开发模式下不能解决的 AI 规模化、产业化难题,支持多种自然语言处理任务,包括文本、图像、视频的识别、处理和生成等,与客户伙伴共享大模型的价值与机遇,为千行百业打造自己的大模型,让大模型触手可及。
或许今天在华为展露盘古大模型 3.0 的实力之后,友商们得开始着急起来了。