腾讯发布混元大模型!在微信里有个「贾维斯」是什么体验?
8 月 31 日,注定成为国产大模型历史上的关键转折。多家国产大模型公司通过备案,陆续向全社会公众开放服务。
这意味着国产大模型进入一个全新的阶段,国产大模型可以向数以亿计的用户提供服务,同时也将面临同样倍数的审视和挑战。
刚刚,腾讯也正式发布了自研的通用大语言模型——混元大模型。
目前腾讯已经有超过 50 个自有产品和业务接入混元大模型测试,包括腾讯云、腾讯广告、腾讯文档、微信搜一搜、QQ 浏览器等,接下来腾讯预计还会有更多产品接入。
比起百度阿里,腾讯作为国内互联网巨头在大模型应用上似乎更加谨慎,其实 AIGC 在腾讯内部优先级已非常高,马化腾在 5 月的腾讯财报会议上也直接表明了腾讯的态度:
我们最开始以为这是互联网十年不遇的机会,但是越想越觉得这是几百年不遇的、类似发明电的工业革命一样的机遇,所以我们觉得(AI)非常重要……但是并不急于早早做完,把半成品拿出来展示。
爱范儿也获得了体验资格,并在第一时间给你挖掘到更多细节。
混元大模型,请多指教
混元者,元气未分,混沌为一,元气之始也。从名称上就可以看出,渴望「开天辟地」的腾讯对混元大模型寄予了厚望。
作为腾讯全链路自研的通用大语言模型,混元大模型拥有优异的语料库、创新的大模型算法、自研 Angel 机器学习框架、强大的算力基础设施。
针对实际的应用场景,腾讯混元大模型的主要研发团队代表,腾讯集团副总裁蒋杰也在发布会上演示了致力于更可靠、更成熟的混元大模型。
混元大模型更可靠,经过大量的研究和尝试,混元大模型找到一种基于探真的方法,有效降低大语言模型 30%-50 % 的幻觉率。
更可靠的混元大模型还能识别「陷阱」,抗拒「诱导」,让模型对不安全的问题说「不」。
面对挑战,更成熟的混元大模型能够处理超长文本的生成和续写能力,比如撰写一篇关于农业装置专利。
混元大模型提出思维链的新策略,有效强化模型对问题拆解和分布思考的倾向。蒋杰的展望是,大模型可以像人一样结合实际的应用场景合理地做出推理。
蒋杰向混元大模型提问了关于「你是谁、混元大模型的核心架构是什么、混元大模型的参数是多少?」等问题,可以看出,混元大模型的回答充满条理性。
值得注意的是,混元大模型的更新截止到 2023 年 7 月,且仍在不断迭代。
为了演示混元大模型的逻辑推理能力,蒋杰向混元大模型提出逻辑思考题:「买一堆咖啡,上午喝了一半,下午又喝了剩下的一半,还剩 30 杯,一共买了多少杯」。在极短的时间内,混元大模型就给出了正确的答案。
相较于主流大模型注重参数和评测,腾讯混元大模型更关注应用。
比如在与腾讯会议的结合中,混元大模型可以生成整场会议的总结,整理会议的相关细节。
与腾讯文档的结合,发布会还演示了混元大模型的文本归纳、文档创作与编辑,翻译等能力,掌握数十种文本生成场景,轻松根据数百种公式生成 Excel 图表。
与腾讯广告的结合中,混元大模型适应行业与地域特色,满足千人千面需求,实现文字、图片、视频的自然融合,广告生成效果以 42% 的用户采纳率超过主流的 Midjourney,远远超过开源的 Stable Diffusion 模型。
在 AI 大模型的赛道上,腾讯的布局其实要早得多。
2019 年,腾讯推出了广告推荐 MoE 大模型,单模型参数超千亿。
2021 年,腾讯推出千亿规模的 NLP 大模型,显著提高模型训练推理效率、降低成本。
进入 2022 年,厚积薄发的混元大模型迎来了收获的季节,5 月,混元 AI 大模型同时登顶 CLUE 总排行榜、阅读理解、大规模知识图谱三个榜单,一举打破三项纪录。
一个月后,腾讯多模态 AI 大模型率先被应用在广告投放,当时累计给广告主带来 15% 的 GMV 提升。
这些积累都给混元大模型奠定了基础。
腾讯混元大模型初体验
「腾讯混元助手」首页由「聊天」和「灵感发现」两个 Tab 组成,「聊天」功能和会话类 AI 产品类似,与 ChatGPT 不同的是,「腾讯混元助手」已经集成了不少指令集,同时会在首页给你推荐一些问题。
正在发布会现场赶稿的我,也尝试了让它来写稿,看看能不能帮我节省些时间(moyu)。
在「灵感发现」里则集成了不同行业众多常用场景的应用,包括工作、编程、营销、生活、角色扮演、娱乐等领域。
你可以直接让它生成代码、写种草文案,也能让它扮演不同的角色,比如对新手父母可以直接点击「教育专家」,孩子在不同阶段遇到的各种问题都能给到实用的建议。
在「聊天」和「灵感发现」的记录,可以通过点击首页左上角菜单图标查看。关于用户数据的问题,我们也在隐私协议中看到,腾讯承诺不会将这些对话记录用户实际模型训练。
关于「腾讯混元助手」更多的功能和细节,请留意我们后续更详细的体验,你对哪些功能体验更感兴趣,也欢迎在评论区告诉我们。
国产大模型狂奔
国内跨界互联网的创业者无不希望抓住这个可能比移动互联网更大的机会,大模型创业的热潮汹涌。
从美团联合创始人王慧文广发 AI 英雄帖打造中国 OpenAI 开始,如今主要的互联网和科技公司都悉数投入到这场竞争中。
百度的文心一言,阿里的通义千问,腾讯的混元大模型,字节跳动不久前也公开测试大模型应用「豆包」。最近的手机厂商发布会,华为鸿蒙 4 的推出和雷军年度演讲,大模型也成为主角。
但无论是 ChatGPT 还是国内外一众大模型,也还没真正出现面向普通用户的「杀手级应用」,商业化的路径尚还未成熟,目前明显从 AIGC 浪潮中盈利的,还是「卖铲子」的英伟达。
因此,拥有 13.3 亿微信月活用户的腾讯,怎么将大模型应用和庞大的 C 端用户体验结合,自然更加备受关注,这样的体量也是腾讯不能急于将半成品推出的的重要原因。
至于腾讯用户最多的两款产品——微信和 QQ, 是否以及何时会接入混元大模型,目前尚不确定,但蒋杰表示团队内部已经在推进。
实际上腾讯上在大模型上的布局并不算慢,目前国内估值最高的两家大模型创业公司——光年之外和 MiniMax 也与腾讯有合作 。
其中成立不到 2 年的 MiniMax ,在今年 3 月推出面向企业用户的 API 开放平台,支持文本和语音模型的服务调用,已经成为抖音火山引擎和金山 WPS AI 的底层大模型,也是首批通过备案的大模型公司之一,估值达到 12 亿美元。
在发布混元大模型前,腾讯云在 6 月份已经推出了面向 B 端客户的行业大模型,覆盖了金融、文旅、政务、传媒、教育等 10 大行业,提供超过 50 个解决方案。
奇绩创坛创始人兼 CEO 陆奇认为,全球范围内只有两个国家和地区具备大模型产业核心的能力,就是北美和中国。他在之前的演讲提到,中国大模型追赶 OpenAI 有三大关键要素:
第一是打造基础模型,是攀升至 GPT-3.5。
第二是要打造模型产业化的能力。
第三是平台开发和生态建立。
如果稍微留意 ChatGPT 最近的动态,OpenAI 同样在朝着三个方面发力。而首批中国大模型产品通过备案后,第二第三批或许也不远了,各家都在冲刺大模型,上演大模型时代「百团大战」,但这场长跑才刚刚开始。
无论是科技互联网行业的格局,还是一个普通打工人的未来,或许在 2023 这一年,已经埋下了草蛇灰线。