阿里国际发布首个大规模商用翻译大模型，效果超 Google、GPT-4

媒体品牌

爱范儿

关注明日产品的数字潮牌

APPSO

先进工具，先知先行，AIGC 的灵感指南

董车会

造车新时代，明日出行家

玩物志

探索城市新生活方式，做你的明日生活指南
知晓云
制糖工厂

扫描小程序码，了解更多

热门搜索

为您查询到篇文章

10月16日，星期三

10-16 16:31

阿里国际发布首个大规模商用翻译大模型，效果超 Google、GPT-4

在 AI 调用量最高的场景之一——机器翻译，阿里国际的 AI 团队有了新进展。

10 月 16 日，阿里国际副总裁、AI 负责人张凯夫在接受彭博社专访时表示，阿里国际最新研发的 Marco 翻译大模型，支持中、英、日、韩、西、法等 15 种全球主流语种。目前已在阿里国际 AI 官网 Aidge 上发布，面向全球用户开放使用。

基于目前广泛使用的开源评测数据集 Flores，Marco 翻译大模型在 BLEU 自动评测指标上，领先于市面上的标杆翻译产品，如 Google 翻译、DeepL、GPT-4 等。这意味着，Marco 的 AI 翻译能力总体已经超越全球竞争对手，成为行业第一。

图：根据公开榜单数据的测评结果

Marco 的主要优势就是由大语言模型驱动，能够基于语境进行精准翻译，而不是根据字面意思，造成哭笑不得的歧义。“你的宝贝正在路上”，不会再被翻译成 “Yourbaby is on the way”。以 “尊嘟喜欢” 这一网络用语为例，一些 AI 翻译产品会将这句话翻译为 “Zundu likes it”, 而在 Marco 大模型中，这句话非常地道地翻译为 “I reallylike it”。

如何实现这一效果呢？据介绍，Marco 翻译大模型通过面向多语言的数据筛选技术，如多语种混合语料甄别、多维度数据质量评估，获得高质量、大规模的多语言数据，再结合多语言的混合专家、参数扩张方法，从而保证主导语言（如中、英）性能不下降的情况下，提升其他语种的质量。同时，通过模型量化和加速、多模型规约等优化策略，大幅降低大模型的服务成本，甚至与传统小模型相比，成本也具有优势。

目前，Marco 翻译大模型已实现大规模商用。得益于阿里国际在跨境电商领域多年的积累，Marco 在跨境电商领域的表现尤为亮眼。对于个人用户来说，Marco 能够根据上下文提供高质量的翻译和良好的可读性，甚至支持不同的翻译风格，满足多样化的翻译需求。

根据媒体公开报道，阿里国际在去年成立了 AI 团队，过去一年在 40 多个场景里测试了 AI 能力，帮助 50 万中小商家、对 1 亿款商品进行优化。商家的 AI 需求也不断增长，近半年的数据显示，平均每两个月，商家对于 AI 的调用量就翻 1 倍，AI 的调用量已经突破日均 1 亿次。

[展开]

加载更多

粤ICP备18066688号-2 粤公网安备44010602006618号

All content is made available under the CC BY-NC 4.0 for non-commercial use. Commercial use of this content is prohibited without explicit permission.

if Design Studio.