• 媒体品牌
    爱范儿
    关注明日产品的数字潮牌
    APPSO
    先进工具,先知先行,AIGC 的灵感指南
    董车会
    造车新时代,明日出行家
    玩物志
    探索城市新生活方式,做你的明日生活指南
  • 知晓云
  • 制糖工厂
    扫描小程序码,了解更多
2月10日,星期一
14 小时前
权威榜单发布,全球开源大模型前十均为阿里通义千问衍生模型

近日,全球最大AI开源社区Huggingface发布了最新的开源大模型榜单(Open LLM Leaderboard),榜单显示,其排名前十的开源大模型全部是基于阿里通义千问(Qwen)开源模型二次训练的衍生模型。该榜单是目前全球最具权威性的开源大模型榜单,其测试维度涵盖阅读理解、逻辑推理、数学计算、事实问答等。

权威榜单发布,全球开源大模型前十均为阿里通义千问衍生模型

▲图源 Huggingface2月10日官网榜单截图

通义千问Qwen大模型已经成为全球最大的开源模型族群。在海内外开源社区中,Qwen的衍生模型数量已突破9万,超越美国Meta公司旗下的Llama系列开源模型,位居全球第一。在Hugging face2024年的开源模型下载中,Qwen模型系列中的Qwen2.5-1.5B-Instruct的下载量占总下载量的26.6%,是全球下载量最高的开源模型。在这一轮推理模型技术浪潮中,Qwen系列模型广受欢迎。此前爆火的DeepSeek公司基于R1推理模型蒸馏了6个模型开源给社区,其中有4个模型来自Qwen。近期,著名AI科学家李飞飞团队用较少的资源和数据训练出的s1推理模型同样以Qwen模型为基础模型。国内外开发者认为,以上模型取得的良好成绩跟基础模型的强大性能有很大关系。

从2023年8月起,阿里云通义千问相继开源Qwen、Qwen1.5、Qwen2、Qwen2.5等4代模型,囊括大语言模型、多模态模型、数学模型和代码模型等数十款,多次登上国内外权威大模型榜单,已成为开源社区最重要的模型系列。

[展开]
加载更多