• 媒体品牌
    爱范儿
    关注明日产品的数字潮牌
    APPSO
    先进工具,先知先行,AIGC 的灵感指南
    董车会
    造车新时代,明日出行家
    玩物志
    探索城市新生活方式,做你的明日生活指南
  • 知晓云
  • 制糖工厂
    扫描小程序码,了解更多
1月14日,星期二
12 小时前
GPT-o1 在模型测试中表现优异

机构:GPT-o1 在深度思考模型测试中成绩领先

1 月 13 日,THU 基础模型公众号发布推文,公开了对各家旗舰基础模型进行测试的结果。

官方表示,为了全面评估这些模型在数学推理方面的能力,他们结合2025年考研数学(一、二、三)的试题,对各家深度推理模型进行了严格的评测。

此外,为了确保评测的 ​……

[展开]
加载更多