• 媒体品牌
    爱范儿
    关注明日产品的数字潮牌
    APPSO
    先进工具,先知先行,AIGC 的灵感指南
    董车会
    造车新时代,明日出行家
    玩物志
    探索城市新生活方式,做你的明日生活指南
  • 知晓云
  • 制糖工厂
    扫描小程序码,了解更多
2月24日,星期一
4 小时前
DeepSeek 发布高效 MLA 解码内核

就在刚刚,DeepSeek 第一天的开源项目 FlashMLA 正式发布。

DeepSeek 官方在 X 平台发文称:

「很荣幸能分享 FlashMLA —— 我们专为 Hopper GPU 优化的高效 MLA 解码内核,不仅支持变长序列处理,现在已经投入生产使用。
✅ 支持 BF16
✅ 分页 KV 缓存(块大小 64)
⚡ 在 H800 上实现 3000 GB/s 的 ​……

[展开]
加载更多