中国超级计算机:跑得比全世界都快,还是掩不住应用尴尬
昨日,一台有着武侠味儿名字的超级计算机刷了各大平台的屏。但它背后的急速发展的超级计算机市场,并不像武侠小说中的江湖那么简单。
据新华社报道,6 月 20 日德国法兰克福国际超级计算机大会(ISC)公布了新一期世界计算机 500 强榜单,我国最新的超级计算机 “神威·太湖之光” 登顶。最受关注的是,“神威·太湖之光” 实现了核心处理器的全国产化。
“神威·太湖之光” 超级计算机由国家并行计算机工程技术研究中心研制,安装在国家超级计算无锡中心。
运算神速
“神威·太湖之光” 击败的是霸占榜首 3 年的 “天河 2 号”。“神威·太湖之光” 运算速度达到 93 petaflop(每秒运算一千万亿次),理论最高速达 125.4 petaflops。这一数值约为 “天河 2 号” 的两倍。
区别于 “天河 2 号” 采用的英特尔 Xeon E5-2692v2 12 核处理器,“神威·太湖之光” 首次采用国产核心处理器 “申威 26010”。
新华社记者称,“申威 26010” 大小约 25 平方厘米,集成了 260 个运算核心,内置数十亿晶体管。每块 “申威 26010” 运算能力为每秒3万多亿次,约等于 20 台家用计算机。
然后可以做一题简单的乘法题:
- “神威·太湖之光” 由 40 个运算机柜和 8 个网络机柜组成
- 每个柜门内有 4 块超节点
- 每块超节点由 32 块运算插件组成
- 每个插件由 4 个运算节点板组成
- 每个运算节点板又含 2 块 “申威 26010” 处理器
- 整台 “神威·太湖之光” 共有 40960 块 “申威 26010” 处理器
叠加之下,“神威·太湖之光” 一分钟的计算能力相当于全球 72 亿人口用计算器不间断计算 32 年。
数量增速神速
榜单前十名除了 “神威·太湖之光” 与 “天河二号” 外,分别为美国的 “泰坦” 与 “红杉”、日本的 “京”、美国的 “米拉” 和 “三一”、瑞士的 “代恩特峰”、德国的 “花尾榛鸡” 和沙特阿拉伯的 “沙欣II”。
在上榜计算机数量上,中国以 167 台超越美国 165 台成为上榜最多的国家,而这 167 台计算机全部是近 15 年研发的——2001 年前这一数字为 0 。
“没有国家能有这速度。“排行榜主要编撰者兼美国田纳西大学计算机学教授 Jack Dongarra 接受 《华尔街日报》采访说:“中国超级计算机不断增多已成为一个趋势。”
运算速度快,数量增加速度也快,除了在高中历史课本和新闻上感受到它的 “快” 之外,我们真的能用到这种 “快” 吗?
建构方式决定应用
虽然同为超级计算机,但中国和国外的建造目的存在区别。
目前我国的超级计算机主要有银河、天河、曙光、神威四个系列,除了军用的 “银河 V” 和 “神威 Ⅱ”(在研)之外,主要应用方式都是租用。租用对象主要是高校、科研院所、商业企业等。
而美国超级计算机的建设方一般都是使用方。在榜单上排名第三、也是美国最快的 Titan 建设方是美国能源部,主要应用于美国能源部内部的核试验模拟。
定位不同,建设方式自然就不同。国外超级计算机建设方一般是先有计算量需求,根据所需计算量设计系统,根据需求设计超级计算机的架构方式。中国是先进行建设,尽力提高建能,尝试满足更高的计算需求。
因此,“泰坦” 与 “红杉” 等国外超级计算机用途较为单一,基本只能适配某一方向的应用,但针对性、专业性更强。而国内超级计算机则更为开放,可以匹配不同使用者的需求。
问题是,如果没法用起来,再高的计算能力只是一个让人迷醉的数字,意义在哪?
从人体血流模拟到气候预报
超级计算机的应用领域其实非常广阔,代码破解和核武器发展(核爆炸模拟)等都需要高速处理大量复杂计算。
民用用途上,超级计算机可以用在气候预报,石油勘探、药物开发和汽车设计等方面。在医学领域,对人体血流进行模拟与分析,可以及时有效地判定一个病人是否会发生脑梗塞的风险,超级计算机的运算能力可以提供快速的预判。
另外,我国庞大的人口对网络公共设施造成的沉重负担也可能得到解决。
问题是从银河系列到天河系列再到神威系列,我国超算数量快速增长的这 10 年来,除了一间间看起来神秘的房间,超级计算机具体应用在哪里呢?
应用缺位+高耗能
去年 6 月 《南方日报》就报道过 “天河 2 号” 所在的广州超算中心的 “业务荒”。
自 2014 年落户广州以来,广州超算中心已成为广东最大的科技基础设施,但高昂的能耗费用,宣传推广不力,国际交流与合作不足,嫁接国家重大领域的科研项目较少,应用软件开发的周期过长,人才梯队与技术支撑尚未形成系统。
去年 6 月,广州超算中心主任袁学锋透露,广州超算中心利用率为 60%。用户占比上,83% 是政府机关、高校、科研院所,企业用户只有 17%。
中科院计算机网络信息中心研究员张鉴表示,我国利用超算系统解决问题的能力长期不足,相关商业应用软件仍为国外垄断。
除了资源闲置外,超级计算机的高耗能问题无可回避。
“天河二号” 年耗电量达到 2 亿度,每天耗费电费 10 万元。另外,为了应对机柜因为高负荷产生的高温,广州超级计算机中心专门为 “天河二号” 建设了冷水厂,不间断运送 8 摄氏度的水进入超算中心的 “水冷” 系统。
小结
在 2014 年接受南方网采访时,中科院超算中心主任迟学斌坦言:“脱离开发利用,超算就是一堆破铜烂铁。光有高性能机器,没有人才做高水平的服务,那效果是一样的,机器过 5 年就过时了。”
以我国近十年的超算数量增速来看,5 年已经足够完成一个系列研发。然而专业性的缺失,应用的缺位,并不能靠一个个 “听起来爽” 的超算占有量和运算速度数字去填补。
当然占有量和运算速度是一个技术指标,但我们还在追逐这些 “内功”、获得各个第一的 “声望” 之余,应用软件开发的 “招式” 正在被急速抢占着。
题图自:fakt