黑洞照片、天气预报、工业制造……它们背后都有同一个科技力量
下面这张照片,你很可能已经见过:
作为「人类第一张黑洞照片」,它在 2019 年发布时引起了巨大轰动。但要问起这张照片是怎么拍出来的,很多人也许就不那么清楚了。
照片中央的黑洞位于 M87 星系,考虑到它远在 5500 万光年之外,想为其「画像」的难度无异于在地球上给月球表面的一个可乐瓶盖拍照。为了达到所需的分辨率,我们甚至需要一面像地球那么大的望远镜。
好消息是,人类还真建出了这样的望远镜。
这里的关键是甚长基线干涉测量技术(VLBI)。通过调动散布在全球的射电望远镜,让它们同一时间观测同一个目标,再将得到的观测信号进行联合处理,就相当于用一台口径达到各望远镜之间距离的超大射电望远镜进行观测。理论上说,这台「虚拟望远镜」的口径甚至能够超越地球直径。
负责这次黑洞观测计划的是事件视界望远镜(EHT)。借助横跨多个大洲的望远镜阵列,天文学家如愿以偿地得到了他们想要的数据。
▲ 支持事件视界望远镜计划的小型 HPC
但怎么处理望远镜得到的数据是另一个问题。仅仅是一场为期五天的观测,事件视界望远镜就会产生约 7PB 的数据,能够装满近 2000 个大容量硬盘。如此大的数据量难以通过互联网传输,因此各地天文台会将硬盘集中邮寄到美国麻省理工学院海斯塔克天文台——在那里等候多时的高性能计算机(HPC)将会把数千个硬盘中杂乱无章的数据转换成我们后来看见的黑洞「出道照」。
无处不在的高性能计算
▲阿塔卡马沙漠中的射电望远镜阵列 ©BABAK TAFRESHI
在事件视界望远镜计划中,硬件设备至关重要。但与阿塔卡马沙漠夜空中庄严的望远镜阵列相比,高性能计算机看起来只是一片低调地隐藏在室内的机箱柜,负责的也是枯燥芜杂的数据处理工作,这让高性能计算于我们而言往往是一个遥远的概念。
但听起来更陌生缥缈的高性能计算,与日常生活的关系可能远更紧密于那些沉默地伫立的射电望远镜。只要将高性能计算与其实际服务的项目联系起来,就很容易理解,为什么它在当下堪称是不可或缺的「基础设施」。
谈到「日常生活」,最好的例子莫过于天气预报。天气是那么重要,以至于两个许久未见的人在开启话题时都往往会选择从天气着手:「今天怎么突然下雨了?」
但另一方面,天气也是「蝴蝶效应」的最佳诠释者——千里之外的微小诱因常常能以数学模型都无法预测的方式改变天气,正如发生在太平洋东部的拉尼娜现象会让粤闽一带今年遭遇旱情。
尽管人类可能永远都无法完全理解天气,但科技进步至少让人们更加趋近这个目标:多普勒雷达和气象卫星让我们对云系有了更深入的了解;而高性能计算加持下的大数据统计让预测的精度不断提高。
有了数据科学,如今我们预测未来一周的降水情况比半个世纪前预测一天之内的降水情况更加准确,甚至可以清楚地告诉你,现在盘旋在菲律宾东部的 2 号台风「舒力基」极有可能加强为超强台风,然后取道太平洋东去。数据科学背后,自然少不了拥有强大算力的高性能计算参与。
高性能计算应用的另一个例子是电影和动画的渲染。我去看了最近重映的《阿凡达》,出色的美术设计和纤毫毕现的特效创造了恢弘华美的潘多拉星球,哪怕在 11 年后看来依然无比惊艳。
但这么漂亮的特效也意味着惊人的渲染工作量——当年詹姆斯·卡梅隆的团队找来了拥有 6000 个处理器的高性能计算机协助渲染,渲染工作大概花了一年时间。如果换用普通 PC,这部分工作就需要马不停蹄地渲染一万年。
高性能计算还支持了许多重要的学术研究。例如,去年日本学者通过目前算力最强的「富岳」高性能计算机模拟计算了口罩的防飞沫效果;西班牙的一个研究团队也借助高性能计算机模拟水熊虫体内损坏抑制蛋白与 DNA 的相互作用,发现了水熊虫得以成为「最顽强生命体」的机制。
时至今日,在众多行业的根基处,都能发现高性能计算的身影。目前高性能计算应用范围包括了航空航天、石油勘探、气象研究、生物工程、工业设计、动画渲染、智能化社会等诸多领域。可以说,任何需要计算机和算力的行业,都会用得上高性能计算。
中国高性能计算成长史
提起「高性能计算」,你脑海中会浮现出哪些名字?是先后登顶算力 TOP500 排行榜的「天河 1 号 A」?还是「神威·太湖之光」?
或许有些意外,在中国高性能计算系统中份额最大的供应商其实是联想。对,就是那个你以为只做笔记本电脑的联想。
在中国超级算力大会 ChinaSC 2020 发布的高性能计算机 TOP100 榜单中,联想以 35 套领跑,其中 6 套位列前 10。即使放到世界上,联想也是高性能计算领域的重要参与者:去年 11 月发布的 TOP500 高性能计算名单中,联想入围 182 台,独占 36.4% 的份额。
事实上,联想早在 1999 年就正式成立高性能计算(HPC)部门入局相关研发领域。要明白为什么联想要制造高性能计算机,就要理解当初的时代背景。
▲世界首台通用计算机 ENIAC
从世界第一台通用计算机「ENIAC」开始,高性能计算便长期服务于尖端领域的研究,但因为起点不同,高性能计算机技术长期由欧美国家所把持。
一个著名的故事是,上世纪 80 年代中国石油工业部物探局曾花重金购买了一台 IBM 大型机,但 IBM 方面给出的交易条件非常苛刻:为免「窃取技术」,美方将机器放在一间玻璃房里实施 24 小时监控,且进出钥匙和开机启动密码都由美方掌握,中方还必须定期提交使用日志。
在这样的环境下,自主掌握高性能计算技术就显得尤为重要。在高性能计算研制上,一边是以「银河」「曙光」与「神威」系列为代表的「国家队」,另一边则是联想的「深腾」系列高性能计算机;前者更多负责国家级关键任务,而后者将高性能计算更广泛地推向商用。
2002 年,联想推出了国内首套万亿次运算能力的服务器深腾 1800,它创造性地放弃了先前向量机的发展方向,转向了集群计算的技术路线,奠定了今天高性能计算体系的结构基础。在深腾 1800 的引领下,高性能计算集群体系结构迅速成为了主流。
短短一年后,深腾 6800 在 2003 年研制成功,它的运算速度达到了每秒 4 万亿次,在当年 TOP500 排行榜上名列第 14,这还是首次有中国高性能计算机跻身前 20 名。
自此,联想数据中心业务一路稳步扩张,在最新发布的 2020—2021 财年第三季度财报中,数据中心业务营收达到了 108.2 亿元,如上文所说,联想也迅速成长为了高性能计算领域的领头品牌。
在此期间,联想高性能计算部门还完成了一系列重要任务。比如说,联想与中国载人航天工程办公室共建了中国载人航天工程总体仿真实验室,承接了轨道计算、模拟仿真和航天器设计等任务,助力了神舟九号与天宫一号载人交会对接、神州十一号与天宫二号载人交会对接等航天任务的成功实践。
高性能计算的未来在哪里?
中科院计算所研究员张云泉博士在接受采访时曾表示:「农业社会靠体力,工业社会靠机器,信息社会靠互联网,而智能化社会要靠算力,谁能占领力的制高点,谁就有了引领社会发展的基础。」
IDC 报告预测,2018—2025 年,中国的数据总量将以每年 30% 的高速增长引领全球,预计到 2025 年,中国的数据总量将会攀升至世界第一。为了应对爆炸式增长的数据,建立更多的数据中心势在必行。
但是在「绿色经济」的大环境下,政府和企业都更关心绿色节能指标,新建的数据中心不能仅仅满足于高性能,还必须拥有高能效比。作为「反面教材」,当前 TOP500 第一名的日本「富岳」高性能计算虽然总性能领先,却因为高造价、高能耗而饱受诟病。
▲更好的散热系统提升了单机柜功率上限
立足于商业领域的联想会更注重能效比。为此,联想开发了专有的「海神」液冷系统,使用 18~50℃ 的去离子水作为冷媒,通过冷板液冷(服务器产生的热量传导至冷板,再由液体带走)的方式对服务器进行冷却,经热循环后的温水接近 60 ℃,还可以回收热量用于室内供暖。一系列举措相结合,「海神」液冷系统能够提供数倍于传统风冷的散热效率,从而提升单机柜的功率上限。
以联想为北京大学打造的「未名一号」高性能计算平台为例,「海神」液冷系统为其节省了 50% 的制冷散热成本,将 PUE 值(数据中心所有设备能耗之和 / IT 设备能耗,越接近 1 效能越好)控制在 1.1,每年能为北京大学节省 60 万度电。
▲联想为 SURF 打造的新高性能计算机将建在阿姆斯特丹数据塔中
而联想为荷兰学术机构 SURF 打造的新一代高性能计算机,更是通过联合加速、分布式存储、微通道散热技术和「海神」液冷系统实现了比传统散热方式节能 90% 以上的高效能源利用模式。
当然,高性能计算性能再高、能效再好,也必须要应用于实际项目才能发挥价值。没有软件的辅助,空有算力也无法转化为现实价值。曾经就有报道说,「天河 1 号」因为缺少软件配合而长期闲置。
为了更好地实施软硬件协同,联想并未停留在硬件提供者的角色上,而是发展为了完整的解决方案提供者:联想会深度参与到系统构建的过程中,根据用户实际需要设计合适的数据中心规模,并提供高性能计算管理系统以及可扩展计算平台,赋予了高性能计算系统更广泛的应用潜力。
当高性能计算运算速度朝着每秒百亿亿次迈进,数据中心在地球表面的每个角落铺开,我们有理由相信,未来的人们能够将目光投向更深邃的太空,享受到更精准的天气预报、更高水平的医药服务以及更活灵活现的动画电影。