随着全球科学研究的蓬勃发展,对超级计算机和超算软件的要求越来越高,各国对研发更高性能的超算投入也逐渐增加。2022年美国橡树岭国家实验室制造出了世界上第一台百万兆次级的超级计算机,拉开了全球百万兆次级超算的角逐序幕。正值超算大会前夕,英国知名学府剑桥大学公布其与戴尔、ukaea、英特尔合作制造的超算dawn phase 1将投入使用,将开启英国百万兆次级时代。
(图源:joe bishop for cambridge open zettascale lab)
作为英国在开发未来百万兆次级系统的道路上迈出的第一步,dawn将支持英国在学术研究和工业领域有史以来最大规模的工作负载,用于包括医疗保险、工程、绿色聚变能源、气候建模以及宇宙学和高能物理学中的前沿科学领域。
剑桥大学 x 戴尔
联合打造英国最快超算
剑桥大学与戴尔在超算方面有着丰富的合作经验,如剑桥大学2019年登顶virtual institute 2019i/o-500 榜的超算“cumulus–英国科学云”、2021年在isc green500中位列前茅的三个超算系统等,均一度推动英国超算快速发展。而此次公布的dawn,作为英国人工智能研究资源(airr)计划的第一部分,将成为英国最大的公共计算集群。
人工智能研究资源(airr)计划:英国政府于今年3月宣布投资100亿英镑为公共研究人员、学术界和工业界提供世界领先的人工智能专业计算能力,截至今年11月已投资300亿英镑。
dawn系统基于dell poweredge xe9640服务器组成,得益于戴尔液冷技术和多功能配置,服务器系统可以很好地处理高性能的ai和hpc工作负载:
●能够100%直接液冷的cpu和gpu(以及其他一些次要组件),高效冷却数据中心和hpc集群操作。
●专为ai构建的密度优化服务器,能够释放计划的潜力并提供实时洞察。
●多达32个ddr5内存rdimm插槽、4个驱动器和4个pcle gen5扩展插槽,实现有效扩展。
●内置包括scv和硅信任根等安全功能,能够安心部署人工智能操作。
戴尔poweredge xe9640搭载两个第四代英特尔至强可扩展处理器和四个英特尔数据中心gpu max系列“ponte vecchio”加速器,具备高计算力、高稳定性,可支持高性能工作负载。
在软件方面,hpc支持英国sme stackhpc的scientific openstack,能够提供一个完全人工智能和模拟优化的云超级计算软件环境。这与oneapi开放式软件生态系统和优化框架相结合,可帮助开发人员加速ai和hpc的工作负载,并增强跨多个硬件架构的代码可移植性。
随着dawn phase 1投入使用的消息公布,英国原子能管理局(ukaea)的计算项目主任兼高级研究员rob akers表示:
“
dawn将成为多样化的ukri超级计算生态系统的重要组成部分,有助于促进高保真模拟和人工智能能力,确保英国科学和工程率先利用颠覆性hpc硬件的最新创新。长期以来,核聚变一直被称为‘百万兆级大挑战’,百万兆次级终于来了,我坚信,围绕dwan的众多合作将成为提取百万兆次级承诺的价值的强大因素。
”
丰富的超算系统支持经验
助力人类科研事业发展
在hpc领域深耕多年的戴尔有着丰富的超算系统支持经验,除前述与剑桥大学的多次合作外,还有例如为德州大学奥斯汀分校的德州超算中心(tacc)设计并制造的frontera、为美国密歇根大学的great lakes计算集群、eni公司的hpc5、加拿大西蒙弗雷泽大学的cedar(gpu)集群等提供支持。
这些超算系统用于模拟、建模、人工智能、数据科学、基因组学、化石能源研究与开发、医疗等多个领域,广泛地推动着人类科研事业的发展。
“
dawn phase 1代表了英国在人工智能和模拟能力方面向前迈出的一大步。dawn诞生于剑桥大学、ukaea、戴尔科技集团和英特尔之间的创新联合设计伙伴关系。phase 1系统在一个更大的背景下发挥着重要作用,希望在这个背景下继续这一共同设计活动,目标是在2024年交付一台性能水平提高10倍的phase 2超级计算机。如果推进顺利,dawn phase 2将大大提高英国的人工智能能力,并继续这一成功的行业凯发在线的合作伙伴关系。
”
——paul calleja博士
剑桥大学研究计算服务主任
结语
此次助力剑桥大学利用人工智能和高性能计算的力量打造出英国最快的人工智能超级计算机,为英国未来的技术地位奠定了基础,并为英国到2040年代建成首个商用核聚变发电厂提供进一步助力。作为全球领先的数字化凯发在线的解决方案供应商,戴尔科技集团将持续坚持科技创新推动人类进步的信念,用科技助力人类科研发展。