Per aspera, ad astra是一句古老的拉丁格言,意思是“通过奋斗,走向星星”,它是混合高性能计算和人工智能超级计算机名称的根源,Grand Equipment National de Calcul Intensif (GENCI) 与它合作法国国家高级工程信息中心 (CINES) 是法国三个国家高性能计算中心之一,将于明年建成,为科学应用带来 20 倍的计算能力。
Adastra 系统进入蒙彼利埃的 CINES 数据中心,这是法国乃至欧洲的长期技术温床,有趣的是惠普企业被选为 70 petaflops 机器的主要承包商,而不是法国的 Bull 部门服务巨头 Atos 一直是 CINES、Occigen 和 Occigen 2 系统前两代 petascale 超级计算机的现任供应商。再说一次,前 SGI 于 2016 年被 HPE 以 2.75 亿美元收购,它是前两个 CINES 系统 Jade 和 Jade 2 的供应商,它们的历史可追溯至 2008 年和 2010 年,包含数百 teraflops,如下所示:
2017 年 1 月安装的 Occigen 2 机器有点长,这种情况不时发生在 HPC 中心,尤其是在冠状病毒大流行的第一年左右,当能够获得人们进入设施安装机器是有问题的。Occigen 2 机器也没有任何 GPU服务器,这意味着它实际上无法在同一台机器和同一工作流程中进行 AI 训练以及 HPC 模拟和建模。Occigen 2 共有 3,364 个基于“Haswell”和“Broadwell”代的 Intel Xeon E5 处理器的双插槽节点,跨机器共有 85,824 个内核;机器的总峰值性能,
Adastra 机器将在性能上迈出一大步,它将由 CINES 过去使用的仅 CPU 集群以及我们认为将提供大量聚合计算能力的混合 CPU-GPU 集群组成系统。本质上,机器上仅使用 CPU 的机器分区将能够在 CINES 上运行现有的工作负载。
两个分区的确切馈送和速度没有透露,但我们强烈怀疑机器的仅 CPU 部分在内核数量和吞吐量性能方面会有相当大的提升,大约在 5 petaflops 到 6 petaflops 的数量级至少。也许更多。我们所知道的是,这个仅 CPU 的分区将基于 AMD 未来的“热那亚”Epyc 7004 处理器,该处理器将于明年年中左右推出,并将拥有具有 768 GB 主内存和一个 200 Gb 的节点/sec Cray Slingshot 11 每个节点互连。如果我们正在寻找 TCO 节省,正如 GENCI 和 CINES 肯定所做的那样,这些将是密集的单插槽节点,就像过去为推动 TCO 所做的那样,处于中间垃圾箱范围内。如果热那亚最多有 96 个内核,那么也许 Adastra 的 CPU-only 分区将在单个套接字节点中使用 48 核处理器。但它说它将基于 Epyc“处理器”复数,所以它可能会是一些低档的部分,比如一对非常实惠的 32 核芯片,上面有很多内存插槽,因此非常低容量的记忆棒也可以提供容量和大量带宽。
第二个分区具有 GPU 加速功能,听起来像是现在安装在橡树岭国家实验室的“Frontier”超级计算机中使用的节点的略微升级变体。Adastra 的第二个分区将有一个定制的“Milan” Epyc 7003 处理器,带有 256 GB 的主内存和四个新的“Aldebaran” Instinct MI250X GPU 加速器,每个加速器上都有 128 GB 的 HBM2E 堆栈内存和四个 200 Gb /sec Slingshot 11 网络接口卡将 GPU 直接连接到 Slingshot 网络(就像 Frontier 超级计算机那样)。
第一个全 CPU 分区预计将在 2022 年春季安装,其余的 CPU-GPU 节点将在 2022 年第四季度安装。(考虑到 Milan 处理器现已可用且 Instinct MI200 GPU 加速器正在增加,这很奇怪现在,但热那亚 CPU 将在稍后推出......)
Adastra 系统将拥有一个基于运行 Lustre 的 Cray ClusterStor E1000 阵列的混合文件系统,包括一个基于闪存的 2 PB 分区,提供 1.3 TB/秒的吞吐量和一个基于磁盘驱动器的 24 PB 分区,提供 250 GB/秒吞吐量。该仅磁盘的 Lustre 文件系统的吞吐量是当前 Occigen 2 超级计算机所连接的 Lustre 存储的 2.5 倍和 4.8 倍的容量。
有趣的是,Adastra 系统的峰值理论性能将是 Occigen 2 机器的 20 倍以上,但在 1.6 兆瓦的功率下,消耗的功率仅比 Occigen 2 超级计算机多 60%。这就是五年来甚至减弱的摩尔定律加上架构变化至少可以实现一些 GPU 加速。
作为 Adastra 交易的一部分,AMD 正在与 GENCI 和 CINES 合作,将应用程序移植到 ROCm 编程环境以进行 GPU 加速,包括 Nvidia CUDA 的 HIP 克隆以及用于 CPU 和 GPU 的 OpenMP 并行线程。
【公司名称】四川旭辉星创科技有限公司
【代理级别】成都惠普HPE服务器工作站总代理
【销售经理】熊经理
【联系方式】座机:028-85596747 手机:18244236404
【公司地址】成都市人民南路4段 桐梓林 商鼎国际2号楼1单元1913
请用微信扫描二维码