点击蓝字 关注我们

如今,算力已经成为数字时代发展的源动力。随着超级计算机的发展,尤其是使用成本的不断下降,从过去只存在于高精尖领域(如传统的信息安全、核武研究、气象气候变化、石油勘探以及航空航天等),开始向新的领域迈进,尤其是最近几年,还有制药、基因测序、动漫渲染、数字电影、数据挖掘、金融分析以及互联网服务等等,可以说已经深入到国民经济的各行各业。

作为多样性算力的主要提供者,服务器的需求随之井喷,宝德计算机系统股份有限公司(以下简称“宝德“)为大规模分析计算需求而设计的超并行计算机集群系统,促进超算产业化发展。

软硬组合,搭起宝德赋能框架

目前,在航空、航天、能源动力等工业领域,利用 CAE 在 HPC 集群上进行反复设计、分析、优化已成为标准的必经步骤和手段,不同的 CAE 应用程序对硬件资源例如处理器、网络和存储的要求各不相同,并需要投入大量的资源进行选择、部署和维护。

对于在 CAE 领域部署难、选型难、维护难等问题,宝德推出了面向 CAE 的 HPC 解决方案,在简化 HPC 集群部署的同时,提供高度的灵活性、可扩展性和高性能,为 CAE 领域的发展加油助力。

宝德 CAE 高性能计算解决方案为集群架构,采用基于第三代英特尔® 至强® 可扩展处理器打造的宝德全新一代服务器PR2715W为计算节点,以及PR4010W为GPU加速平台。所有硬件和软件都部署在系统中,以打造实现高效并行、协同仿真、数据安全共享一体化。

宝德高性能集群服务器均采用X86-64平台,属同构系统,可共享软件资源和数据存储空间,资源调度简单,节点配比可灵活调整,适应各种应用需求,能够有效降低用户的 总体拥有成本。

硬件方面,宝德 CAE 高性能计算解决方案的计算节点通过标准开放的高速网络实现互联,运行开源 Linux 系统,提供单一系统接口到外面。它是为大规模科学并行计算而设计的。兼具事务处理和网络信息服务。软件方面,宝德集群系统配置丰富的软件系统,包括操作系统、编译器、调试器、函数库、并行通信库、全局共享 并行文件系统等基础软件。

1. 计算节点

宝德PR2715W是基于第三代英特尔® 至强® 可扩展处理器打造出的一款2U服务器产品,它采用Intel C620系列高性能芯片组,最大支持2颗第三代英特尔® 至强® 可扩展处理器。同时PCIe升级为4.0,大大提高了CPU与PCIe设备的通信能力。PR2715W整体性能比上一代产品提升多至 40%,更高的处理器TDP,更强的硬件安全能力,而且具备更出色的能源效率。

2. GPU加速节点

GPU节点采用宝德PR4910W,该产品是宝德公司最新推出的一款基于第三代英特尔® 至强® 可扩展处理器的4U双路机架式加速计算服务器。该机型拥有32个DDR4 DIMM插槽并最多支8TB内存容量;拥有10个全高全长双宽的GPU插槽,并另提供2个PCIe 4.0 x16插槽,1个OCP网卡插槽。为应用软件的加速提供了助力,实现CAE效率的快速提升。

3. 分布式存储系统

为了应对多数CAE软件并行扩展性好、算例数据量大的特点,宝德高性能集群配置了PL-XDFS分布式并行存储系统。宝德推出的PL-XDFS支持海量数据,在线扩容,存储容量和聚合带宽同步提升,满足了高通量计算对存储系统的需求。

4. 高速网络交换

集群配备了高带宽低延迟的Infiniband高速网络,满足了应用软件中各类MPI程序数据交换需求,提高了多节点之间的并行效率,加快模拟计算过程。

5. 软件系统

宝德Powercloud集群管理和作业调度系统,实现设计、仿真平台的统一门户,一体化管理,监控管理和作业调度。

6. 编译器方面

支持Fortran77/Fortran95/C/C++等,并支持OpenMP 以及MPI 程序编译。此外, 我们还提供并行程序调试及调优工具,以帮助用户更好的完成程序开发。宝德高性能集群系统配置丰富的数学函数库和并行环境供用户选用,包括Goto、Lapack、FFTW、MPICH 等。

优势叠加显示竞争力

宝德 CAE 高性能计算解决方案为企业带来如下优势:

1.高计算性能

计算资源丰富,满足 CAE 应用各种需求,提供合适的环境。还采用了英特尔®密码操作硬件加速技术来减少加密计算对于性能的影响,保证资源的高效利用

2. 高通信能力

高带宽低延迟的 InfiniBand 作为通信网络来提升节点间的通信能力,大大降低了通信延迟。并且通 过 IB 交换机实现所有计算节点的全互联。

3. 高可靠性

整套集群采用多种可靠性设计方案大幅度提升系统的可靠性,确保系统无单点故障。

4. 高扩展性

能根据用户需求灵活对现有计算资源和存储空间进行扩展

5. 高安全性

首次引入了 SGX 英特尔®软件防护扩展技术,提供可信的执行环境。以及英特尔®平台固件弹性技术为BIOS闪存、BMC闪存、英特尔®管理引擎和电源固件提供保护,防止外部攻击。还有英特尔®全内存加密,可确保从CPU访问的所有内存都是加密的,保障用户凭据等敏感信息不会被窃取。

定制化方案 满足细分场景

随着高性能计算机(HPC)技术的成熟和市场的崛起, HPC的触角延伸到更多的行业应用领域。

以上海石油化工研究院为例,该研究院主要从事石油化工烯烃和芳烃的化工利用,包括基本有机原料催化剂和工艺技术、精细石油化工催化剂 和工艺技术、功能高分子材料合成与加工等技术领域的研究,研发工作涵盖了自前瞻性探索研究、应用基础研究、成套工艺 技术及配套催化剂研究开发、工程化放大等过程。

计算材料学主要包括两个方面的内容:一方面是计算模拟,即从实验数据出发,通过建立数学模型及数值计算,模拟实际过 程;另一方面是材料的计算机设计,即直接通过理论模型和计算,预测或设计材料结构与性能。材料计算与模拟在材料性能 设计、节约材料与节能、加快产业化进程中发挥着重要的作用。

材料分析领域的应用往往呈现计算量大、向量化程度高、进程间通信频繁的特点。基于此特点,使用于材料分析领域的CAE解决方案首先要提供较高的算力支持,以应对大量的运算需求;然后进程间通信频繁,需要从软件和硬件层面降低其通信时延。通过模型化与计算实现对材料制备、加工、结构、性能和使役行为等参量或过程的定量描述,理解材料结构与性能、功能之间的关系,引导材料发现和发明,缩短材料研制周期,降低材料过程成本。

序号

对象

特点

1

计算系统

计算系统由10台宝德高密服务器(四子星)与4台宝德自研的四路胖节点组成,系统整体理论峰值性能达 到30.45TFlops,实测性能达到25.36TFlops,效率超过了80%。

2

网络系统

采用业界最先进的 InfiniBand 网络技术,满足应用对网络的高带宽和低延时的需求。

3

存储系统

通过宝德Pstor2000分布式存储系统,提高IO 并发访问性能及单一存储容量,实现多通道、多分区的并发 读写和多分区的一致印象和统一管理;高性能、高可扩展、高性价比。

4

集群管理

使用 WEB界面管理方式,可提供所有组件的最新状态及图形标示的详细信息;实时状态监控、故障预警, 动态优化调整资源配给和工作策略;保存并统计分析关键历史数据;直观显现重要信息的变化趋势;多种 错误故障报警方式,日志、审计和报表可供查询;允许加密的远程控制,可从任何位置控制操作及监控整

体运行状况。

5

安全系统

方案的设计充分考虑科研对于安全性的需求,从计算、存储、网络,到用户的接入访问、权限控制等,都 提供了安全策略。

6

技术服务

提供至少三年硬件免费保修服务,五年免费人工现场技术服务

结束语:

从存储、网络、服务器等高性能硬件到软件,从HPC产品组件到一体化解决方案,宝德为用户提供了从小到大、从单一系统到整体集群的全方位选择,正在帮助越来越多的用户实现计算与处理加速。