服务器配置

服务器配置

基本情况

下面列出服务器放置的位置和主要用途,方便读者区分。当然主要用途之外也可以有“次要用途”,只要不影响他人。

服务器 地址(物理意义上) 操作系统 主要用途
厦大超算
(jykang)
我也不知道
好像在嘉庚三地下室
反正这个肯定丢不了
Linux CentOS VASP(CPU)
srv1 物机大楼 351 隔间内机架上
很吵的那四台就是
Linux NixOS VASP(CPU)
srv1
(Windows)
虚拟机
对应宿主为 srv1-node2
即从上往下数第三个节点
Windows FDTD Solutions
xmupc1 物机大楼457我桌子右边 Linux NixOS VASP(GPU)
xmupc2 物机大楼457我桌子右边 Linux NixOS VASP(GPU)

软件

待补充(VASP 打了哪些补丁,还有哪些计算软件等)。

连接协议和参数

以下总结了各个服务器支持的连接协议和对应的参数,留空即表明该服务器不支持该协议。如果不知道如何使用这些参数,参考连接到服务器

服务器 用户名 SSH 地址 SSH 端口 RDP 地址 SMB 地址1
厦大超算
(jykang)
jykang hpc.xmu.edu.cn2 22
srv1 GROUPIII-n srv1.chn.moe 22 srv1.chn.moe:62113 srv1.chn.moe
srv1(Windows) GROUPIII-n srv1.chn.moe 6144 srv1.chn.moe
xmupc1 姓名首字母(例如 chn xmupc1.chn.moe 6007 xmupc1.chn.moe3 xmupc1.chn.moe
xmupc2 姓名首字母(例如 chn xmupc2.chn.moe 6394 xmupc2.chn.moe:33903

硬件配置

以下表格总结了各个服务器的硬件配置。

现在(2024 年)最好的笔记本 CPU(R9-7945HX)性能约为 125 GFLOPS,整机大约七千可以买到,可以据此估计各个服务器的 CPU/GPU 性能。

这里仅列出 jykang 有权限使用的节点。信息采集于 2024 年 10 月 21 日,可能有变化。

节点组 单节点CPU 单节点理论性能
(GFLOPS)
单节点内存
cnodes 双路 Intel E5-2690
共 16 核 32 线程
限制使用 20 线程
29 c00{1..9}: 约 60 GB
c0{19..44}: 约 30 GB
c0{45..48}: 251.7 GB
normal_1day
normal_1week
双路 Intel E5-2680 v4
共 28 核
93 124.9 GB
b_node 双路 Intel 5318Y
共 48 核
167 251.3 GB
charge_s_normal
hd_sd530
双路 Intel 6126
共 24 核
79 charge_s_normal: 约 180 GB
hd0{01..27}: 125.2 GB
hd028: 93.7 GB
hd_sd530_6226R 双路 Intel 6226R
共 32 核
129 188.2 GB

此集群包含了四个节点。其中第一个节点(srv1-node0)的性能较好,推荐优先使用;剩下的三个节点性能相对较差。 用于存储计算数据的硬盘大小为 1 TB,使用 btrfs,实际可存储数据大约 2.5 TB。

节点主机名
(Slurm 中的节点名)
内存 CPU CPU 理论性能
(GFLOPS)
srv1-node0
(n0)
128 GB 四路 Intel Gold 6230
共 80 核 160 线程
250
srv1-node1
(n1)
32 GB 四路 Intel E7-4809v4
共 32 核 64 线程
146
srv1-node2
(n2)
64 GB 四路 Intel E7-4809v4
共 32 核 64 线程
146
srv1-node3
(n3)
40 GB 四路 Intel E7-4809v4
共 32 核 64 线程
146

注:谨慎使用第三个节点(srv1-node2)做计算。详见下方的说明。

谨慎使用第三个节点的原因
按照吴志明老师的要求,此节点还安装了一个 Windows 虚拟机用于 FDTD Solutions(即srv1(Windows))。 同时使用 Windows 虚拟机和宿主机做计算会严重影响性能,占用内存过高还有可能会导致节点崩溃,你的任务就白算了(倒是也没有什么更严重后果)。 如果你不知道这段时间内有没有人在使用 Windows 虚拟机,建议干脆不要使用这个节点。

用于存储计算数据的硬盘空间约 500 GB。

内存 CPU CPU理论性能
(GFLOPS)
128 GB 四路 Intel E7-4809v4
共 32 核 32 线程
146

对于大多数任务,推荐使用 GPU 进行计算,因为算得快;对于需要较多内存的任务,因为 GPU 的显存不够用,推荐使用 CPU。

xmupc1 用于存储计算数据的硬盘大小为 2 TB,使用 btrfs,实际可存储数据大约 5 TB。 xmupc2 用于存储计算数据的硬盘大小为 18 TB,使用 btrfs,实际可存储数据大约 40 TB。

主机 设备 理论性能
(GFLOPS,双精度/单精度)
内存/显存
xmupc1 CPU: AMD R9-5950X
16 核 32 线程
100/100 96 GB
xmupc1 GPU: NVIDIA 4090 1290/82580 24 GB
xmupc1 GPU: NVIDIA 3090 556/35580 24 GB
xmupc1 GPU: NVIDIA P5000 194/6197 16 GB
xmupc2 CPU: 双路 Intel Gold 6152
共 44 核 88 线程
136/136 256 GB
xmupc2 GPU: NVIDIA 4090 1290/82580 24 GB
GPU: NVIDIA 2080 Ti
(买了没装)
421/13448 12 GB
GPU: NVIDIA H100
(未付款,期待发货)
25600/51200 80 GB

注:VASP 使用双精度浮点(即双精度的 GFLOPS 更能估计 VASP 的实际性能)。 一些其它的软件可能使用单精度浮点(例如 LAMMPS)也可能使用双精度浮点。 深度学习、游戏渲染时,一般使用单精度或者半精度浮点。

队列

一些服务器包含多个队列。

信息采集于 2024 年 10 月 21 日,可能有变化。

队列 时间限制 节点组 节点
normal(默认) 14 天 cnodes c00{1..9} c0{19..48}
以下除外:c022
normal_1day 1 天 normal_1day nxt00{1..9} nxt0{41..67}
以下除外:nxt043
normal_1week 7 天 normal_1week nxt0{10..40}
以下除外:nxt015
normal_2week 14 天 b_node b0{01..14}
normal_1day_new 1 天 charge_s_normal s0{06..18}
ocean_530_1day 1 天 hd_sd530 hd0{01..28}
ocean6226R_1day 1 天 hd_sd530_6226R hd0{29..48}
队列 包含节点
localhost(默认) n0
old n1 n3
fdtd n2
all n[0-3]

  1. SMB 协议使用与 RDP 或 SSH 不同的认证机制,与 SSH 和 RDP 不共用密码,使用前需要先联系我设置一个。 此外 SMB 协议安全性可能不及其它两者。 ↩︎

  2. 使用厦大超算(jykang)时,必须开启 SSH agent forwarding, 详见连接 VASP 服务器,开启 SSH 代理转发使用 OpenSSH。 ↩︎

  3. 使用 RDP 协议连接到 Linux 服务器时,需要手动设置连接类型,详见:RDP 设置连接类型。 当使用 Linux 系统连接到 Linux 服务器时,推荐使用 SSH X11 forwarding 代替远程桌面。 详见:使用 SSH X11 forwarding。 ↩︎ ↩︎ ↩︎