硬件和队列
以下表格总结了各个服务器的硬件配置。浮点性能均指双精度浮点性能(而不是衡量 AI 算力常用的单精度浮点性能)。
2024 年最好的笔记本 CPU(R9-7945HX)性能约为 125 GFLOPS,整机大约六七千可以买到; 最好的服务器 CPU(EPYC 9965)性能约为 1124 GFLOPS,大概十万块可以买到一块。 可以据此估计各个服务器的 CPU 性能。
CPU 和 GPU 的成绩通常不能直接比较,但对于可以大量并行、并且瓶颈在浮点计算或者内存访问的任务,同价钱的 GPU 通常确实比 CPU 快很多。
厦大超算(jykang)
这里仅列出 jykang 有权限使用的节点。信息采集于 2024 年 10 月 21 日,之后可能有变化。
队列 | 时间限制 |
节点组 | 节点 |
单节点CPU |
单节点理论性能 (GFLOPS) |
单节点内存 |
---|---|---|---|---|---|---|
normal (默认) |
14 天 | cnodes |
c00{1..9} c0{19..48} 以下除外: c022 |
双路 Intel E5-2690 共 16 核 32 线程 限制使用 20 线程 |
29 | c00{1..9} : 约 60 GBc0{19..44} : 约 30 GBc0{45..48} : 251.7 GB |
normal_1day |
1 天 | normal_1day |
nxt00{1..9} nxt0{41..67} 以下除外: nxt043 |
双路 Intel E5-2680 v4 共 28 核 |
93 | 124.9 GB |
normal_1week |
7 天 | normal_1week |
nxt0{10..40} 以下除外: nxt015 |
双路 Intel E5-2680 v4 共 28 核 |
93 | 124.9 GB |
normal_2week |
14 天 | b_node |
b0{01..14} |
双路 Intel 5318Y 共 48 核 |
167 | 251.3 GB |
normal_1day_new |
1 天 | charge_s_normal |
s0{06..18} |
双路 Intel 6126 共 24 核 |
79 | charge_s_normal : 约 180 GBhd0{01..27} : 125.2 GBhd028 : 93.7 GB |
ocean_530_1day |
1 天 | hd_sd530 |
hd0{01..28} |
双路 Intel 6126 共 24 核 |
79 | charge_s_normal : 约 180 GBhd0{01..27} : 125.2 GBhd028 : 93.7 GB |
ocean6226R_1day |
1 天 | hd_sd530_6226R |
hd0{29..48} |
双路 Intel 6226R 共 32 核 |
129 | 188.2 GB |
srv1
此集群包含了四个节点。其中第一个节点(srv1-node0)的性能较好,推荐优先使用;剩下的三个节点性能相对较差。 用于存储计算数据的硬盘大小为 1 TB,使用 btrfs,实际可存储数据大约 2.5 TB。
节点主机名(Slurm 中的节点名) | 内存 | CPU | CPU 理论性能 (GFLOPS) |
---|---|---|---|
srv1-node0(n0) | 128 GB | 四路 Intel Gold 6230 共 80 核 160 线程 |
250 |
srv1-node1(n1) | 32 GB | 四路 Intel E7-4809v4 共 32 核 64 线程 |
146 |
srv1-node2(n2) | 64 GB | 四路 Intel E7-4809v4 共 32 核 64 线程 |
146 |
srv1-node3(n3) | 40 GB | 四路 Intel E7-4809v4 共 32 核 64 线程 |
146 |
队列 | 包含节点 |
---|---|
localhost (默认) |
n0 |
old |
n1 n3 |
fdtd |
n2 |
all |
n[0-3] |
注:谨慎使用第三个节点(srv1-node2)做计算。详见下方的说明。
谨慎使用第三个节点的原因
按照吴志明老师的要求,此节点还安装了一个 Windows 虚拟机用于 FDTD Solutions(即srv1(Windows))。
同时使用 Windows 虚拟机和宿主机做计算会严重影响性能,占用内存过高还有可能会导致节点崩溃,你的任务就白算了(倒是也没有什么更严重后果)。
如果你不知道这段时间内有没有人在使用 Windows 虚拟机,建议干脆不要使用这个节点。
srv1(Windows)
用于存储计算数据的硬盘空间约 500 GB。
内存 | CPU | CPU理论性能 (GFLOPS) |
---|---|---|
128 GB | 四路 Intel E7-4809v4 共 32 核 32 线程 |
146 |
srv2
用于存储计算数据的硬盘大小为 18 TB,使用 btrfs,实际可存储数据大约 40 TB。
对于大多数任务,推荐使用 GPU 进行计算,因为算得快;对于需要较多内存的任务,因为 GPU 的显存不够用,推荐使用 CPU。 此外,在多个 GPU 都空闲的情况下,Slurm 不会自动选择性能更好的 GPU,可能会将任务分配到性能更差的 GPU 上; 因此通常推荐手动选择 GPU,除非有很多任务要计算。
节点主机名(Slurm 中的节点名) | 设备 | 理论性能 (GFLOPS,双精度/单精度) |
内存/显存 |
---|---|---|---|
srv2-node0 (n0 ) |
CPU: 双路 Intel Gold 6152 共 44 核 88 线程 |
136/136 | 256 GB |
srv2-node0 (n0 ) |
GPU: NVIDIA 4090 | 1290/82580 | 24 GB |
srv2-node1 (n1 ) |
CPU: AMD R9-5950X 16 核 32 线程 |
100/100 | 96 GB |
srv2-node1 (n1 ) |
GPU: NVIDIA P5000 | 194/6197 | 16 GB |
srv2-node1 (n1 ) |
GPU: NVIDIA 3090 | 556/35580 | 24 GB |
srv2-node1 (n1 ) |
GPU: NVIDIA 4090 | 1290/82580 | 24 GB |
GPU: NVIDIA 2080 Ti (买了没装) |
421/13448 | 12 GB | |
(未付款,期待发货) |
25600/51200 | 80 GB |
队列 | 包含节点 |
---|---|
all (默认) |
n0 n1 |
n0 |
n0 |
n1 |
n1 |