NUMA调试命令

2023-07-05 07:42:44

numa简介

NUMA技术相关笔记_jollyjumper的专栏-CSDN博客

计算机主板架构

NUMA调试命令

NUMA 非统一内存访问(Non-uniform Memory Access)

介于SMP(对称多处理)和MPP(大规模并行处理)之间。

各个节点自有内存(甚至IO子系统)，访问其它节点的内存则通过高速网络通道。

NUMA信息主要通过BIOS中的ACPI(高级配置和编程接口)进行配置。

Linux对NUMA系统的物理内存分布信息从系统firmware的ACPi表中获得，最重要的是SRAT(System Resource Affinity Table)和SLIT(System locality Information Table)表。

SRAT表包含CPU信息、内存相关性信息，SLIT表则记录了各个节点之间的距离，在系统中由数组node_distance[]记录。这样系统可以就近分配内存，减少延迟。

Linux中用一个struct pg_data_t表示一个numa节点，Linux内核支持numa调度,并实现CPU的负载均衡。

查看是否支持:dmesg | grep -i numa

要查看具体的numa信息用numastat

numastat

返回如:

node0 node1

numa_hit 19983469427 20741805466

numa_miss 1981451471 2503049250

numa_foreign 2503049250 1981451471

interleave_hit 849781831 878579884

local_node 19627390917 20298995632

other_node 2337529981 2945859084

numa_hit是打算在该节点上分配内存，最后从这个节点分配的次数。

num_miss是打算在该节点分配内存，最后却从其他节点分配的次数。

num_foregin是打算在其他节点分配内存，最后却从这个节点分配的次数。

interleave_hit是采用interleave策略最后从该节点分配的次数。

local_node该节点上的进程在该节点上分配的次数。

other_node是其他节点进程在该节点上分配的次数。

lscpu可以看到两个node的cpu归属:

lscpu

...

NUMA node0 CPU(s): 0,2,4,6,8,10,12,14,16,18,20,22,24,26,28,30

NUMA node1 CPU(s): 1,3,5,7,9,11,13,15,17,19,21,23,25,27,29,31

numactl --hardware命令则会返回不同节点的内存总大小，可用大小,以及node distance等信息。

各个cpu负载情况，使用命令:mpstat -P ALL(需要安装sysstat)

Linux上使用numactl设定进程的numa策略。

常见的情况是，数据库daemon进程(mongodb,mysql)可能会吃掉很多内存，而一个numa节点上的内存很有限，内存不够时虚拟内存频繁与硬盘交换数据，导致性能急剧下降(标识是irqbalance进程top中居高不下)，这时应该采用interleave的numa策略，允许从其他节点分配内存。

各个内存的访问延迟如何?numactl man中的example提供了参考：

写速度:

numactl --cpubind=0 --membind=0 dd if=/dev/zero of=/dev/shm/A bs=1M count=1024

1024+0 records in

1024+0 records out

1073741824 bytes (1.1 GB) copied, 0.546679 s, 2.0 GB/s

numactl --cpubind=0 --membind=1 dd if=/dev/zero of=/dev/shm/A bs=1M count=1024

1024+0 records in

1024+0 records out

1073741824 bytes (1.1 GB) copied, 0.612825 s, 1.8 GB/s

读速度:

测试从同一个节点读取:

numactl --cpubind=0 --membind=0 dd if=/dev/zero of=/dev/shm/A bs=1M count=1000

date +%s.%N

numactl --cpubind=0 --membind=0 cp /dev/shm/A /dev/null

date +%s.%N

rm /dev/shm/A

花费0.26秒,速度是3.78GB/s。

从另一个节点读取:

numactl --cpubind=0 --membind=0 dd if=/dev/zero of=/dev/shm/A bs=1M count=1000

date +%s.%N

numactl --cpubind=1 --membind=1 cp /dev/shm/A /dev/null

date +%s.%N

rm /dev/shm/A

花费0.33秒,速度是3.02GB/s。

参考

NUMA架构的CPU -- 你真的用好了么？ • cenalulu's Tech Blog

NUMA调试命令

numa简介

计算机主板架构

继续阅读

交换机实验之端口安全、交换机端口隔离、跨交换机实现VLAN计算机网络实验报告

高防服务器、高防IP与高防CDN的区别

（网络安全）nmap可实现的功能以及使用方法1X01：主机扫描1X02：扫描技巧1X04：服务和版本探测1X05：脚本扫描1X06：操作系统探测

nmap –script 使用：nmap-vulners 和 vulscan出现错误 ‘/usr/bin/../share/nmap/scripts/vulscan’ found, but will

网络流量分析之流量采集到流量还原

2.4和2.6内核的netfilter差异点

2.6内核netfilter包截获

RSA数字签名和加解密

【守网络洪闸，还大运会一片安全】截止到8月5日，国家能源集团数智科技公司所属大数据公司作为重点网络安全服务保障单位，盛会

【图解HTTP】——与http协作的Web服务器用单台虚拟主机实现多个域名通信数据转发程序：代理、网关、隧道保存资源的缓存

【图解HTTP】——确认访问用户的身份：认证机制认证机制

HTTP学习笔记（7）—— 确保WEB安全的HTTPS

【图解HTTP】——确保Web安全的HTTPSHTTPS小结

Linux之父警告全球程序员：我刚发布的5.12内核有bug，你们千万别用

网络空间安全中高职业院校职技能大赛——Telnet弱口令渗透测试

Bugku-WEB-web33