VastbaseG100

基于openGauss内核开发的企业级关系型数据库。

Menu

gs_checkos

背景信息

gs_checkos工具用来帮助检查操作系统、控制参数、磁盘配置等内容,并对系统控制参数、I/O配置、网络配置和THP服务等信息进行配置。

前提条件

  • 当前的硬件和网络环境正常。

  • 各主机间root互信状态正常。

  • 只能使用root用户执行gs_checkos命令。

该工具不支持独立调用,出于安全考虑,前置完成后会自动删除。

语法

  • 检查操作系统信息

    gs_checkos -i ITEM [-f HOSTFILE] [-h HOSTNAME] [-X XMLFILE] [--detail] [-o OUTPUT] [-l LOGFILE] 
    
  • 显示帮助信息

    gs_checkos -? | --help 
    
  • 显示版本号信息

    gs_checkos -V | --version
    

参数说明

  • -i

    列表编号。格式:-i A、-i B1、-i A1 -i A2或-i A1,A2。

    取值范围:A1…A14、B1…B8。

    • A1…A14 表示只检查操作系统参数,并不设置。
    • B1…B8 表示将参数系统参数设置为期望值。
    • A和B不能同时输入。

    详细的检查项请参见表1

  • -f

    主机名称列表文件。

    -f和-h参数不能同时使用。

    取值范围:主机名称的列表。

  • -h

    指定需要检查的主机名称,可以同时指定多个主机,主机之间使用“,”分割。

    取值范围:Vastbase的主机名称。如果不指定主机,则检查当前主机。

  • -X

    Vastbase的XML配置文件。

  • --detail

    显示检查结果详情。

  • -o

    指定OS检查报告输出到指定的文件。

    不指定则将检查结果输出到屏幕上。

  • -l

    指定日志文件及存放路径。

    默认值:/tmp/gs_checkos/gs_checkos-YYYY-MM-DD_hhmmss.log。

  • -?, --help

    显示帮助信息。

  • -V, --version

    显示版本号信息。

表 1 操作系统检查项

编号

检查项

检查项详细说明

A1

操作系统版本(OS version status)

操作系统版本检查:保证主机平台是支持的openEuler和CentOS平台中的一种。同时保证Vastbase各个主机的平台是属于同一混编范围的。

A2

内核版本(Kernel version status)

内核版本检查。

A3

Unicode状态(Unicode status)

字符集设置检查:保证Vastbase各个主机的字符集一致。

A4

时区状态(Time zone status)

时区时间设置检查:保证Vastbase各个主机的时区状态一致。

A5

交换内存状态(Swap memory status)

Swap分区检查:各个主机的swap分区大小必须小于等于各主机内存总大小。

A6

系统控制参数(System control parameters status)

内核参数检查:保证当前内核中的参数值和默认的期望值保持一致。

详细的内核参数请参见操作系统参数

A7

文件系统配置状态(File system configuration status)

系统文件句柄检查:系统文件句柄的参数值必须大于等于100万。

线程堆栈大小检查:线程堆栈大小大于等于3072KB。

进程最大可用虚拟内存:系统进程最大可用虚拟内存为unlimited。

A8

磁盘配置状态(Disk configuration status)

硬盘挂载参数检查:格式为xfs的硬盘,其挂载格式必须为:“rw,noatime,inode64,allocsize=16m”。

A9

预读块大小状态(Pre-read block size status)

预读参数检查:预读参数期望值为16384。

A10

I/O调度状态(IO scheduler status)

I/O调度策略检查:I/O调度策略的方式为deadline。

A11

网卡配置状态(Network card configuration status)

万兆以下网卡参数检查:

  • 确保网卡mtu=1500。

万兆及以上网卡参数检查:

  • 当网卡为非绑定模式,同时网卡类型为万兆时,确保mtu=1500,rx/tx >=4096。
  • 当网卡为绑定模式时,需保证绑定的每个网卡类型均为万兆,然后再确保mtu=1500,rx/tx>=4096。
  • Vastbase周边设备(例如交换机等)的网卡也要设置成与Vastbase部署的主机一致的值。

A12

时间一致性(Time consistency status)

时间一致性检查:确认ntp服务启动,Vastbase各个主机的系统时间误差不超过60s,在资源池化场景下不超过6s。

A13

防火墙状态(Firewall service status)

防火墙检查: 确认防火墙的状态为关闭状态。

A14

THP服务(THP service status)

THP服务检查:确认THP服务状态为关闭状态。

B1

设置系统控制参数(Set system control parameters)

内核参数设置:当实际值不满足检查条件期望时,对结果为Abnormal项参数进行修改设置;对Warning项不进行设置,由用户根据实际环境设置。

B2

设置文件系统配置值(Set file system configuration value)

系统文件句柄设置:当系统文件句柄的参数值小于100万时,对其进行修改设置。

线程堆栈大小设置:线程堆栈大小小于3072KB时,对其进行设置。

进程最大可用虚拟内存设置:系统进程最大可用虚拟内存不为unlimited时对其进行修改设置。

B3

设置预读块大小值(Set pre-read block size value)

硬盘预读参数设置:当系统的实际值小于16384时,对其进行修改设置。

B4

设置I/O调度值(Set IO scheduler value)

I/O配置项的设置:当系统的实际值不为deadline时,对其进行修改设置。

B5

设置网卡配置值(Set network card configuration value)

万兆网卡参数设置:对不满足万兆网卡的RX、TX参数进行设置,不对MTU参数进行设置。

B6

设置THP服务(Set THP service)

THP服务设置:如果THP服务启动,将该服务关闭。

B7

设置欧拉系统属性(Set RemoveIPC value)

欧拉系统属性检查:检查设置欧拉系统文件/usr/lib/systemd/system/systemd-logind.service,/etc/systemd/logind.conf中配置项RemoveIPC属性值是否为no,当不为no时,对其进行修改设置。

B8

设置sshd服务应用pam模块(Set Session Process)

远程设备继承系统默认资源:修改/etc/pam.d/sshd服务文件,添加配置项session required pam_limits.so,来控制用户使用的资源。

  • A6选项检查标准来自配置文件check_list.conf下[/etc/sysctl.conf]、[SUGGEST:/etc/sysctl.conf]域: 若[/etc/sysctl.conf]下参数值与系统实际参数值不同,A6检查提示Abnormal,可以使用B1参数进行设置。 若[SUGGEST:/etc/sysctl.conf]下参数值与系统实际参数值不同,A6检查提示Warning,B1参数不会进行设置,需根据实际情况进行手动设置。

  • A7选项检查系统文件句柄标准来自配置文件check_list.conf下[/etc/security/limits.conf]域open file参数,可以使用B2参数进行设置。

  • A11选项检查万兆网卡参数“MTU”、“RX”、“TX”标准来自配置文件check_list.conf下[/sbin/ifconfig]域,可以使用B5参数对RX、TX进行设置,MTU需用户手动设置。

  • 使用gs_checkos设置的内核参数值和文件句柄参数值,需重启新会话生效。

操作系统参数

表 2 操作系统参数

参数名称

参数说明

推荐取值

net.ipv4.tcp_max_tw_buckets

表示同时保持TIME_WAIT状态的TCP/IP连接最大数量。如果超过所配置的取值,TIME_WAIT将立刻被释放并打印警告信息。

10000

net.ipv4.tcp_tw_reuse

允许将TIME-WAIT状态的sockets重新用于新的TCP连接。

  • 0表示关闭。
  • 1表示开启。

1

net.ipv4.tcp_tw_recycle

表示开启TCP连接中TIME-WAIT状态sockets的快速回收。

  • 0表示关闭。
  • 1表示开启。

1

net.ipv4.tcp_keepalive_time

表示当keepalive启用的时候,TCP发送keepalive消息的频度。

30

net.ipv4.tcp_keepalive_probes

在认定连接失效之前,发送TCP的keepalive探测包数量。这个值乘以tcp_keepalive_intvl之后决定了一个连接发送了keepalive之后可以有多少时间没有回应。

9

net.ipv4.tcp_keepalive_intvl

当探测没有确认时,重新发送探测的频度。

30

net.ipv4.tcp_retries1

在连接建立过程中TCP协议最大重试次数。

5

net.ipv4.tcp_syn_retries

TCP协议SYN报文最大重试次数。

5

net.ipv4.tcp_synack_retries

TCP协议SYN应答报文最大重试次数。

5

net.ipv4.tcp_retries2

控制内核向已经建立连接的远程主机重新发送数据的次数,低值可以更早的检测到与远程主机失效的连接,因此服务器可以更快的释放该连接。

发生“connection reset by peer”时可以尝试调大该值规避问题。

12

vm.overcommit_memory

控制在做内存分配的时候,内核的检查方式。

  • 0:表示系统会尽量精确计算当前可用的内存。
  • 1:表示不作检查直接返回成功。
  • 2:内存总量×vm.overcommit_ratio/100+SWAP的总量,如果申请空间超过此数值则返回失败。

内核默认是2过于保守,推荐设置为0,如果系统压力大可以设置为1。

0

net.ipv4.tcp_rmem

TCP协议接收端缓冲区的可用内存大小。分无压力、有压力、和压力大三个区间,单位为页面。

8192 250000 16777216

net.ipv4.tcp_wmem

TCP协议发送端缓冲区的可用内存大小。分无压力、有压力、和压力大三个区间,单位为页面。

8192 250000 16777216

net.core.wmem_max

socket发送端缓冲区大小的最大值。

21299200

net.core.rmem_max

socket接收端缓冲区大小的最大值。

21299200

net.core.wmem_default

socket发送端缓冲区大小的默认值。

21299200

net.core.rmem_default

socket接收端缓冲区大小的默认值。

21299200

net.ipv4.ip_local_port_range

物理机可用临时端口范围。

26000-65535

kernel.sem

内核信号量参数设置大小。

250 6400000 1000 25600

vm.min_free_kbytes

保证物理内存有足够空闲空间,防止突发性换页。

系统总内存的5%

net.core.somaxconn

定义了系统中每一个端口最大的监听队列的长度,这是个全局的参数。

65535

net.ipv4.tcp_syncookies

当出现SYN等待队列溢出时,启用cookies来处理,可防范少量SYN攻击。

  • 0表示关闭SYN Cookies。
  • 1表示开启SYN Cookies。

1

net.core.netdev_max_backlog

在每个网络接口接收数据包的速率比内核处理这些包的速率快时,允许送到队列的数据包的最大数目。

65535

net.ipv4.tcp_max_syn_backlog

记录的那些尚未收到客户端确认信息的连接请求的最大值。

65535

net.ipv4.tcp_fin_timeout

系统默认的超时时间。

60

kernel.shmall

内核可用的共享内存总量。

1152921504606846720

kernel.shmmax

内核参数定义单个共享内存段的最大值。

18446744073709551615

net.ipv4.tcp_sack

启用有选择的应答,通过有选择地应答乱序接受到的报文来提高性能,让发送者只发送丢失的报文段(对于广域网来说)这个选项应该启用,但是会增加对CPU的占用。

  • 0表示关闭。
  • 1表示开启。

1

net.ipv4.tcp_timestamps

TCP时间戳(会在TCP包头增加12节),以一种比重发超时更精确的方式(参考RFC 1323)来启用对RTT的计算,启用可以实现更好的性能。

  • 0表示关闭。
  • 1表示开启。

1

vm.extfrag_threshold

系统内存不够用时,linux会为当前系统内存碎片情况打分,如果超过vm.extfrag_threshold的值,kswapd就会触发memory compaction。所以这个值设置的接近1000,说明系统在内存碎片的处理倾向于把旧的页换出,以符合申请的需要,而设置接近0,表示系统在内存碎片的处理倾向做memory compaction。

500

vm.overcommit_ratio

系统使用绝不过量使用内存的算法时,系统整个内存地址空间不得超过swap+RAM值的此参数百分比,当vm.overcommit_memory=2时此参数生效。

90

MTU

节点网卡最大传输单元。OS默认值为1500,调整为8192可以提升SCTP协议数据收发的性能。

8192

文件系统参数

  • soft nofile

    说明:soft nofile表示软限制,用户使用的文件句柄数量可以超过该限制,但是如果超过会有告警信息。

    推荐取值:1000000

  • hard nofile

    说明:hard nofile表示硬限制,是一个严格的限制,用户使用的文件句柄数量一定不能超过该设置。

    推荐取值:1000000

  • stack size

    说明:线程堆栈大小。

    推荐值:3072

示例

使用如下命令检查操作系统参数。

gs_checkos -i A -h plat1 -X /opt/software/vastbase/clusterconfig.xml --detail -o /var/log/checkos 
Performing operation system check/set. Output the result to the file /var/log/checkos.
Operation system check/set is completed.
Total numbers:14. Abnormal numbers:0. Warning number:1.

查看操作系统参数检查结果。

vim /var/log/checkos 
Checking items:
    A1. [ OS version status ]                                   : Normal
    A2. [ openGauss version status ]                            : Normal
    A3. [ Unicode status ]                                      : Normal
    A4. [ Time zone status ]                                    : Normal
    A5. [ Swap memory status ]                                  : Normal
    A6. [ System control parameters status ]                    : Normal
    A7. [ File system configuration status ]                    : Normal
    A8. [ Disk configuration status ]                           : Normal
    A9. [ Pre-read block size status ]                          : Normal
    A10.[ IO scheduler status ]                                 : Normal
    A11.[ Network card configuration status ]                   : Normal
    A12.[ Time consistency status ]                             : Warning
    A13.[ Firewall service status ]                             : Normal
    A14.[ THP service status ]                                  : Normal

相关命令

gs_checkgs_checkperf