网站搜索

监控 Linux 性能的 20 个必备命令行工具


作为一名系统或网络管理员,每天负责监控和调试 Linux 系统性能问题,这是一项极具挑战性的责任。

它需要坚定不移的奉献精神、对 Linux 系统的深刻理解以及对确保最佳性能和可靠性的持续承诺。

在 IT 行业担任 Linux 管理员十年后,我真正体会到监控和确保系统持续运行的艰巨任务。

鉴于此,我们整理了一份最常用的 20 个命令行监控工具的完整列表。这些宝贵的工具对于每个 Linux/Unix 系统管理员来说都是不可或缺的,使他们能够有效地监控、诊断和维护系统的健康状况和性能。

这些监控工具可在所有版本的Linux下使用,并且可用于监控和查找性能问题的实际原因。这里显示的命令列表足以让您选择适合您的监控场景的命令。

1. Top – Linux进程监控

Linux top 命令是许多系统管理员经常使用的性能监控程序,用于监控 Linux 性能,并且可在许多 Linux/类 Unix 操作系统下使用。

top命令用于以有序列表显示所有正在运行和活动的实时进程,并定期更新。它显示CPU使用率内存使用率交换内存缓存大小缓冲区大小进程 PID用户命令等等。

它还显示正在运行的进程的内存和 CPU 利用率较高。 top 命令对于系统管理员监控并在需要时采取纠正措施非常有用。让我们看看 top 命令的实际作用。

top

2.VmStat——虚拟内存统计

Linux VmStat命令用于显示虚拟内存内核线程磁盘系统进程的统计信息I/O 块中断CPU 活动等等。

在 Linux 上安装 VmStat

默认情况下,vmstat 命令在 Linux 系统下不可用,您需要安装一个名为 sysstat 的软件包(一个强大的监控工具),其中包含 vmstat 程序。

sudo yum install sysstat      [On Older CentOS/RHEL & Fedora]
sudo dnf install sysstat      [On CentOS/RHEL/Fedora/Rocky Linux & AlmaLinux]
sudo apt-get install sysstat  [On Debian/Ubuntu & Mint]
sudo pacman -S sysstat        [On Arch Linux]

vmstat 命令格式的常见用法是。

vmstat

procs -----------memory---------- ---swap-- -----io---- -system-- ------cpu-----
 r  b   swpd   free   buff  cache   si   so    bi    bo   in   cs us sy id wa st
 1  0  43008 275212   1152 561208    4   16   100   105   65  113  0  1 96  3  0

3.Lsof——列出打开的文件

lsof 命令在许多Linux/类Unix系统中使用,用于显示所有打开的文件和进程的列表。包括的打开文件有磁盘文件网络套接字管道设备进程强>。

使用此命令的主要原因之一是当磁盘无法卸载并显示文件正在使用或打开的错误时。使用此命令,您可以轻松识别哪些文件正在使用。

lsof 命令最常见的格式是。

lsof

COMMAND     PID   TID TASKCMD             USER   FD      TYPE             DEVICE SIZE/OFF       NODE NAME
systemd       1                           root  cwd       DIR                8,2      224        128 /
systemd       1                           root  rtd       DIR                8,2      224        128 /
systemd       1                           root  txt       REG                8,2  1567768  134930842 /usr/lib/systemd/systemd
systemd       1                           root  mem       REG                8,2  2714928  134261052 /usr/lib64/libm-2.28.so
systemd       1                           root  mem       REG                8,2   628592  134910905 /usr/lib64/libudev.so.1.6.11
systemd       1                           root  mem       REG                8,2   969832  134261204 /usr/lib64/libsepol.so.1
systemd       1                           root  mem       REG                8,2  1805368  134275205 /usr/lib64/libunistring.so.2.1.0
systemd       1                           root  mem       REG                8,2   355456  134275293 /usr/lib64/libpcap.so.1.9.0
systemd       1                           root  mem       REG                8,2   145984  134261219 /usr/lib64/libgpg-error.so.0.24.2
systemd       1                           root  mem       REG                8,2    71528  134270542 /usr/lib64/libjson-c.so.4.0.0
systemd       1                           root  mem       REG                8,2   371736  134910992 /usr/lib64/libdevmapper.so.1.02
systemd       1                           root  mem       REG                8,2    26704  134275177 /usr/lib64/libattr.so.1.1.2448
systemd       1                           root  mem       REG                8,2  3058736  134919279 /usr/lib64/libcrypto.so.1.1.1c
...

4. Tcpdump – 网络数据包分析器

tcpdump命令是最广泛使用的命令行网络数据包分析器数据包嗅探器程序之一,用于捕获或过滤 >TCP/IP 在网络上的特定接口上接收或传输的数据包。

它还提供了将捕获的包保存在文件中以供以后分析的选项。 tcpdump 几乎在所有主要 Linux 发行版中都可用。

tcpdump -i enp0s3

tcpdump: verbose output suppressed, use -v or -vv for full protocol decode
listening on enp0s3, link-type EN10MB (Ethernet), capture size 262144 bytes
10:19:34.635893 IP tecmint.ssh > 192.168.0.124.45611: Flags [P.], seq 2840044824:2840045032, ack 4007244093
10:19:34.636289 IP 192.168.0.124.45611 > tecmint.ssh: Flags [.], ack 208, win 11768, options 
10:19:34.873060 IP _gateway.57682 > tecmint.netbios-ns: NBT UDP PACKET(137): QUERY; REQUEST; UNICAST
10:19:34.873104 IP tecmint > _gateway: ICMP tecmint udp port netbios-ns unreachable, length 86
10:19:34.895453 IP _gateway.48953 > tecmint.netbios-ns: NBT UDP PACKET(137): QUERY; REQUEST; UNICAST
10:19:34.895501 IP tecmint > _gateway: ICMP tecmint udp port netbios-ns unreachable, length 86
10:19:34.992693 IP 142.250.4.189.https > 192.168.0.124.38874: UDP, length 45
10:19:35.010127 IP 192.168.0.124.38874 > 142.250.4.189.https: UDP, length 33
10:19:35.135578 IP _gateway.39383 > 192.168.0.124.netbios-ns: NBT UDP PACKET(137): QUERY; REQUEST; UNICAST
10:19:35.135586 IP 192.168.0.124 > _gateway: ICMP 192.168.0.124 udp port netbios-ns unreachable, length 86
10:19:35.155827 IP _gateway.57429 > 192.168.0.124.netbios-ns: NBT UDP PACKET(137): QUERY; REQUEST; UNICAST
10:19:35.155835 IP 192.168.0.124 > _gateway: ICMP 192.168.0.124 udp port netbios-ns unreachable, length 86
...

5.Netstat——网络统计

netstat 是一个命令行工具,用于监控传入传出网络数据包统计信息以及接口统计信息。对于每个系统管理员来说,它是监控网络性能和解决网络相关问题的非常有用的工具。

netstat -a | more

Active Internet connections (servers and established)
Proto Recv-Q Send-Q Local Address           Foreign Address         State
tcp        0      0 0.0.0.0:sunrpc          0.0.0.0:*               LISTEN
tcp        0      0 tecmint:domain          0.0.0.0:*               LISTEN
tcp        0      0 0.0.0.0:ssh             0.0.0.0:*               LISTEN
tcp        0      0 localhost:postgres      0.0.0.0:*               LISTEN
tcp        0      0 tecmint:ssh             192.168.0.124:45611     ESTABLISHED
tcp6       0      0 [::]:sunrpc             [::]:*                  LISTEN
tcp6       0      0 [::]:ssh                [::]:*                  LISTEN
tcp6       0      0 localhost:postgres      [::]:*                  LISTEN
udp        0      0 0.0.0.0:mdns            0.0.0.0:*
udp        0      0 localhost:323           0.0.0.0:*
udp        0      0 tecmint:domain          0.0.0.0:*
udp        0      0 0.0.0.0:bootps          0.0.0.0:*
udp        0      0 tecmint:bootpc          _gateway:bootps         ESTABLISHED
...

虽然现在 netstat 已被弃用,取而代之的是 ss 命令,但您仍然可以在网络工具包中发现 netstat。

6.Htop——Linux进程监控

htop是一个非常先进的交互式实时Linux进程监控工具,它与Linux top命令非常相似,但它具有一些丰富的功能,例如用户-管理流程的友好界面快捷键流程的垂直和水平视图等等。

htop

htop是一个第三方工具,Linux系统不自带,需要使用系统包管理工具安装。

有关 htop 安装的更多信息,请阅读我们的文章 – 在 Linux 中安装 Htop(Linux 进程监控)。

7.Iotop – 监控Linux磁盘I/O

iotop也很类似于top命令htop程序,但它具有记账功能,可以实时监控和显示磁盘 I/O进程

iotop 工具对于查找确切的进程以及进程的高使用率磁盘读/写非常有用。

在 Linux 上安装 Iotop

默认情况下,iotop 命令在 Linux 下不可用,您需要如图所示安装它。

sudo yum install iotop      [On Older CentOS/RHEL & Fedora]
sudo dnf install iotop      [On CentOS/RHEL/Fedora/Rocky Linux & AlmaLinux]
sudo apt-get install iotop  [On Debian/Ubuntu & Mint]
sudo pacman -S iotop        [On Arch Linux]

iotop命令格式的常见用法是。

iotop

8. iostat – 输入/输出统计

iostat 是一个简单的工具,可以收集和显示系统输入输出存储设备统计信息。该工具通常用于跟踪存储设备性能问题,包括设备本地磁盘远程磁盘(例如NFS ) 。

在 Linux 上安装 Iostat

要获取iostat命令,您需要安装一个名为sysstat的软件包,如图所示。

sudo yum install sysstat      [On Older CentOS/RHEL & Fedora]
sudo dnf install sysstat      [On CentOS/RHEL/Fedora/Rocky Linux & AlmaLinux]
sudo apt-get install sysstat  [On Debian/Ubuntu & Mint]
sudo pacman -S sysstat        [On Arch Linux]

iostat命令格式的常见用法是。

iostat

Linux 4.18.0-193.el8.x86_64 (tecmint)   04/05/2021      _x86_64_        (1 CPU)

avg-cpu:  %user   %nice %system %iowait  %steal   %idle
           0.21    0.03    0.59    2.50    0.00   96.67

Device             tps    kB_read/s    kB_wrtn/s    kB_read    kB_wrtn
sda               3.95        83.35        89.63    1782431    1916653

9. IPTraf – 实时 IP LAN 监控

IPTraf 是一款适用于 Linux 的基于开源控制台的实时网络 (IP LAN) 监控实用程序。它收集各种信息,例如通过网络传递的 IP 流量监控,包括 TCP 标志信息、ICMP 详细信息、TCP/UDP 流量细分、TCP 连接数据包和字节计数。

它还收集 TCP、UDP、IP、ICMP、非 IP、IP 校验和错误、接口活动等一般和详细接口统计信息。

10. Psacct 或 Acct – 监控用户活动

psacctacct 工具对于监控每个用户在系统上的活动非常有用。这两个守护进程都在后台运行,并密切监视系统上每个用户的整体活动以及他们消耗的资源。

这些工具对于系统管理员跟踪每个用户的活动非常有用,例如他们正在做什么、发出了什么命令、他们使用了多少资源、他们在系统上活动的时间等。

11.Monit——Linux进程和服务监控

Monit 是一款免费的开源且基于 Web 的进程监控实用程序,可自动监视和管理系统进程、程序、文件、目录、权限、校验和和文件系统。

它监控 Apache、MySQL、Mail、FTP、ProFTP、Nginx、SSH 等服务。可以从命令行或使用其自己的 Web 界面查看系统状态。

有关安装和配置,请阅读我们的文章 – 如何安装和设置 Monit(Linux 进程和服务监控)程序。

12. NetHogs – 监控每个进程的网络带宽

NetHogs 是一个开源的不错的小程序(类似于 Linux top 命令),它可以记录系统上每个进程的网络活动。它还跟踪每个程序或应用程序使用的实时网络流量带宽。

nethogs

有关安装和使用的信息,请阅读我们的文章:使用 NetHogs 监控 Linux 网络带宽

13. iftop – 网络带宽监控

iftop 是另一个基于终端的免费开源系统监控实用程序,它显示通过系统上的网络接口的网络带宽利用率(源主机和目标主机)的频繁更新列表。

iftop 类似于网络使用情况下的“top”,就像“top”提供 CPU 使用情况的洞察一样。

iftop 属于备受推崇的“顶级”网络监控工具系列。它专为观察用户选择的网络接口而设计,可呈现两个指定主机之间当前带宽利用率的实时数据。

iftop

有关安装和使用,请阅读我们的文章:iftop – 监控网络带宽利用率

14. Monitorix – 系统和网络监控

Monitorix 是一款免费的轻量级实用程序,旨在运行和监控 Linux/Unix 服务器中尽可能多的系统和网络资源。

它有一个内置的HTTP网络服务器,定期收集系统和网络信息并将其显示在图表中。它监视系统平均负载和使用情况内存分配磁盘驱动程序运行状况系统服务网络端口邮件统计SendmailPostfixDovecot等)、MySQL统计数据等等。

它旨在监控整体系统性能,并帮助检测故障、瓶颈、异常活动等。

有关安装和使用的信息,请阅读我们的文章:Monitorix a System and Network Monitoring Tool for Linux

15. Arpwatch – 以太网活动监视器

Arpwatch是一种旨在监控以太网地址解析(MACIP地址变化)的程序Linux 网络上的网络流量。

它持续监视以太网流量,并生成 IPMAC 地址对更改的日志以及网络上的时间戳。它还具有在添加或更改配对时向管理员发送电子邮件警报的功能。它对于检测网络上的 ARP 欺骗非常有用。

有关安装和使用,请阅读我们的文章:Arpwatch 监控以太网活动

16. Suricata – 网络安全监控

Suricata 是一款高性能开源网络安全入侵检测预防监控系统,适用于 LinuxFreeBSDWindows

它由非营利基金会OISF开放信息安全基金会)设计和拥有。

有关安装和使用的信息,请阅读我们的文章:Suricata – 网络入侵检测和预防系统

17. VnStat PHP – 监控网络带宽

VnStat PHP 是一个基于 Web 的前端应用程序,适用于最流行的网络工具“vnstat”。 VnStat PHP 以良好的图形模式监控网络流量使用情况。

它按每小时每日每月、显示总INOUT网络流量使用情况strong> 和完整摘要 报告。

有关安装和使用,请阅读我们的文章:监控网络带宽使用情况

18.Nagios – 网络/服务器监控

Nagios 是一款领先的开源强大监控系统,使网络/系统管理员能够在服务器相关问题影响主要业务流程之前识别并解决这些问题。

借助 Nagios 系统,管理员可以在单个窗口上监控远程 Linux、Windows、交换机、路由器和打印机。它会显示严重警告并指示您的网络/服务器是否出现问题,这间接帮助您在问题发生之前开始修复过程。

有关安装、配置和使用,请阅读我们的文章 – 安装 Nagios 监控系统以监控远程 Linux/Windows 主机

19. Nmon:监控Linux性能

Nmon(代表 Nigel 的性能监视器)工具,用于监视所有 Linux 资源,例如 CPU、内存、磁盘使用情况、网络、顶级进程、NFS、内核等等。该工具有两种模式:在线模式和捕获模式。

在线模式用于实时监控,捕获模式用于以 CSV 格式存储输出以供以后处理。

有关安装和使用,请阅读我们的文章:在 Linux 中安装 Nmon(性能监控)工具

20. Collectl:一体化性能监控工具

Collectl 是另一个强大且功能丰富的基于命令行的实用程序,可用于收集有关 Linux 系统资源的信息,例如 CPU 使用情况、内存、网络、索引节点、进程、nfs、TCP 、套接字等等。

有关安装和使用,请阅读我们的文章:在 Linux 中安装 Collectl(一体化性能监控)工具

我们想知道您使用哪种监控程序监控 Linux 服务器的性能。如果我们遗漏了您希望我们包含在此列表中的任何重要工具,请通过评论告知我们,并且请不要忘记分享。