title: 服务器考机
author: Gamehu
date: 2025-06-04 10:35:09
tags:
---
AI提效
Claude Sonnet 4+ ChatGPT
此系列,多多少少都会用到AI。
## 背景
刚购置了一台服务器,准备付尾款了,但是因为服务器是全新的,只装了几台虚拟机,显卡啥的都还没有用,所以在付钱之前需要先测试一下,看看表现。
跑了一整晚,第二天,看着没问题就删掉了虚拟机,忘了截图。
## 服务器配置
1. CPU: 2*96
2. 内存:384G
3. 硬盘:5*3.4T
4. 显卡:2*RTX5880
## 准备工作
1. 开启显卡直通
2. 停掉所有虚拟机
3. 新建一台临时虚拟机
1. 分配所有CPU+350GB内存+500G硬盘+2*RTX5880
2. 安装ubuntu 24.04
## 安装显卡对应的驱动
```
sudo apt install ubuntu-drivers-common
ubuntu-drivers devices
sudo ubuntu-drivers autoinstall
```
## 安装烤鸡需要的工具
1. gpu-burn
2. stress-ng
3. ...
## 系统测试脚本( GPU + CPU + 内存 + IO综合烤机测试)
```
#!/bin/bash
set -e
# 设置工具路径(修改为你实际的 gpu_burn 目录)
GPU_BURN_PATH="$HOME/gpu-burn/gpu_burn"
# 检查是否存在命令
command -v stress-ng >/dev/null 2>&1 || { echo >&2 "需要安装 stress-ng:sudo apt install stress-ng -y"; exit 1; }
command -v fio >/dev/null 2>&1 || { echo >&2 "需要安装 fio:sudo apt install fio -y"; exit 1; }
# 检查 GPU_BURN 是否存在
if [ ! -f "$GPU_BURN_PATH" ]; then
echo "找不到 gpu_burn,可在 https://github.com/wilicc/gpu-burn 下载并编译"
exit 1
fi
echo "开始 GPU + CPU + 内存 + IO 综合烤机测试"
# GPU 测试
"$GPU_BURN_PATH" 86400 &
GPU_PID=$!
# CPU 测试
stress-ng --cpu 0 --timeout 24h --metrics-brief &
CPU_PID=$!
# 内存测试
stress-ng --vm 4 --vm-bytes 80% --timeout 24h --metrics-brief &
MEM_PID=$!
# 磁盘I/O测试
fio --name=randwrite --ioengine=libaio --iodepth=16 --rw=randwrite --bs=4k --direct=1 --size=4G --numjobs=4 --runtime=86400 --group_reporting &
IO_PID=$!
echo "测试开始,PID: GPU=$GPU_PID, CPU=$CPU_PID, MEM=$MEM_PID, IO=$IO_PID"
wait
```
## 监控几种方案
1. watch命令
```
# 每5秒刷新GPU状态
watch -n 5 nvidia-smi
# 每10秒刷新(减少刷新频率)
watch -n 10 nvidia-smi
# 只看关键信息
watch -n 5 "nvidia-smi --query-gpu=name,temperature.gpu,power.draw,utilization.gpu,memory.used --format=csv"
```
2. nvtop
```
bash# 安装nvtop - GPU实时监控工具
sudo apt update
sudo apt install nvtop -y
# 运行nvtop
nvtop
```
3.安装netdata + GPU集成插件