分类目录归档:服务器运维

Ubuntu服务器加固的测试检查单

发表评论 421 浏览量

Ubuntu服务器加固的测试检查单

2026年2月记录,分类「Linux」。这里不追求大而全,主要记录一个测试点从发现到落地的过程。

加固范围

服务器加固测试我会从账号、端口、SSH、日志、补丁、防火墙几个方向看,重点是确认加固后业务不受影响。

我当时想确认的不是工具能不能跑,而是这个点能不能稳定地变成测试资产。

检查项

  • 检查 root 登录、弱口令、SSH 端口和密钥策略。
  • 确认防火墙只开放必要端口。
  • 加固后跑网站首页、后台、上传、定时任务的冒烟。
ss -lntp
ufw status
lastlog
sudo grep 'Failed password' /var

阅读全文

MySQL备份恢复演练:测试环境也要会救火

发表评论 718 浏览量

MySQL备份恢复演练:测试环境也要会救火

2025年9月记录,分类「服务器运维」。内容按测试执行视角整理,尽量把背景、操作和验收口径讲清楚。

为什么演练

备份文件存在不代表能恢复。测试环境也应该做恢复演练,尤其是字符集、表数量、关键数据这些容易被忽略。

对测试来说,最后要落到可复现、可验证、可交接,文章也是按这个思路写的。

备份动作

  • 备份前记录数据库名、字符集、表数量和文件大小。
  • 恢复到临时库,避免直接覆盖当前环境。
  • 恢复后抽查文章、用户、权限、配置等关键表。
mysqldump --default-character-set=utf8mb4 djangoblog > back

阅读全文

OpenTelemetry辅助定位接口链路耗时

发表评论 1458 浏览量

OpenTelemetry辅助定位接口链路耗时

2024年8月记录,分类「服务器运维」。这篇更像工作笔记,记录的是一次问题拆解和复用清单。

为什么接链路追踪

接口慢的时候,如果只有总耗时,很难判断卡在网关、应用、数据库还是外部服务。OpenTelemetry 的价值是把链路拆开。

我更关注它在真实提测流程里怎么落地,而不是单独演示一个命令或脚本。

看哪些span

  • 压测或接口回归时保留 traceId。
  • 对数据库查询、外部 HTTP、消息处理分别看 span 耗时。
  • 把慢请求样本和链路截图放进缺陷。
traceId=7f2a...
api gateway: 32ms
app servic

阅读全文

Kubernetes临时测试环境:命名空间和资源清理

发表评论 1537 浏览量

Kubernetes临时测试环境:命名空间和资源清理

2024年3月记录,分类「Kubernetes」。这篇更像工作笔记,记录的是一次问题拆解和复用清单。

临时环境的目标

临时测试环境最怕开了没人关。Kubernetes 里我会优先用 namespace 隔离,并给资源打标签,方便清理和统计成本。

记录这篇的目的,是让下次遇到同类问题时少走一轮弯路。

资源隔离

  • 每个需求或分支使用独立 namespace。
  • Deployment、Service、ConfigMap、Secret 都打统一 label。
  • 设置过期时间,定时任务清理长时间不用的环境。
kubectl create names

阅读全文

Nginx反向代理问题:502、超时和真实IP

发表评论 1639 浏览量

Nginx反向代理问题:502、超时和真实IP

2023年7月记录,分类「服务器运维」。这里不追求大而全,主要记录一个测试点从发现到落地的过程。

常见现象

Nginx 问题经常被简单归为 502,但背后可能是 upstream 不通、uWSGI 没启动、超时太短、真实 IP 传递错误。

整理时我特意把输入、动作、观察点和风险拆开,方便后面补用例。

链路检查

  • 先从 Nginx error.log 判断是连接失败还是上游超时。
  • 确认 upstream 地址、端口和容器 IP 是否变化。
  • 检查 X-Forwarded-For、Host、超时和 body 大小限制。
nginx -t
tail

阅读全文

MySQL慢查询导致接口超时的一次复盘

发表评论 2078 浏览量

MySQL慢查询导致接口超时的一次复盘

2022年10月记录,分类「服务器运维」。这篇按当时的测试现场整理,重点放在目标、动作和可复用的检查点。

故障表现

这次接口超时一开始被怀疑是应用线程池不够,后来从慢日志看到某个列表查询扫描了几十万行。问题不复杂,但定位顺序很典型。

记录这篇的目的,是让下次遇到同类问题时少走一轮弯路。

定位过程

  • 先拿接口参数复现慢请求,记录响应时间和 traceId。
  • 在数据库里找对应 SQL,执行 EXPLAIN 看扫描行数。
  • 加索引后用同一批数据回归,确认 p95 和慢日志都下降。
EXPLAIN SELECT * FROM orders WHERE use

阅读全文

Linux日志定位:从grep到journalctl

发表评论 2057 浏览量

Linux日志定位:从grep到journalctl

2022年7月记录,分类「Linux」。内容按测试执行视角整理,尽量把背景、操作和验收口径讲清楚。

先看现象

服务器问题不能靠感觉猜。这篇是我整理的一套基础排障顺序,适合页面打不开、接口超时、服务重启失败这类场景。

整理时我特意把输入、动作、观察点和风险拆开,方便后面补用例。

排查顺序

  • 先确认时间点、影响范围和是否所有接口都失败。
  • 再看端口、进程、磁盘、内存,排除基础资源问题。
  • 最后按 Nginx、uWSGI、Django、MySQL 的链路往下追。
ss -lntp
df -h
free -m
journalctl -u ngin

阅读全文