容器健康检查写不好,测试环境就会假绿
2026年4月记录,分类「Docker」。内容按测试执行视角整理,尽量把背景、操作和验收口径讲清楚。
问题定位
测试工程师经常要处理环境问题。我的做法是把服务、配置、日志、数据库、网络这几层分开看,避免一上来就重启碰运气。
我更关注它在真实提测流程里怎么落地,而不是单独演示一个命令或脚本。
处理顺序
- 先确认容器、端口、进程和健康检查。
- 再看配置变更、环境变量、挂载目录和依赖地址。
- 恢复后补一组冒烟用例,确认业务真的可用。
docker ps
docker logs --tail=100 web
curl -I http://127.0.0.1/health
ss -lntp
命令记录
- 能说明故障发生在哪一层。
- 恢复动作可重复,不依赖某个窗口里的临时命令。
- 环境变更有记录,方便下次排查。
执行时最好把截图、请求、响应、日志时间点放在一起,后面复盘会省很多事。
可复用清单
环境问题处理完不算结束,留下可复用的排查路径才算真的闭环。如果放到流水线里,建议先从最小冒烟开始,再逐步扩大覆盖。