FreezeJ' Blog

运维检查项

2020-09-28

服务器上线前可以做如下检查,或者脚本化模块化实现自动运维巡检(持续补充)

  1. 服务器配置是否跟同类型相同(cpu/内存/硬盘)
  2. 服务器设置为最大连接数(ulimit -n 65535)
  3. 服务器设置正确的时区,时间,下载源地址
  4. 系统升级到最新的稳定版本
  5. 服务器设置了标准的hostname
  6. 服务器ssh设置了对应的用户访问权限(包括/etc/sudoers)
  7. 服务器设置了备份文件夹和权限(以及对应的定时备份任务)
  8. 服务器去掉了非必要的服务和端口
  9. 常规服务添加到开机启动
  10. 非常规服务添加到/etc/rc.local,设置好自启动
  11. 服务器设置了对应的安全组,并且安全组没有开放多余的端口
  12. 服务都正常安装在默认路径或规定路径,如/data/
  13. 服务都正常启动,端口正常启动,外部可以访问,日志文件存在且没有报错
  14. 服务以项目账号运行,非root
  15. 服务日志都有设置到指定路径,并且考虑是否需要分析、是否需要分割、是否需要备份、定时清理
  16. 数据库设置了权限和访问限制,设置慢查询/binlog,expire/有没主从/从库权限只读/主从监控,设置了用户权限,设置了最大内存使用,设置了最大连接数,设置了数据备份、备份清理
  17. salt编写了对应的安装/启动/关闭/检查/更新sls文件或运维平台实现了相应功能
  18. 服务器安装了salt/zabbix客户端(是否加入监控和批量控制)
  19. 服务器添加到zabbix监控系统/运维平台/salt列表(是否可以真实的监控和批量控制)
  20. zabbix有常规的监控以及有针对性的进程监控,有对应的template(是否有效监控到有用数据)
  21. 形成技术文档/FAQ
Tags: Linux