가이드
운영 가이드 13. 오픈 전 점검과 장애 대응: 로그, 상태, 백업 확인
서비스 오픈 전에 꼭 확인해야 하는 항목과, 운영 중 문제가 났을 때 `nginx`, `php-fpm`, `MariaDB`, `journalctl`, 디스크, 메모리를 어떤 순서로 보는지 정리했습니다.
서비스 장애는 대개 복잡한 버그보다 작은 점검 누락에서 시작됩니다. 인증서 만료, 디스크 가득 참, 권한 오류, PHP-FPM 다운 같은 기본 항목을 먼저 보면 해결이 빠른 경우가 많습니다.
이 글은 오픈 전 체크리스트와 장애 시 우선 확인 명령을 하나로 묶은 운영용 참고 글입니다.
오픈 전 체크리스트
- 도메인과 DNS가 정확히 서버를 가리키는지
- HTTP -> HTTPS 리다이렉트가 정상인지
- 업로드 경로와 캐시 경로가 실제로 writable 인지
- 데이터베이스 계정이 root가 아닌 전용 계정인지
- 백업 파일이 생성되고 실제 복원 테스트가 되는지
- Certbot 자동 갱신 dry-run이 통과하는지
서비스 상태 한 번에 보기
sudo systemctl status nginx
sudo systemctl status php8.3-fpm
sudo systemctl status mariadb
sudo systemctl status redis-server
sudo systemctl status supervisor로그 확인 순서
프론트에서 502가 나면 대개 Nginx보다 PHP-FPM 상태를 먼저 확인하는 쪽이 빠릅니다.
sudo nginx -t
sudo journalctl -u nginx -n 100 --no-pager
sudo journalctl -u php8.3-fpm -n 100 --no-pager
sudo journalctl -u mariadb -n 100 --no-pager
sudo tail -n 100 /var/log/nginx/error.log
sudo tail -n 100 /var/log/nginx/access.log리소스 확인
디스크 부족, 메모리 부족, 포트 충돌은 초반 장애에서 가장 흔하게 나오는 항목입니다.
df -h
free -h
top
sudo ss -tulpn백업과 복구 점검
ls -lh /backup
sudo certbot renew --dry-run
gunzip -c /backup/appdb-2026-05-03.sql.gz | head백업 파일이 있다는 사실만으로는 충분하지 않습니다. 복원 명령이 실제로 돌아가는지 테스트까지 해 두는 편이 좋습니다.
마무리 메모
운영은 결국 반복 점검의 품질입니다. 작은 서버라도 로그, 백업, 인증서, 디스크, 권한만 꾸준히 보면 큰 사고를 많이 줄일 수 있습니다.
이 시리즈는 가이드 게시판에 계속 추가해 나갈 수 있으니, 실제 운영에서 겪은 메모를 덧붙여서 내부 표준 문서처럼 키워도 좋습니다.