서버관리 삽질 기록

24시간 모니터링 (?)

ForceCore 2006. 8. 5. 08:24

사람인 이상 계속 깨있을 수는 없는법 -_-...

cron을 쓰든지 하여자동화를 해야 한다. -_-+

 

서버가 언제 죽는지 확인하기로 했다.

꼭 자고 있을때 서버가 죽어버리더군...

 

cron이 먹히지 않았다. 어디가 잘못된것인진 몰라도.

그래서 윈도우쪽에서 매크로 프로그램을 깔고 (...)

터미널에 키보드 타자를 보내게 했다.

결과는 나름대로 성공적.....

 

뻗기 직전의 dmesg를 보니

rpcbind라는 것이 죽은 뒤

nis도 죽고 (아하, 그래서 로그인이 안 되는것이었군.. 메일 서비스 ID도 nis로 관리되고, apache가 실행되는 계정도 nis상의 계정이었다 -_-;;;)

그 뒤로 먹통이 되는 것으로 분석되었다.

 

다른 좀 더 경험이 많은 분께 현재 상황을 말씀드리고

원인으로 의심가는 사항이 있는지 물어보았다.

 

"rpcbind가 cpu 100% 점유하며 돌다가 서버가 방법당하는데,

그 상황은 피하고자 스크립트를 짰었다. 그런데 스크립트도

그다지 성공적이진 않았나보군."

 

rpcbind에 대해 좀 더 알아보기로한다...;