반복영역 건너뛰기
주메뉴 바로가기
본문 바로가기
제품/서비스
EMS Solution
Features
클라우드 관리
서버관리
데이터베이스 관리
네트워크 관리
트래픽 관리
설비 IoT 관리
무선 AP 관리
교환기 관리
운영자동화
실시간 관리
백업 관리
스토리지 관리
예방 점검
APM Solution
애플리케이션 관리
URL 관리
브라우저 관리
ITSM Solution
서비스데스크
IT 서비스 관리
Big Data Solution
SIEM
AI 인공지능
Dashboard
대시보드
Consulting Service
컨설팅 서비스
고객
레퍼런스
고객FAQ
문의하기
가격
자료실
카탈로그
사용자매뉴얼
회사소개
비전·미션
연혁
2016~현재
2000~2015
인증서·수상
투자정보
재무정보
전자공고
IR자료
새소식
공고
보도자료
오시는 길
채용
피플
컬처
공고
FAQ
블로그
열기
메인 페이지로 이동
블로그
기술이야기
블로그
최신이야기
사람이야기
회사이야기
기술이야기
다양한이야기
기술이야기
검색
기술이야기
서버 모니터링 툴을 통한 조치가이드 및 이력 관리 하기
기술이야기
서버 모니터링 툴을 통한 조치가이드 및 이력 관리 하기
시스템을 운영하다 보면 담당자가 변경되거나 휴가 중일 때 장애가 발생하여 곤란을 겪는 경우가 종종 있습니다. 숙련된 엔지니어의 노하우가 시스템에 남아있지 않고 개인의 기억에만 의존해 있다면, 단순한 장애도 큰 서비스 중단으로 이어질 수 있습니다. 서버 모니터링 툴 Zenius SMS의 조치권고사항 및 조치내역 관리 기능은 이러한 문제를 해결하기 위한 핵심 기능입니다. 장애 발생 시 초급 엔지니어도 즉시 참고할 수 있는 표준 가이드라인을 제공하고, 장애 처리 후에는 조치 내역과 결과 보고서를 시스템에 등록하여 조직의 소중한 자산으로 남길 수 있습니다. Zenius SMS를 활용해 장애 대응 체계를 표준화하고 노하우를 자산화하는 방법을 단계별로 자세히 알아보겠습니다. Zenius SMS 기능 구성 및 확인 절차 장애 대응 체계를 구축하는 과정은 크게 사전 가이드라인(조치권고사항) 등록과 실제 상황 발생 시 가이드 확인으로 나뉩니다. Step 1. [운영관리 > 유지보수정보 > 조치권고사항 관리] : 감시항목 선택 및 가이드 등록 먼저 장애 유형별 표준 대응 매뉴얼을 만드는 단계입니다. 운영관리 메뉴의 조치권고사항 관리 화면으로 이동하면 등록된 리스트를 확인할 수 있습니다. 여기서 새로운 가이드를 만들기 위해 등록 화면으로 진입합니다. 등록 화면에서 가이드를 적용할 감시 항목(예: CPU Used(%))을 검색하여 선택합니다. 특정 서버나 그룹에만 적용할 수도 있지만, 보통은 전체 서버에 공통적으로 적용되는 표준 가이드를 만듭니다. 선택한 항목에 대해 구체적인 조치 방법을 작성합니다. Zenius SMS는 가이드를 두 가지 유형으로 나누어 관리할 수 있습니다. 첫 번째는 스냅샷 확인이나 프로세스 정렬처럼 모니터링 툴 내에서 수행할 수 있는 Zenius 활용 조치방법입니다. 두 번째는 터미널 접속 후 top 명령어를 확인하거나 특정 서비스를 재기동하는 것과 같은 시스템 일반 조치방법입니다. 이렇게 유형을 나누어 등록하면 운영자가 상황에 맞춰 체계적으로 대응할 수 있습니다. 작성이 완료되면 등록 버튼을 눌러 저장합니다. 등록된 조치권고사항은 리스트에 추가되며, 이후 해당 이벤트가 발생할 때마다 운영자에게 가이드라인으로 제공됩니다. 관리자는 언제든 이 리스트에서 항목을 확인하고 수정할 수 있습니다. Step 2. [SMS > 이벤트 > 상세검색] : 이벤트 발생 확인 실제 운영 환경에서 서버에 부하가 발생했다고 가정해 보겠습니다. 통합 대시보드나 이벤트 현황판에 CPU Used와 같은 이벤트가 붉은색 경고등과 함께 실시간으로 표시됩니다. 운영자는 발생한 알람 리스트를 확인하고, 상세 분석이 필요한 대상을 클릭하여 이벤트 상세 화면으로 진입합니다. Step 3. [SMS > 이벤트 > 상세확인 > 조치방법] : 등록된 가이드라인 조회 이벤트 상세 화면이 열리면 기본 정보 탭 옆에 있는 조치방법 탭을 클릭합니다. 이곳에서 앞서 Step 1에서 등록해 둔 조치권고사항이 표시됩니다. "스냅샷의 CPU 사용률을 확인하세요", "터미널에서 top 명령어를 입력하세요"와 같은 구체적인 지시 사항이 나오므로, 운영자는 당황하지 않고 매뉴얼대로 원인 분석을 시작할 수 있습니다. Zenius SMS 활용 가이드 장애 대응이 끝났다면, 그 과정을 기록하여 우리 조직만의 자산으로 만들어야 합니다. 조치 내역을 등록하고 공유하는 과정을 살펴보겠습니다. Case 1. 조치내역 등록 및 지식 자산화 1) [SMS > 이벤트 > 상세확인 > 조치내역] : 조치 내용 및 보고서 등록 장애 처리가 완료된 후, 운영자는 조치방법 탭 옆에 있는 조치내역 탭으로 이동합니다. 이곳에는 아직 등록된 이력이 없는 상태입니다. 우측 하단의 등록 버튼을 클릭합니다. 등록 팝업창에서 장애 원인이 소프트웨어인지 하드웨어인지 분류하고, 구체적으로 어떤 조치를 취했는지 텍스트로 입력합니다. 단순 텍스트뿐만 아니라, 작업 절차서나 장애 결과 보고서 파일이 있다면 첨부파일로 함께 업로드합니다. 이를 통해 단순한 기록을 넘어 완벽한 장애 이력 관리가 가능해집니다. 2) 과거 이력 조회 및 참조 등록이 완료되면 조치 내역 리스트에 저장되어 언제든 다시 찾아볼 수 있습니다. 추후 동일한 서버에서 같은 장애가 발생했을 때, 과거에 누가 어떻게 해결했는지 즉시 확인함으로써 해결 시간을 획기적으로 단축할 수 있습니다. Case 2. [EMS > 이벤트 > 상세확인 > 조치내역] : 통합 조치 현황 관리 개별 서버뿐만 아니라 전체 IT 인프라 관점에서도 조치 현황을 관리할 수 있습니다. EMS 화면에서는 현재 발생한 이벤트들의 조치 상태(대기, 진행 중, 완료)를 한눈에 파악하고, 일괄적으로 상태를 변경하거나 이력을 관리할 수 있어 관리자의 업무 효율성을 높여줍니다. Zenius SMS를 활용해 장애 대응 체계를 표준화하고 노하우를 자산화하는 방법을 단계별로 자세히 알아보겠습니다. 지금까지 Zenius SMS의 조치권고사항과 조치내역 관리 기능을 살펴보았습니다. 이처럼 Zenius SMS는 단순한 모니터링을 넘어, 장애 발생 시 누구든 표준화된 절차대로 대응할 수 있게 돕고, 소중한 운영 경험을 시스템에 축적하여 조직 전체의 기술력을 상향 평준화하는 똑똑한 운영 관리 도구입니다.
2026.02.11
1