반복영역 건너뛰기
주메뉴 바로가기
본문 바로가기
제품/서비스
EMS Solution
Features
클라우드 관리
서버관리
데이터베이스 관리
네트워크 관리
트래픽 관리
설비 IoT 관리
무선 AP 관리
교환기 관리
운영자동화
실시간 관리
백업 관리
스토리지 관리
예방 점검
APM Solution
애플리케이션 관리
URL 관리
브라우저 관리
ITSM Solution
서비스데스크
IT 서비스 관리
Big Data Solution
SIEM
AI 인공지능
Dashboard
대시보드
Consulting Service
컨설팅 서비스
고객
레퍼런스
고객FAQ
문의하기
가격
자료실
카탈로그
사용자매뉴얼
회사소개
비전·미션
연혁
2016~현재
2000~2015
인증서·수상
투자정보
재무정보
전자공고
IR자료
새소식
공고
보도자료
오시는 길
채용
피플
컬처
공고
FAQ
블로그
열기
메인 페이지로 이동
블로그
기술이야기
블로그
최신이야기
사람이야기
회사이야기
기술이야기
다양한이야기
쿠버네티스와 Helm 등 CNCF의 주요 프로젝트
[행사] 브레인즈컴퍼니 신년회, 2023년을 돌아보고 2024년을 내다보다
이화정
2024.01.05
페이스북 공유하기
트위터 공유하기
링크드인 공유하기
블로그 공유하기
테라폼(Terraform)의 모든 것, 그리고 AWS EC2 생성하기
브레인저들의 새해를 여는
2024년 신년회
가 지난 4일(목) 본사 8층 라운지에서 열렸습니다.
오랜만에 브레인저 모두가 모인 자리에서 2023년을 돌아보고, 2024년을 함께 내다보는 시간을 가졌습니다. 그리고 장기근속자, 우수팀, 승진을 발표하고 축하하는 시간과 고기파티까지 열렸는데요! 신년회의 생생한 현장을 지금부터 살펴보겠습니다.
。。。。。。。。。。。。
[16:00]
2023년을 돌아보고 2024년을 내다보다
브레인즈컴퍼니의 각 분야를 담당하고 있는 본부장님들의 발표로 본격적인 신년회가 시작되었습니다.
첫 번째 순서는 전략사업본부의 은숙님이 맡아주셨습니다. 은숙님은 9부터 시작해서 1까지 각 숫자와 연관되어 있는 내용으로 2023년 회고와 2024년 계획을 말씀해 주셨습니다. 브레인즈컴퍼니의 영업
·
마케팅
·
고객관리를 총괄하고 계신만큼, 많은 고민과 진심이 담긴 발표였습니다!
은숙님은 발표를 통해
“2023년 어려운 시장 환경 가운데서도 모두 노력해서 많은 고객을 만나고 소프트웨이브같은 큰 행사도 성공적으로 치렀던 것 처럼, 2024년에도 모든 브레인저가 힘을 합치면 목표보다 더 높은 곳에 오를 수 있을 것”
이라고 강조해 주셨습니다.
다음으로 브레인즈컴퍼니의 중심! 개발그룹을 대표해서 자환님이 발표를 진행해 주셨습니다. 자환님은
“2023년에 빠르게 변화하고 있는 IT 환경과 고객 니즈에 맞춘 서비스를 지속적으로 개발하고 배포했다. 2024년에도 기존 출시된 쿠버네티스(Kubernetes) 모니터링 제품의 기능 고도화를 포함하여, 완성도 높은 기능과 서비스들을 선보일 계획”
이라고 밝혀주셨습니다.
마지막으로 경영지원팀 현보님은
“지난해 만족도가 높았던 해외연수(만족도 4.43/5)와 패밀리데이(만족도 4.56/5)를 포함하여, 2024년에는 더 다양한 행사와 교육 등을 통해 건강한 사내 문화를 만들겠다. 또한 브레인저들의 능력을 높일 수 있도록 지속적으로 노력하겠다”
라고 포부를 밝혀주셨습니다.
이렇게 각 본부별 2023년 회고와 2024년 비전을 알아볼 수 있었는데요. 본부장님들이 발표 중간중간 감사하고 수고했던 브레인저분들께, 진심 어린 감사의 마음을 전하며 마음이 따뜻해 지기도 했습니다.
[16:45]
재걸님의 총평 “2024년 우리가 꼭 기억해야 할 것은”
다음 순서로 브레인즈컴퍼니의 운영을 총괄하시는 재걸님(부사장)께서 2023년 한 해를 되돌아보는 총평과, 2024년 계획에 대해 발표하는 시간을 가졌습니다.
우선 2023년에 어려운 경제환경 속에서도 제니우스(Zenius)의 고객이 꾸준히 증가한 것과 큰 행사를 잘 마무리한 것, 그리고 쉬지 않고 새로운 서비스 개발에 힘쓴 것에 대해 격려해 주셨습니다.
2024년에는 브레인즈컴퍼니가 더 높이 도약할 수 있도록 Zenius의 경쟁력을 높이고, 자회사인 에이프리카와의 협업을 강화할 것을 강조하셨습니다.
[17:20]
깜짝 ‘나락’퀴즈쇼!
잠시 분위기를 바꿔 브레인즈 나락 퀴즈쇼도 진행됐습니다. 퀴즈를 맞추거나, 틀려도 나락(?)에 갈 수 있는 위험하고 재밌는 시간이었는데요. 한 분을 제외하곤 모두 정답을 맞춰주셨습니다
(자세한 내용 해당 브레인저들의 더 이상의 추락을 막기 위해 비공개로..)
. 이 퀴즈쇼를 통해 모든 브레인저가 함께 웃을 수 있었던 시간이었습니다.
[17:40]
각종 포상 수상식
다음으로는 각종 포상 및 승진자를 발표하고 축하하는 시간이 이어졌습니다. 먼저 장기근속자(5/10/15)들에 대한 포상이 진행되었는데요. 여기서 깨알 복지!
*브레인즈컴퍼니는 5년 근속자는 현금 100만 원 지급, 10년 근속자는 현금 300만 원과 휴가 3일 지급, 15년 근속자는 500만 원과 휴가 5일을 지급합니다.
다음으로는 2023 최우수 부서(디자인팀), 협력지원 포상에 이어 승진자 발표가 이어졌습니다. 모두 진심으로 축하드립니다?
[18:00]
신년회의 ‘꽃’ 회식
신년회에는 맛있는 음식이 빠질 수 없죠! 팀원들 간의 행복한 저녁 시간을 보내기 위해 근처 고깃집으로 향했는데요. 큰 규모의 식당을 단독으로 대관해 편하게 즐길 수 있었습니다.
팀원분들끼리 그간 못 했던 말들도 하고, 포상과 승진을 한 브레인저에게 서로 축하 인사를 하며, 회포를 푸는 시간을 가졌습니다.
이번 신년회를 통해 2023년 한 해를 되돌아보고, 2024년을 희망차고 행복하게 시작할 수 있었습니다. 무엇보다 브레인저분들이 함께 있어 더 뜻깊었던 시간이었습니다!
이렇게 브레인즈컴퍼니의 2024년은 힘차게 시작되었습니다.
#신년회
#사내문화
#사내복지
#행사
이화정
프리세일즈팀
프리세일즈팀에서 마케팅, 내외부 홍보, 콘텐츠 제작을 담당하고 있어요.
필진 글 더보기
목록으로
추천 콘텐츠
이전 슬라이드 보기
쿠버네티스(K8s) 모니터링에서 가장 중요한 두 가지?!
쿠버네티스(K8s) 모니터링에서 가장 중요한 두 가지?!
2022년 CNCF의 연간 조사에 따르면 전 세계 기업의 96%가 쿠버네티스를 활용 중이거나 활용을 고려 중인 것으로 나타났습니다. 또한 가트너는 쿠버네티스(Kubernetes, K8s) 시장의 규모가 올해 1조 2천억 원대를 돌파할 것으로 내다봤습니다. 이처럼 쿠버네티스가 '대세'로 자리 잡고 있는 가운데, 쿠버네티스 활용에 대한 어려움을 겪는 기업도 많아지고 있습니다. 클러스터 내의 리소스 할당/운영과 쿠버네티스 콘솔(대시보드)의 구성이 가장 큰 어려움으로 꼽히는데요, 이러한 어려움을 극복하기 위한 첫 번째 조건은 바로 올바른 '쿠버네티스 모니터링'입니다. 효과적이고 올바른 쿠버네티스 모니터링을 위해선 두 가지를 '꼭' 기억해야 하는데요, 지금부터 그 두 가지를 자세히 알아보겠습니다. ㅣ올바른 쿠버네티스 모니터링을 위한 두 가지 조건 첫 번째, 쿠버네티스의 주요 항목을 한눈에 볼 수 있어야 합니다 쿠버네티스 환경은 규모가 크고 동적이며 복잡한 구조를 가지고 있습니다. 그렇기 때문에 리소스 사용률, 에러 로그 등의 중요 정보를 실시간으로 파악할 수 있어야 합니다. 따라서 쿠버네티스 모니터링을 효과적으로 수행하기 위해 첫 번째로 기억해야 할 것은 '쿠버네티스 환경을 한 화면에서 종합적으로 볼 수 있어야 한다는 점'입니다. 우선 종합적인 모니터링을 통해 리소스 사용률, 트래픽 패턴 등의 중요 정보를 실시간으로 파악할 수 있어 문제 발생 시 빠르게 원인을 진단하고 해결할 수 있습니다. 또한 쿠버네티스 운영의 핵심은 효율적인 리소스 관리인데, 종합적인 모니터링을 통해 리소스 낭비를 줄이고 애플리케이션의 성능을 최적화할 수 있습니다. 이와 더불어 시스템의 이상 유무를 지속적으로 모니터링함으로써, 예기치 않은 다운타임 등의 오류를 방지할 수도 있죠. 따라서 쿠버네티스 모니터링 솔루션에는 각 구성요소들 간의 관계와 영향도를 '한 눈'에 파악할 수 있는 모니터링 View가 반드시 필요합니다. 더불어 쿠버네티스 환경을 관리하는 운영자나 조직마다 중요하게 생각하는 데이터 지표가 다릅니다. 때문에 운영자가 자신의 필요에 따라 모니터링 화면을 자유롭게 구성할 수 있다면, 더욱 효과적으로 시스템을 관리할 수 있습니다. [그림1] (왼) 클러스터 상세 모니터링 View, (중) 클러스터 메인 모니터링 View, (오) 주요 Service 모니터링 View 더 자세한 설명을 위해 제니우스(Zenius)의 쿠버네티스 모니터링 솔루션인 Zenius-K8s을 예로 살펴보겠습니다. 우선 [그림1]에 나와있는 것처럼 쿠버네티스 모니터링 솔루션은 여러 클러스터 현황을 한눈에 확인할 수 있는 요약 뷰를 제공해야 합니다. 이를 통해 클러스터의 상세한 현황과 노드, 파드, 컨테이너, 서비스 등을 통합적으로 모니터링할 수 있기 때문이죠. 이러한 기능은 운영자로 하여금 시스템 전반에 대한 신속한 이해를 가능하게 하고, 업무 효율성을 크게 높여줍니다. [그림2] (왼) Zenius-K8s 운영현황 오버뷰 (오) 사용자가 직접 정보를 구성할 수 있는 컴포넌트 수정창 여기에 더해서 Zenius-K8s처럼 쿠버네티스 주요 데이터 지표를 '사용자 관제 목적'에 따라 자유롭게 구성이 가능하고 가시성 높은 다양한 차트와 컴포넌트를 포함한 오버뷰를 제공한다면, 더욱더 성공적인 쿠버네티스 활용이 가능해집니다. 두 번째, 클러스터 별로 상세한 성능을 확인할 수 있어야 합니다 효과적이고 올바른 쿠버네티스 모니터링을 위한 두 번째 조건은, '클러스터 별로 상세한 성능을 확인할 수 있어야 한다는 것'입니다. 특히 쿠버네티스 환경을 관리하고 최적화함에 있어서 핵심적인 역할을 하는 클러스터 현황(노드, 파드, 컨테이너), 성능 지표(CPU 사용량, Memory 사용량), 이벤트 현황을 연관 지어 직관적으로 모니터링할 수 있어야 합니다. 이를 통해서 운영자는 클러스터의 전반적인 상태를 실시간으로 모니터링하고, 발생 가능한 문제를 조기에 식별하여 시스템의 안정성과 성능을 지속적으로 높일 수 있기 때문이죠. 또한 클러스터의 각 구성 요소가 서로 다른 역할을 수행하기 때문에 각 노드, 파드, 컨테이너별로 상세히 모니터링하는 것도 매우 중요합니다. [그림3] 클러스터 별 상세정보 요약 뷰 지금 살펴본 내용을 Zenius-K8s 예시 화면을 통해 다시 한번 되짚어 보겠습니다. 먼저 위 [그림3]에서 보이는 것처럼 주요 클러스터 현황(노드, 파드, 컨테이너 등), 주요 성능 지표(CPU, Memory 사용률 등), 이벤트 현황 등을 한 화면에서 확인할 수 있는 요약 뷰가 있어야 합니다. [그림4] Zenius-K8s 토폴로지 맵 특히, Zenius-K8s의 경우 수집한 데이터를 기반으로 자동으로 각 구성요소 간의 연관관계와 서비스 상태를 토폴로지 맵(Topolgy Map) 형태로 구성할 수 있습니다. 또한 다양한 조회 기준(노드, 네임스페이스, 서버)과 상세 정보 조회 기능을 제공하고 있죠. 쿠버네티스 모니터링 솔루션에는, 직관적이고 효율적인 모니터링을 위해 반드시 위와 같은 기능이 포함되어 있어야 합니다. [그림5] 노드(Node) 별 상세 모니터링 [그림6] 파드(Pod) 별 상세 모니터링 [그림7] 컨테이너(Container) 별 상세 모니터링 마지막으로 위의 Zenius-K8s의 예시 화면들처럼, 클러스터 내 각각의 구성요소에 대한 상세한 모니터링이 필요합니다. 이를 통해 산재된 데이터에 대한 효율적인 관리가 가능하기 때문이죠. 。。。。。。。。。。。。 지금까지 성공적인 쿠버네티스 모니터링을 위한 두 가지 조건을 살펴봤습니다. 쿠버네티스의 활용도와 중요성이 더 커지는 가운데, 운영의 안정성과 효율성을 높여주는 쿠버네티스 모니터링 솔루션 도입은 이제 선택이 아닌 필수가 되었습니다. 쿠버네티스 현황을 한눈에 볼 수 있고, 세부 요소를 세밀하게 들여다볼 수 있는 모니터링 솔루션을 통해서 성공적으로 쿠버네티스를 활용하시기 바랍니다.
2024.04.05
2023년 상반기 협력업체 상생 세미나 성료…”신규 기능 소개, 상생 지속 도모”
2023년 상반기 협력업체 상생 세미나 성료…”신규 기능 소개, 상생 지속 도모”
지난 21일 본사 8층 대회의실에서 ‘2023년 상반기 협력업체 상생 세미나’를 진행했습니다. 브레인즈컴퍼니는 급변하는 IT인프라 시장 환경에 적극 대응하고 협력사와의 협력을 더욱 강화하기 위해 협력업체 상생 세미나를 운영하고 있습니다. 올해부터 세미나를 상, 하반기 2회 실시하기로 하였는데요, 기존에 EMS를 설치 및 활용하는 교육 중심에서 제니우스의 새로운 기능을 소개하는 중심으로 세미나에 변화를 주었습니다. 이날 행사는 먼저 프리세일즈팀에서 회사 소개를 하였고, 이어서 Technical Consulting 팀 정채린 차장이 제니우스 8.0의 신규 기능을 소개하였는데요, 20개 이상의 신규 기능에는 WNMS, ERMS, 웹토폴로지 등이 포함되어 있습니다. 그리고 막간을 이용해 통합로그관리, Zenius LogManager을 소개하는 시간도 가졌습니다. WNMS는 분산된 AP 장비의 상태를 한 곳에서 통합 모니터링할 수 있을 뿐만 아니라, AP 장비의 Up/Down 링크, WAN Traffic 등을 실시간으로 모니터링하고, AP 장비의 부하를 효율적으로 컨트롤하도록 접속자 수, 사용자 수, 최대 동시접속자 수 등의 근거데이터를 모니터링하고 자료로 확보할 수 있습니다. ERMS(Event Relation Management System)은 문제 원인 추적을 위한 이벤트의 연관성을 분석하는 기능입니다. 기존 서비스맵의 기능에 AND/OR, 이상 등의 다양한 연산조건 및 통보기능을 추가하여 개별적 이벤트가 아닌 복합적인 이상 상황을 감지할 수 있습니다. 웹토폴로지는 기존에는 CS 형식으로 제공되었던 토폴로지맵의 활용도를 높이기 위해 Web기반으로 구현하여 오버뷰와 함께 활용할 수 있도록 구현하였습니다. 마지막은 클라우드 모니터링을 소개하고 시현을 통해 클라우드 가상화 자원을 모니터링하여 가상 자원의 적절한 운영 효율성을 향상시킬 수 있는지 선 보였습니다. 이번 세미나에는 영진인포텍, 한신정보, 시원 등 협력업체 관계자뿐만 아니라 디와이, 더존비즈온 같은 고객사에서도 참여했습니다. 참여한 협력업체는 이런 형식의 세미나가 자주 있었으면 좋겠다, 그리고 정기적인 온라인 교육을 희망한다는 의견을 주셨습니다. 반면 참여한 고객사는 제니우스 8.0으로 업그레이드를 결정하는 데 많은 도움이 되었다고 합니다. 세미나를 주관한 소감은 “제품 중심으로 소개하는 세미나는 처음인데 예상보다 질문이 많았고 관심이 뜨거운 것을 보고 앞으로 제품을 소개하는 기회를 자주 가지면 좋겠다”입니다. 참여해 주신 모든 분께 감사 인사 전합니다.
2023.06.23
시스템 장애, Zenius EMS 솔루션으로 정확하고 효과적으로 관리하는 법
시스템 장애, Zenius EMS 솔루션으로 정확하고 효과적으로 관리하는 법
IT 시스템은 서버, 네트워크, 애플리케이션이 밀접하게 상호작용하는 다계층 구조로 운영됩니다. 이런 환경에서 발생하는 장애는 더 이상 단일 장비의 문제가 아니라, 여러 구성 요소가 연쇄적으로 영향을 주고받으며 서비스 품질에 직결됩니다. 예를 들어 한 서버의 경고는 단순한 일시적 리소스 부하에 불과할 수 있지만, 동시에 다른 계층에서 오류가 발생하면 곧바로 서비스 중단으로 이어질 수 있습니다. 반대로 특정 장비에서 치명적인 이벤트가 발생하더라도, 전체 서비스 아키텍처 차원에서는 영향도가 제한적인 경우도 흔히 발생합니다. 하지만 실제 운영 현장에서는 이런 복잡한 상황이 그대로 고려되지 못하는 경우가 많습니다. 많은 관제 환경이 여전히 장비 단위의 심각도에만 의존하기 때문에, 실제 서비스 영향과 상관없이 불필요한 알람이 쏟아지거나 반대로 중요한 장애 신호를 놓치는 일이 반복되곤 합니다. 그 결과 운영자는 수많은 이벤트 속에서 우선순위를 정하기 어렵고, 대응 속도 역시 느려질 수밖에 없습니다. Zenius EMS 솔루션의 핵심 모듈인 ERMS(Event Relation Management System)는 이러한 한계를 보완합니다. 개별 이벤트를 단순히 나열하는 대신, 규칙(Rule)으로 연계해 서비스 단위의 장애 여부를 판단하고 운영자가 즉시 상황을 이해할 수 있도록 도와줍니다. 덕분에 단순히 “어느 장비에서 문제가 발생했는가”를 넘어, “서비스 전체가 지금 어떤 상태인가”라는 더 중요한 질문에 답할 수 있습니다. 이번 글에서는 구체적인 구성 방법, 그리고 실제 운영 환경에서의 활용 사례를 통해, IT 시스템 장애를 어떻게 더 정확하고 효과적으로 관리할 수 있는지 살펴보겠습니다. Zenius EMS 솔루션의 ERMS 기능은?! 먼저 장비 관점에서의 이벤트 모니터링과 ERMS가 이벤트를 처리하는 방식이 어떻게 다른지 살펴보겠습니다. - 장비 관점에서의 이벤트 모니터링 CPU 사용률 경고, 프로세스 다운, 네트워크 지연 등 각 장비에서 발생하는 이벤트를 개별적으로 수집하고 표시하는 방식입니다. 특정 장비의 상태를 빠르게 확인할 수 있다는 장점이 있지만, 서비스 전체의 영향도를 파악하기에는 한계가 있습니다. - ERMS 이벤트 발생 로직 : 장비에서 발생한 이벤트들에 대한 Rule 설정으로 , 서비스 관점에서의 장애 모니터링 ERMS는 장비에서 발생한 여러 이벤트를 단순 나열하지 않고, 규칙(Rule)으로 연계해 종합적으로 해석하는 방식입니다. 여러 이벤트의 조합을 통해 서비스 단위의 장애 여부를 표현하기 때문에, 운영자는 불필요한 알람에 휘둘리지 않고 실제로 중요한 신호에 집중할 수 있습니다. Zenius EMS 솔루션의 ERMS 기능구성 및 확인절차 ERMS를 제대로 활용하기 위해서는 먼저 서비스 등록과 모니터링 확인 절차를 거쳐야 합니다 Step 1. [ ERMS > 설정 > 등록 ] : 신규 서비스를 등록 합니다. ① 서비스명 : 모니터링 페이지에 보여질 서비스명 입력 ② 연산 조건 : 연산 조건을 선택/입력하여 이벤트를 발생 시킬 조건 설정 - OR : 하위 서비스 또는 대상들의 상태가 하나라도 발생하면 설정한 심각도로 상태 표현 - AND : 하위 서비스 또는 대상들의 상태가 전부 발생하면 설정한 심각도록 상태 표현 - 사용자정의 : 하위 서비스 또는 대상들의 상태가 설정한 수 이상일 경우 설정한 심각도로 상태 표현 - 심각도별 개수 : 하위 서비스 또는 대상들의 심각도별 개수가 설정한 값 이상일 경우 상태 표현 ③ 심각도 : 연산 조건에 따른 이벤트 발생 시 보여지는 심각도 설정 - 인프라/감시설정의 심각도와 별개로 발생시킬 심각도 지정> 하위대상 - 선택한 서비스 대상 중 가장 높은 심각도 등급으로 상태 표시 ④ 서비스 대상 : 연산 조건에 따라 이벤트를 발생 시킬 대상 선택 - 서비스 : ERMS에 등록 된 서비스 선택 - 장비/대상 : 다른 인프라에 등록 된 장비 선택 - 감시설정 : 다른 인프라에 등록 된 감시설정 선택(서비스 대상 설정은 곧 ‘서비스 장애를 어떻게 정의할 것인가’와 직결되므로, 인프라 구조와 서비스 흐름을 고려해 신중히 지정해야 합니다.) ⑤ 이벤트 제목 : 연산 조건에 만족하여 이벤트 발생 시 보여지는 명칭 ⑥ 통보설정 : 이벤트 발생 시 설정된 통보방법 및 수신자에게 통보 되도록 설정 * SMS, 이메일, 메신저 등 다양한 채널과 연동할 수 있으며, 사전에 통보 방법이 반드시 정의되어 있어야 합니다. 운영자, 서비스 담당자, 온콜 팀 등 그룹 단위 지정이 가능해, 장애 대응 체계와 긴밀하게 연결됩니다. Step 2. [ ERMS > 모니터링 ] : 등록 확인 앞서 등록한 서비스와 Rule이 정상적으로 반영되었는지 모니터링 화면에서 확인합니다. 트리 구조로 전체 → 그룹 → 서비스 → Rule → 장비 단위까지 계층적으로 점검할 수 있어, 설정 누락이나 오작동 여부를 쉽게 파악할 수 있습니다. Zenius EMS 솔루션의 ERMS 활용 가이드 ERMS를 실제 환경에서 적용할 수 있는 대표적인 사례를 살펴보겠습니다. Case 1. 연관 서비스 간 이벤트 관리 ERMS를 활용하면 서로 다른 인프라에서 발생한 이벤트를 하나의 논리적 서비스 단위로 묶어 관리할 수 있습니다. 이를 통해 단일 장비 경보가 아니라, 실제 서비스 차원의 장애 인지가 가능해집니다. [Web 서비스와 연관 된 감시설정을 등록한 사례] 웹 서비스와 관련된 CPU 사용률, 프로세스 상태, 네트워크 연결 상태 등 여러 감시설정을 하나의 서비스로 등록합니다. 등록된 서비스는 “N개 이상 이벤트 발생 시”라는 조건으로 Rule을 구성합니다. 조건이 충족되면 서비스 메인 담당자(예: 홍길동)에게 SMS, E-mail 등으로 자동 통보가 이뤄집니다. 이를 통해 운영자는 단순히 경보를 나열하는 대신, 서비스 전체의 관점에서 중요한 신호만 걸러내어 신속히 대응할 수 있습니다. Case 2. 이중화 구성 관리 이중화 서버나 네트워크 장비 환경에서는 한쪽 노드가 장애를 겪더라도 서비스는 계속 유지될 수 있습니다. 하지만 양쪽 노드가 동시에 장애를 겪는 순간 서비스는 치명적인 상황에 빠지게 됩니다. ERMS는 이러한 특성을 Rule로 정의해 긴급 상황을 빠르게 알릴 수 있습니다. [이중화 구성에 대한 관리 사례] (1)신규 서비스 등록 시 이중화 구성 된 서버의 “서버다운” 감시설정 선택 (2)연산 조건, 심각도, 이벤트 제목 등을 설정하여 해당 조건에 대한 이벤트 발생 시 표현 될 정보 설정 - 연산 조건 : 이중화 구성에 대한 Rule 설정임으로 연산 조건은 “AND”로 설정 - 심각도 : 연산 조건 만족 시 발생할 이벤트 등급 - 이벤트 제목 : 해당 이벤트 발생 시 보여지는 명칭 (상황 심각성을 인지 할 수 있는 문구로 작성) (3)수신자/통보방법 설정을 통해 이벤트 발생 시 해당 서버에서 운영중인 서비스와 연관 된 담당자들에게 긴급 상황에 대한 인지가 가능하도록 합니다. 이를 통해 단일 장애에 과잉 반응하지 않으면서도, 실제 서비스 전체에 영향을 주는 상황은 놓치지 않고 빠르게 인지할 수 있습니다 Case 3. 서비스맵을 통한 시각화 모니터링 ERMS는 등록된 서비스를 시각화해 한눈에 파악할 수 있는 서비스맵 기능을 제공합니다. Sunburst, Bubble 형태의 차트를 활용하면 전체 서비스 구조와 이벤트 상태를 직관적으로 확인할 수 있습니다. [오버뷰 기능을 통한 시각화 사례] EMS > 설정 > 컴포넌트에서 “ERMS 서비스맵” 컴포넌트를 등록합니다. 이름, 제목, 서비스, 차트 종류(Sunburst/Bubble), 표시 단계 수 등을 설정합니다. 이후 등록된 컴포넌트를 오버뷰 화면에 추가합니다. ERMS 서비스 단위의 이벤트 현황이 시각적으로 표시됩니다. 다른 컴포넌트(성능 지표, 이벤트 이력 등)와 조합하면, 장애 상황과 성능 상태를 통합적으로 모니터링할 수 있습니다. 색상 변화, 계층 구조, 아이콘 조합 등을 통해 복잡한 운영 상황을 직관적으로 해석할 수 있습니다. 이를 통해 운영자는 이벤트 목록이 아닌 서비스 단위의 전체 그림을 기반으로 문제를 인지하고 대응 우선순위를 판단할 수 있습니다. [Sunburst, Bubble 차트종류] (1)오버뷰 구성 시 앞에서 생성한 컴포넌트를 추가하여 ERMS 서비스 단위 기준 이벤트와 다양한 컴포넌트와의 조합을 통해 전체적인 운영상황을 시각화하여 가시적인 모니터링이 가능 합니다. [ERMS 서비스 상태 오버뷰 시각화 구성] Zenius EMS 솔루션의 ERMS 구체적 활용 효과 기존 이벤트 관리 환경에서는 장애 여부를 개별 장비의 심각도만으로 판단했습니다. 이 때문에 중요도가 낮은 장비에서 발생한 이벤트라도 ‘치명’으로 기록되면, 실제 서비스 영향과 무관하게 서비스 전체가 그대로 ‘치명’ 장애로 표시되곤 했습니다. 반대로 여러 장비에서 동시에 문제가 발생해 서비스에 큰 부담을 주는 상황임에도, 단일 이벤트 기준만으로는 이를 제대로 드러내기 어려웠습니다. 결국 서비스 차원에서 실질적인 장애 여부를 구분하기 힘들었고, 운영자는 불필요한 경보와 오판 속에서 효율적인 대응이 어려웠습니다 ERMS를 도입하면 이런 한계를 극복할 수 있습니다. 이벤트 간의 연관 관계를 규칙(Rule)으로 정의하여 단순한 장비 경보가 아니라 서비스 단위의 장애를 판정할 수 있기 때문입니다. 예를 들어, A 장비에서 ‘치명’ 이벤트가 발생하고 동시에 B 장비에서 ‘주의’ 이벤트가 발생한다면, 이를 묶어서 서비스 전체를 ‘긴급’ 상태로 표현할 수 있습니다. 이처럼 서비스 관점에서 장애를 재정의하면 실제 영향이 큰 상황만 선별적으로 드러나고, 불필요한 알람은 크게 줄어듭니다. 운영자는 개별 이벤트에 매달릴 필요 없이 서비스 전체 상태를 기준으로 명확하게 판단할 수 있으며, 그 결과 대응의 정확성과 속도가 모두 향상됩니다. 서비스 품질 관리 또한 한층 안정적으로 이루어집니다. IT 시스템 장애는 이제 단순히 개별 장비 이벤트만으로는 정확히 판단하기 어렵습니다. Zenius EMS 솔루션의 ERMS 모듈은 이벤트를 서비스 단위의 규칙으로 묶어 해석함으로써, 불필요한 알람을 줄이고 실제로 중요한 장애만 명확히 드러냅니다. 서비스 등록과 Rule 설정, 시각화 기능을 통해 운영자는 장애 발생 시점을 더 빠르게 파악하고 우선순위를 명확히 정할 수 있으며, 결과적으로 서비스 안정성과 운영 효율성을 동시에 확보할 수 있습니다. 즉, ERMS는 IT 시스템을 장비 중심의 모니터링에서 서비스 중심의 관리로 전환하게 만드는 핵심 도구라 할 수 있습니다.
2025.09.09
다음 슬라이드 보기