반복영역 건너뛰기
주메뉴 바로가기
본문 바로가기
제품/서비스
EMS Solution
Features
클라우드 관리
AI 인공지능
서버관리
데이터베이스 관리
네트워크 관리
트래픽 관리
설비 IoT 관리
무선 AP 관리
교환기 관리
운영자동화
실시간 관리
백업 관리
APM Solution
애플리케이션 관리
URL 관리
ITSM Solution
서비스데스크
IT 서비스 관리
Big Data Solution
SIEM
Dashboard
대시보드
Consulting Service
컨설팅 서비스
고객
레퍼런스
고객FAQ
문의하기
가격
자료실
카탈로그
사용자매뉴얼
회사소개
비전·미션
연혁
2016~현재
2000~2015
인증서·수상
투자정보
재무정보
전자공고
IR자료
새소식
공고
보도자료
오시는 길
채용
피플
컬처
공고
FAQ
블로그
열기
메인 페이지로 이동
블로그
최신이야기
블로그
최신이야기
사람이야기
회사이야기
기술이야기
다양한이야기
최신이야기
검색
회사이야기
브레인즈컴퍼니의 사내 뉴스레터, 브레인즈뉴스를 소개합니다!
회사이야기
브레인즈컴퍼니의 사내 뉴스레터, 브레인즈뉴스를 소개합니다!
브레인즈컴퍼니의 사내 뉴스레터 '브레인즈뉴스' 50호가 발행되었습니다! 2012년 4월부터 분기마다 꾸준히 발행한 브레인즈뉴스(BrainzNews)는, 사내의 최신 주요 소식을 알릴 뿐만 아니라 브레인즈컴퍼니 구성원들 서로 알아가고 소통하자는 취지로 만들어졌는데요. 이번에 발행된 50호를 통해 어떤 이야기가 담겨있는지 살-짝 소개해 드리겠습니다. │ 브레인즈뉴스 좀 더 자세히 보기 우선 이번 브레인즈뉴스의 가장 메인 콘텐츠부터 살펴보겠습니다. BRAINZ LENS 이번 호에는 브레인저가 어떻게 일하는지 구체적으로 들여다볼 수 있는 '브레인즈렌즈'라는 새로운 코너를 준비했어요. 이번에 첫 번째 주인공은 전략사업본부에 프리세일즈팀이었는데요. 프리세일즈 구성원분들은 어떻게 일하고 있는지, 한 고객사의 최초 인입부터 설치까지의 과정을 생생히 소개했습니다. RELAY 숏터뷰 브레인즈뉴스는 매호 릴레이식으로 'RELAY 숏터뷰'를 진행하고 있습니다. 릴레이 숏터뷰는 브레인저가 애정 하는 아이템뿐만 아니라 좋아하는 관심사, 취미, 자기 계발 등! 다양한 이야기를 통해 '브레인저'분들을 더 폭넓게 알아 갈 수 있는 코너입니다. 이번 50호에는 인프라웹팀의 6인 6색의 매력을 확인할 수 있었습니다! 목적 있는 수다 각 분야 전문가가 소개하는 보고, 읽고, 듣고, 맛보고, 가보면 좋을 다양한 정보들을 소개하는 '목적있는 수다' 코너도 새롭게 준비했습니다. 브레인저의 퇴근 후와 주말이 더욱 풍성해질 수 있을 것 같아요! 이 밖에도 브레인즈뉴스에는 다양한 콘텐츠들이 있습니다. 매 분기 부서 간의 소식을 전하는 '팀뉴스'를 비롯해서, 신규 입사자를 알아가는 '뉴-브레인저' 인터뷰, 브레인저에게 감사한 마음을 전하는 '하트 투 하트', 매 호마다 주제를 던지고 브레인저의 목소리를 들을 수 있는 '보이서 오브 더브레인즈' 등! 구성원 모두가 조금이라도 더 가까워질 수 있는 콘텐츠를 만들기 위해 최선을 다하고 있습니다. 브레인즈뉴스는 내부 온라인 커뮤니티와 전체 메일에서 확인할 수도 있고, 인쇄본은 8층 카페테리아와 각 팀별로 두어서 언제든지 편하게 확인할 수 있습니다. 아무리 뛰어난 지성이나 전략을 가지고 있어도 혼자 게임을 한다면, 항상 팀에게 지게 될 것입니다 리드 호프만(링크드인의 공동 창립자) 브레인즈뉴스를 통해 활발하게 소통하여 최고의 팀워크를 만들고, 그 팀워크를 바탕으로 최고의 가치를 만들어내는 브레인즈컴퍼니가 되겠습니다.
2024.05.09
기술이야기
SDN(소프트웨어 정의 네트워크)의 주요 특징과 성공사례는?!
기술이야기
SDN(소프트웨어 정의 네트워크)의 주요 특징과 성공사례는?!
지메일, 유튜브, 구글맵스, 구글 클라우드까지.. 구글은 자사의 다양한 서비스들이 어디에서나 원활하게 돌아갈 수 있도록, 전 세계 곳곳의 수많은 데이터 센터를 운영하고 있습니다. 구글의 한 데이터 센터 전경(출처ⓒ google.com) 그리고 이 데이터 센터간의 효율적이고 안정적인 '네트워크' 구축을 위해, 다양한 노력을 펼치고 있습니다. 사용자에게 빠른 서비스를 제공하기 위해선 데이터 센터간의 높은 연결성과 효율성이 필수조건이기 때문이죠. 구글의 네트워크 운영은 2012년에 큰 전환점을 맞이합니다. 이 변화의 중심에는 SDN(Software Defined Network, 소프트웨어 정의 네트워크)이란 기술이 있는데요. 구글의 네트워크 운영 효율과 안정성을 극적으로 개선시킨 SDN은 과연 무엇일까요? 우선 SDN의 주요 특징부터 살펴보겠습니다. ㅣSDN의 두 가지 핵심특징 SDN은 네트워크 관리를 간소화하고 네트워크 구성의 유연성을 높이기 위해 고안된 기술입니다. SDN에는 두 가지 핵심적인 특징이 있는데요. 첫 번째 특징, 컨트롤 플레인과 데이터 플레인의 분리 SDN을 대표하는 첫 번째 특징은, 네트워크 장비의 전반적인 데이터를 중앙 집중적으로 관리할 수 있는 컨트롤 플레인(Control Plane)과, 트래픽 전송 역할을 하는 데이터 플레인(Data Plane)이 분리된 것입니다. 이러한 분리에 따른 두 가지 효과를 살펴보겠습니다. (1) 최적의 로드밸런싱이 가능해짐 기존에는 라우터와 스위치 등의 네트워크 장비가 경로를 결정했었습니다. 이 장비들은 주로 최단 경로 알고리즘을 통해 패킷을 전달하기 때문에, 네트워크 관리자가 특정 경로를 원하는대로 설정하기엔 어려움이 있었습니다. 즉 '로드밸런싱'이 어려웠었죠. 하지만 SDN은 이러한 상황의 변화를 가져왔습니다. [그림] SDN 로드밸런싱 예를 들어 보겠습니다. 기존에는 경로 정보가 있을 때 U에서 나가는 트래픽을 V와 X에 각각 분산시키고 싶을 경우, 기존의 최단 알고리즘을 통하면 항상 최단의 경로로만 라우팅할 수 있었습니다. 하지만 위 [그림]처럼 SDN을 사용하면 네트워크 관리자는 전체 네트워크의 상태를 실시간으로 파악하고, 트래픽을 V와 X로 균등하게 분산시키는 등 세밀한 조정을 할 수 있습니다. 이를 통해 네트워크의 효율성을 극대화하고, 트래픽 과부하나 장애 발생 시 빠르게 대응할 수 있게 되었죠. (2) 비용 절감과 효율성 증대 SDN을 통해 기업들은 고가의 전용 네트워크 장비를 사용하지 않고도, 필요한 네트워크 기능을 구현할 수 있게 되었습니다. 이에 따라서 초기 장비 투자 비용(CapEx)과 네트워크의 운영 비용(OpEx)을 모두 줄일 수 있습니다. 또한 네트워크 관리의 자동화와 최적화로 운영의 효율성을 높여주며, 장기적으로는 인적 자원에 대한 비용 절감으로도 이어집니다. 두 번째 특징, 중앙 집중식 관리 시스템 SDN을 대표하는 또다른 특징은 소프트웨어(SDN 컨트롤러)가 중앙에서 제어한다는 것입니다. 이 소프트웨어가 네트워크의 '두뇌' 역할을 하며, 네트워크의 각 기능이 어떻게 동작할지 지시합니다. 이러한 특징으로 인한 대표적인 효과를 살펴보겠습니다. (1) 유연성과 신속한 대응 기존 네트워크 시스템은 하드웨어 중심으로 돌아가기 때문에, 이 변화에 적응하기 위해선 실제 장비를 교체하거나 수동으로 설정을 변경해야 했습니다. 하지만 SDN에서는 모든 제어 기능이 '중앙'에서 소프트웨어로 이루어지기 때문에, 변경 사항이나 새로운 요구 사항이 발생했을 경우 관리자는 물리적 장비에 접근하거나 개별 설정을 조정할 필요없이 소프트웨어를 통해 네트워크를 즉시 업데이트할 수 있게 되었습니다. 이 덕분에 기존에 며칠이나 몇 주가 걸리던 네트워크 변경 작업을 몇 분 안에 할 수 있게 됐습니다. (2) 보안과 성능 최적화 기존의 전통적인 네트워크 관리 방식에서는, 네트워크의 각 부분에 대해서 심층적으로 들여다 보는 것이 어려웠습니다. 네트워크 장비와 시스템이 서로 다른 플랫폼과 프로토콜을 사용했기 때문에, 전체적인 네트워크 상태의 모니터링이 사실상 불가능했었죠. 하지만 SDN은 소프트웨어를 통한 중앙집중식 관리 시스템으로 이루어져 있기에, 네트워크의 모든 부분에 대한 실시간 통합 관리가 가능합니다. 이를 통해서 보안 위협을 빠르게 식별하고 대응할 수 있게 되었죠. 또한 트래픽 패턴을 정밀하게 분석하여 재분배하고, 트래픽 병목 현상을 예방하여 전반적인 네트워크 성능도 개선할 수 있게 됐습니다. SDN의 두 가지 특징과 그로 인한 효과를 알아봤는데요. 이제 SDN의 아키텍처와 구현 방식에 대해서도 한번 살펴보겠습니다. ㅣSDN의 아키텍처와 구현 방식 SDN 아키텍처: 세 가지 주요 계층 SDN은 네트워크 관리를 더 유연하고 효율적으로 만들기 위해, '세 가지' 주요 계층으로 구성되어 있습니다. 세 가지 계층은 앞서 언급했던 Control Plane(컨트롤 플레인)과 Data Plane(데이터 플레인), 그리고 Application Plane(응용 프로그램 계층)입니다. 각 계층은 네트워크를 관리하고 운영하는데 있어 중요한 역할을 하는데요. 각 계층별 역할과 연관성에 대해서 알아보겠습니다. 우선 아래 [그림]에 가장 하단에 위치한 Data Plane(데이터 플레인)은 Control Plane(컨트롤 플레인)이 내린 결정에 따라 실제 데이터 패킷(Data packet)을 전송하는 역할을 합니다. 데이터 플레인은 스위치, 라우터 같은 물리적 장비를 통해 구현되며, 이들 장비는 데이터 패킷을 처리하고 전달하죠. [그림] SDN 아키텍처 중간에 위치한 Control Plane(컨트롤 플레인)은 네트워크에서 어떤 데이터가 어디로 가야 하는지 결정하는 역할을 합니다. 즉 Control Plane(컨트롤 플레인)은 네트워크 트래픽을 어디로 보낼지 결정하는 역할을 합니다. 가장 위에 위치한 Application Plane(응용 프로그램 계층)은 사용자에게 서비스를 제공하는 소프트웨어 애플리케이션을 말합니다. 이 계층은 SDN의 나머지 두 계층 위에 있으며, 네트워크의 다양한 리소스를 활용해 실제 사용자에게 서비스를 제공합니다. 클라우드 스토리지 서비스나 스트리밍 서비스 같은 것이 여기에 해당됩니다. 이 서비스들은 Control Plane(컨트롤 플레인)과 Data Plane(데이터 플레인)을 통해 데이터를 주고 받으며, 사용자에게 콘텐츠를 제공하죠. 이처럼 세 계층은 서로 밀접하게 연결되어 있습니다. 다시 말해 Control Plane(컨트롤 플레인)이 네트워크의 전반적인 관리와 결정을 담당하면, Data Plane(데이터 플레인)은 그 결정을 바탕으로 실제 데이터를 전송하죠. 그리고 Application Plane(응용 프로그램 계층)은 이 모든 네트워크 인프라 위에서 동작하며, 최종 사용자에게 서비스를 제공합니다. SDN의 구현 방식 위에서 살펴본 것 처럼 SDN은 세 개의 층으로 이루어져 있는데요. 이 각각의 층이 '제대로' 역할을 수행하기 위해서 꼭 필요한 것이 SDN Controller, OpenFlow 프로토콜입니다. OpenFlow 프로토콜은 SDN 컨트롤러와 네트워크 장비 사이에서 동작하는 프로토콜입니다. 컨트롤 플레인과 데이터 플레인 사이의 소통을 담당하고 있죠. OpenFlow 프로토콜은 컨트롤 플레인이 네트워크 장비에 구체적인 지시를 내리고, 그 지시에 따라 트래픽을 어디로 보낼지 결정할 수 있게 해줍니다. [그림] SDN 컨트롤러, OpenFlow 프로토콜 SDN 컨트롤러는 이 모든 과정을 조율하는 '중앙 집중식 지휘소'라 할 수 있는데요. 컨트롤러는 네트워크의 전반적인 상황을 파악하고, 데이터 플로우를 최적화하기 위한 결정을 내리며, OpenFlow를 통해 그 결정을 네트워크 장비에 전달합니다. 컨트롤러가 없다면 마치 중앙 교통 관리 시스템이 없이 각자의 판단에 따라 움직이는 차량들처럼 혼란스러워 지겠죠. 이처럼 SDN 컨트롤러와 OpenFlow 프로토콜을 통해 구현된 중앙 집중식 네트워크 관리는 효율적이고 유연한 트래픽 조정을 가능하게 합니다. 이제 마지막으로 맨 앞에서 잠시 살펴 본 구글(Google)의 사례를 자세히 들여다보겠습니다. ㅣ사례를 통해 보는 SDN: 구글의 G-Scale 구글의 'G-Scale SDN 프로젝트(2012)'는 SDN을 가장 효과적으로 활용한 대표적인 사례입니다. 이 프로젝트는 구글이 2010년부터 진행한 OpenFlow 프로젝트의 일환으로, 구글 데이터센터 백본(BackBone)1 구간을 SDN 기반으로 전환하는 대담한 시도였죠. 구글 이 프로젝트를 통해 성취한 결과는 인상적인 수준을 넘어, 네트워크 관리 방식에 혁신을 일으켰다고 평가받고 있습니다. 구글은 얻은 대표적인 세 가지 이득을 살펴보겠습니다. *1: 백본: 전산망 속에서 근간이 되는 네트워크를 연결시켜주는 대규모 전송회선 [그림] 구글 G-Scale 프로젝트를 통해 구축된 데이터 센터(2012) 1. 인프라 리소스의 최적 활용 구글은 OpenFlow를 기반으로 한 SDN을 적용해 기존에 40~50% 수준에 머물렀던 네트워크 인프라의 활용도를 거의 100% 가까이 끌어올렸습니다. 기존 네트워크 시스템에서는 다양한 벤더의 장비들이 서로 완벽하게 호환되지 않은 문제로 인해, 전체 네트워크 장비의 효율성이 제한되곤 했었죠. 하지만 구글의 SDN 구현은 이러한 한계를 넘어서, 네트워크 자원을 훨씬 유연하게 관리할 수 있는 방법을 제시할 수 있게 했습니다. 2. WAN 대역의 경로 최적화 WAN(Wide Area Network)에서의 데이터 전송 속도와 효율성은, 전 세계 사용자들에게 고품질의 서비스를 제공하는 데 핵심적인 요소인데요. 구글은 SDN을 통해 이러한 WAN 대역의 데이터 전송 경로를 최적화하여, 사용자 경험을 크게 향상시킬 수 있었습니다. 이는 전 세계 서비스를 제공하는 구글에게 있어 대단히 중요한 성과였죠. 3. 네트워크 구축 비용의 절감 구글은 SDN 컨트롤러와 화이트박스 스위치의 조합을 통해, 데이터센터 내 네트워크 구축 비용을 대폭 낮출 수 있었습니다. 화이트박스 스위치는 사용자가 네트워크 장비의 동작방식을 직접 결정할 수 있게 하는 개방형 장비로, 구글은 이를 통해 더 효율적이고 경제적인 네트워크 인프라를 구축할 수 있게 됐습니다. 또한 구축 비용의 절감 뿐 아니라 전반적인 서비스 품질의 향상 효과도 거둘 수 있었습니다. [그림] 구글의 다양한 SDN 기술 이처럼 구글의 'G-Scale SDN 프로젝트'는 단순히 기술적 성공을 넘어서, 전 세계 통신사와 네트워크 장비 제조사들이 SDN을 도입하고 네트워크 가상화에 뛰어들게 만든 결정적 계기가 되었습니다. 구글은 여기서 한 발자국 더 나아가 BGP, Espresso, B4, Andromeda, Jupiter 등 다양한 SDN 기술을 적극적으로 활용하고 있습니다. 이러한 노력은 네트워크의 효율성을 극대화하고, 비용을 최적화하여, 데이터 중심의 세계에서 경쟁력을 유지하고, 사용자에게 더 나은 서비스를 제공하는 성과를 만들어내고 있습니다. 구글의 G-Scale 프로젝트라는 큰 성공을 만들어낸 SDN도 '어떻게 하면 안정적으로 네트워크를 관리하고 운영할 수 있을까?'라는 고민에서 시작됐습니다. 네트워크 관리의 중요성은 더욱 더 커지고 있습니다. SDN이라는 혁신적인 기술을 바로 도입하는 것도 물론 좋지만, 그 전에 현재의 네트워크를 제대로 모니터링 하고 있는지 부터 점검해봐야 합니다. 여러분의 네트워크는 제대로 관리되고 있나요?
2024.05.09
회사이야기
[행사] 근로자의 날 서프라이즈 이벤트 'CEO가 쏜다!'
회사이야기
[행사] 근로자의 날 서프라이즈 이벤트 'CEO가 쏜다!'
여느 때와 다르지 않은 월요일, 아니 5월 1일 근로자의 날 덕분에 다소 마음이 가벼웠던 지난 4월 29일, 브레인즈컴퍼니 본사 1층 앞에 특별한 차량이 도착했습니다! │본사 1층 앞, 특별한 커피차가 등장하다 본사 1층 앞에 등장한 차량은 예쁜 외관을 갖춘 커피차였습니다! 브레인즈 그룹의 대표인 선근 님께서 근로자의 날을 맞아 브레인즈컴퍼니와 에이프리카 구성원분들을 위해 직접 준비해 주셨는데요. 단순히 커피만 준비된 게 아니었습니다. 아메리카노, 카페라떼, 바닐라라떼 등의 커피류부터 리버레몬에이드, 핑크 리치 에이드, 샤인 머스캣 에이드, 뱅쇼 에이드와 같은 에이드류와 티! 그리고... 달콤하고 신선한 다양한 과일이 담긴 과일 컵까지 준비되어 있었습니다! '브레인즈 그룹 모두 모여라!'라는 팻말처럼, 커피차 이벤트 앞에 구성원분들이 삼삼오오 모이기 시작했는데요. 어떤 메뉴를 고를지 화기애애한 웃음과 목소리가 끊이질 않았습니다. "갑자기 1층에 커피차가 있어서 깜짝 놀랐어요. 선근 님이 앞치마 하면서 서빙해 주셨던 모습도 인상적이었습니다(웃음). 특히 음료에 붙어있던 '여러분이 있어 정말 든든합니다'라는 문장에 감동받았어요!" "1층에 커피차가 있어서, 근처에 무슨 행사하나 보다 했는데 저희를 위한 선물이었다니. 정말 감동했습니다. 촬영해서 친구들에게 보여주기도 했어요. 다들 깜찍하다고 하더라고요(웃음). 이렇게 소소한 이벤트를 열어주신 선근 님께 감사의 말씀 전합니다!" 등의 반응들로 감동과 즐거움을 엿볼 수 있던 시간이기도 했습니다. 또한 이날 선근 님께서는 브레인즈 구성원분들을 위해 손수 서빙과 더불어, 따뜻한 응원 메시지까지 함께 전달해 주셨습니다. 하지만 이날 커피차 이벤트는 단순히 음료와 간식만 준비된 것이 아니었는데요. │두근두근 '꽝 없는' 룰렛 이벤트! 바로 커피차와 함께 선근 님께서 준비한 '꽝 없는 룰렛 이벤트!'가 기다리고 있었습니다. 1등(5만 원 상품권)을 비롯해서 별다방 상품권, 츄파춥스 등이 선물로 준비되어 있었는데요. 모든 브레인즈 구성원분들에게 공평하게 룰렛을 돌릴 수 있는 기회가 주어졌습니다. 모두 두근거리는 마음으로 신중하게 룰렛을 돌리는 시간이 이어졌는데요. 룰렛 이벤트를 통해 여기저기서 터져 나오는 함성과, 아쉬움에 섞인 탄식, 그리고 상품권이 당첨되면 환호하는 소리까지 다양한 감정이 섞여있던 재미있는 시간이었습니다. "색다른 이벤트로 오랜만에 리프레시도 되고, 타팀들과 함께 룰렛 돌리기를 하면서 서로 얼굴 마주하고 인사도 가질 수 있는 시간이라 더 좋았어요. 이런 소확행 이벤트 덕분에 월요일 하루가 너무 즐거웠어요!" 라는 훈훈한 반응도 이끌어낼 수 있었습니다. 그렇다면 대망의 5만 원 상품권을 차지한 분은 두구-두구-두구! 누구일까요? 바로 인프라코어팀 성현진님이었습니다. 축하드립니다! 1등이 생각보다 빠르게 나오는 바람에, 선근 님께서는 '현금으로 쏜다!' 추가 이벤트를 진행해 주셨는데요. 무려 네 분을 더 추가로 선정했습니다! "근로자의 날을 미리 축하하는 이벤트를 통해 시원하고 맛있는 음료도 먹고, 예상치 못한 1등이란 이득까지 생겨 기분 좋게 일할 수 있었습니다. 오늘 정말 기억에 남는 하루가 될 것 같아요. 재밌는 이벤트를 열어주셔서 감사드립니다!" "행여나 5만 원 권 상품권이 없을까 봐 점심을 먹고 바로 달려왔는데, 보람이 있었네요! 좋은 이벤트에 5만 원 상품권까지! 오늘 커피차 이벤트 덕분에, 의미 있는 하루를 보낼 수 있었습니다. 이 5만 원은 좋은 곳에 쓰겠습니다(웃음)." 이렇게 추가 1등 당첨자분들의 벅찬 소감도 들어볼 수 있었습니다. 이번 'CEO가 쏜다!' 이벤트를 통해 직원들에게 단순한 감사의 표시를 넘어서, 브레인즈 그룹의 핵심 가치 중 하나인 '행복하게 일하는 환경'을 위해 실천하려는 모습이 엿보였던 행사였습니다. 선근님의 ❤ 그리고 무엇보다 직원들의 행복과 만족을 최우선으로 생각하는 선근 님의 따뜻한 마음도 직접 느낄 수 있던 시간이었었는데요, 앞으로도 이러한 활동을 통해 모두가 행복하게 일할 수 있는 환경'을 만들고자 합니다. 브레인즈컴퍼니의 다음 이야기도 기대해 주세요!
2024.05.02
회사이야기
제니우스 SIEM(통합로그관리 시스템), 클라우드 서비스 확산 사업 서비스로 선정
회사이야기
제니우스 SIEM(통합로그관리 시스템), 클라우드 서비스 확산 사업 서비스로 선정
브레인즈컴퍼니의 IT 인프라 통합로그관리 시스템인 '제니우스 SIEM'이 과기부와 정보통신산업진흥원이 주관하는 '2024년 중소기업 클라우드 서비스 보급 확산 사업'의 공급 서비스로 선정됐습니다! ㅣ중소기업 클라우드 서비스 보급 확산 사업이란? 이 사업은 국내 중소기업들이 클라우드 기반의 디지털 서비스를 더 활발하게 사용하게 되는 것이 가장 큰 목적입니다. 위 이미지 상의 '수요기업'이 공급 서비스를 선택하여 이용 신청을 하면, 운영 기관에서 수요기업의 환경(산업 분야, 기업 규모 등)를 고려하여 도입 컨설팅 및 이용료를 지원합니다. 지원은 크게 두 가지 부문으로 일반지원과 집중 지원으로 나누어 진행되는데요. 일반지원으로 신청하여 최종 선정되면 최대 1,550만 원을, 집중 지원은 최대 5,000만 원을 지원받을 수 있습니다. (단, 자부담금은 20%) 브레인즈컴퍼니는 이번 사업에서 재무 건정성과, 통합로그관리 시장에서의 Zenius(제니우스) SIEM의 영향도를 높이 평가받아 제공기업으로 선정될 수 있었습니다. ㅣ제니우스(Zenius) SIEM은? 이번 사업의 공급 서비스로 등록된 제니우스 SIEM은, 이기종의 다양한 장비에서 발생되는 로그(Log)를 수집 및 분석하고 모니터링할 수 있는 솔루션입니다. AI 기술을 기반으로 한 SIEM을 통해 효율적인 실시간 모니터링과 컴플라이언스 준수, 그리고 보안 위협에 대한 대응 체계를 수립할 수 있어 시장에서 좋은 평가를 받고 있습니다. [그림] 제니우스 SIEM 예시 화면 높은 기술력과 품질을 인정받아 2023년에 CC 인증과 GS 인증 1등급을 획득하기도 한 SIEM은, 현재 인천공항공사를 비롯한 다수의 공공기관 및 기업에서 도입 후 사용 중에 있습니다. 제니우스 SIEM의 주요 특정점은 빠른 인덱싱 및 검색 속도, 무중단 스테일 아웃, 복합 이벤트 처리(CEP), 그리고 사용자 상황에 맞춘 사용자 정의 대시보드, 강력한 통계 분석 기능 등이 있습니다. 결과적으로 제니우스 SIEM을 통해 대용량 로그에 대한 통합 관리, 사이버 침해 위협에 대한 보안 대응 체계 마련, 컴플라이언스 준수 등의 목적을 이룰 수 있습니다. 다양한 기능을 탑재한 제니우스 SIEM을 통해, 대용량 로그에 대한 실시간 통합 모니터링 체계 구축하고 보안 위협에도 효과적으로 대응하시기 바랍니다.
2024.04.16
회사이야기
금융권에서 꾸준히 각광받는 제니우스(Zenius)
회사이야기
금융권에서 꾸준히 각광받는 제니우스(Zenius)
지난해 10월 일본의 은행 간 결제 시스템이 이틀간 '먹통'이 된 사태가 발생했었습니다. 그리고 한 달 후에는 카드 결제 데이터를 처리하는 일본 카드 네트워크의 시스템 오류로 인해 일본 각지에서 7시간 넘게 시민들이 카드 사용을 못 하는 불편이 발생하기도 했죠. 일본의 사례와 같이 은행이나 카드회사 등의 금융회사에서 네트워크/서버의 장애가 발생할 경우 궁극적으로 이익과 신뢰도의 급감으로 이어질 수 있습니다. 그렇기 때문에 '사고 없는' IT 인프라 환경 운영을 위한 노력을 이어가는 가운데, 브레인즈컴퍼니의 제니우스(Zenius)을 활용하는 금융기관이 꾸준히 증가하고 있습니다. ㅣ제니우스, 금융기관에서 꾸준히 각광받다 앞서 언급한 대로, 제니우스를 도입하고 활용하는 금융기관이 꾸준히 늘고 있습니다. 최근 수협중앙회는 '통합관제 및 운영 자동화'를 위해, 그리고 새마을금고는 '빅데이터 플랫폼 고도화'를 위해 제니우스를 도입했습니다. 또한 한국수출입은행과 한국 주택금융공사도 서버와 네트워크 관리를 위해 제니우스를 활용하고 있습니다. 이 밖에도 NH 뱅크, 신협중앙회, 광주은행, IBK 투자증권, DB손해보험 등에서도 꾸준히 제니우스를 활용하고 있습니다. 그렇다면 금융기관에서 제니우스를 꾸준히 사용하고 있는 이유는 무엇일까요? ㅣ제니우스의 네 가지 강점 금융기관에서 꾸준히 각광받는 제니우스는 크게 네 가지의 강점이 있습니다. [1] IT 인프라에 대한 통합 관리 제니우스는 금융기관의 복잡한 IT 환경을 통합 관리할 수 있는 기능들을 제공합니다. 이를 통해 IT 인프라의 성능 및 장애 정보를 빠르게 파악할 수 있어서, 운영 효율성과 안정성을 크게 높을 수 있습니다. [2] 보안 강화 금융기관에 필수적인 높은 수준의 보안을 유지할 수 있도록 제니우스는 통합 로그 관리, 보안 취약점 점검 등의 보안 기능을 제공합니다. 이를 통해 보안 위협에 대응하고 사전에 예방할 수 있습니다. [그림] 제니우스(Zenius) 오버뷰 예시화면 [3] 장애 대응 및 예방 실시간 모니터링과 자동 장애 복구 기능으로 시스템 장애에 대한 신속한 예방과 대응이 가능합니다. 이를 통해 서비스 중단을 최소화하고, 고객 만족도를 높일 수 있습니다. [4] 클라우드 서비스 지원 쿠버네티스 활용을 비롯한 클라우드 환경으로의 전환은 금융기관의 중요한 이슈로 떠오르고 있습니다. 제니우스는 모든 클라우드 환경(퍼블릭, 프라이빗, 하이브리드)에 대한 모니터링이 가능하여, 클라우드 서비스 안정성과 효율성을 크게 높여줍니다. 제니우스(Zenius)는 앞서 살펴 본 금융기관뿐 아니라, 공공기관과 기업을 포함한 1,000곳 이상에서 활발히 활용되고 있습니다. CSAP 인증과 GS 인증 1등급도 획득한 제니우스를 통해 성공적인 IT 인프라를 관리하시기 바랍니다.
2024.04.16
기술이야기
쿠버네티스(K8s) 모니터링에서 가장 중요한 두 가지?!
기술이야기
쿠버네티스(K8s) 모니터링에서 가장 중요한 두 가지?!
2022년 CNCF의 연간 조사에 따르면 전 세계 기업의 96%가 쿠버네티스를 활용 중이거나 활용을 고려 중인 것으로 나타났습니다. 또한 가트너는 쿠버네티스(Kubernetes, K8s) 시장의 규모가 올해 1조 2천억 원대를 돌파할 것으로 내다봤습니다. 이처럼 쿠버네티스가 '대세'로 자리 잡고 있는 가운데, 쿠버네티스 활용에 대한 어려움을 겪는 기업도 많아지고 있습니다. 클러스터 내의 리소스 할당/운영과 쿠버네티스 콘솔(대시보드)의 구성이 가장 큰 어려움으로 꼽히는데요, 이러한 어려움을 극복하기 위한 첫 번째 조건은 바로 올바른 '쿠버네티스 모니터링'입니다. 효과적이고 올바른 쿠버네티스 모니터링을 위해선 두 가지를 '꼭' 기억해야 하는데요, 지금부터 그 두 가지를 자세히 알아보겠습니다. ㅣ올바른 쿠버네티스 모니터링을 위한 두 가지 조건 첫 번째, 쿠버네티스의 주요 항목을 한눈에 볼 수 있어야 합니다 쿠버네티스 환경은 규모가 크고 동적이며 복잡한 구조를 가지고 있습니다. 그렇기 때문에 리소스 사용률, 에러 로그 등의 중요 정보를 실시간으로 파악할 수 있어야 합니다. 따라서 쿠버네티스 모니터링을 효과적으로 수행하기 위해 첫 번째로 기억해야 할 것은 '쿠버네티스 환경을 한 화면에서 종합적으로 볼 수 있어야 한다는 점'입니다. 우선 종합적인 모니터링을 통해 리소스 사용률, 트래픽 패턴 등의 중요 정보를 실시간으로 파악할 수 있어 문제 발생 시 빠르게 원인을 진단하고 해결할 수 있습니다. 또한 쿠버네티스 운영의 핵심은 효율적인 리소스 관리인데, 종합적인 모니터링을 통해 리소스 낭비를 줄이고 애플리케이션의 성능을 최적화할 수 있습니다. 이와 더불어 시스템의 이상 유무를 지속적으로 모니터링함으로써, 예기치 않은 다운타임 등의 오류를 방지할 수도 있죠. 따라서 쿠버네티스 모니터링 솔루션에는 각 구성요소들 간의 관계와 영향도를 '한 눈'에 파악할 수 있는 모니터링 View가 반드시 필요합니다. 더불어 쿠버네티스 환경을 관리하는 운영자나 조직마다 중요하게 생각하는 데이터 지표가 다릅니다. 때문에 운영자가 자신의 필요에 따라 모니터링 화면을 자유롭게 구성할 수 있다면, 더욱 효과적으로 시스템을 관리할 수 있습니다. [그림1] (왼) 클러스터 상세 모니터링 View, (중) 클러스터 메인 모니터링 View, (오) 주요 Service 모니터링 View 더 자세한 설명을 위해 제니우스(Zenius)의 쿠버네티스 모니터링 솔루션인 Zenius-K8s을 예로 살펴보겠습니다. 우선 [그림1]에 나와있는 것처럼 쿠버네티스 모니터링 솔루션은 여러 클러스터 현황을 한눈에 확인할 수 있는 요약 뷰를 제공해야 합니다. 이를 통해 클러스터의 상세한 현황과 노드, 파드, 컨테이너, 서비스 등을 통합적으로 모니터링할 수 있기 때문이죠. 이러한 기능은 운영자로 하여금 시스템 전반에 대한 신속한 이해를 가능하게 하고, 업무 효율성을 크게 높여줍니다. [그림2] (왼) Zenius-K8s 운영현황 오버뷰 (오) 사용자가 직접 정보를 구성할 수 있는 컴포넌트 수정창 여기에 더해서 Zenius-K8s처럼 쿠버네티스 주요 데이터 지표를 '사용자 관제 목적'에 따라 자유롭게 구성이 가능하고 가시성 높은 다양한 차트와 컴포넌트를 포함한 오버뷰를 제공한다면, 더욱더 성공적인 쿠버네티스 활용이 가능해집니다. 두 번째, 클러스터 별로 상세한 성능을 확인할 수 있어야 합니다 효과적이고 올바른 쿠버네티스 모니터링을 위한 두 번째 조건은, '클러스터 별로 상세한 성능을 확인할 수 있어야 한다는 것'입니다. 특히 쿠버네티스 환경을 관리하고 최적화함에 있어서 핵심적인 역할을 하는 클러스터 현황(노드, 파드, 컨테이너), 성능 지표(CPU 사용량, Memory 사용량), 이벤트 현황을 연관 지어 직관적으로 모니터링할 수 있어야 합니다. 이를 통해서 운영자는 클러스터의 전반적인 상태를 실시간으로 모니터링하고, 발생 가능한 문제를 조기에 식별하여 시스템의 안정성과 성능을 지속적으로 높일 수 있기 때문이죠. 또한 클러스터의 각 구성 요소가 서로 다른 역할을 수행하기 때문에 각 노드, 파드, 컨테이너별로 상세히 모니터링하는 것도 매우 중요합니다. [그림3] 클러스터 별 상세정보 요약 뷰 지금 살펴본 내용을 Zenius-K8s 예시 화면을 통해 다시 한번 되짚어 보겠습니다. 먼저 위 [그림3]에서 보이는 것처럼 주요 클러스터 현황(노드, 파드, 컨테이너 등), 주요 성능 지표(CPU, Memory 사용률 등), 이벤트 현황 등을 한 화면에서 확인할 수 있는 요약 뷰가 있어야 합니다. [그림4] Zenius-K8s 토폴로지 맵 특히, Zenius-K8s의 경우 수집한 데이터를 기반으로 자동으로 각 구성요소 간의 연관관계와 서비스 상태를 토폴로지 맵(Topolgy Map) 형태로 구성할 수 있습니다. 또한 다양한 조회 기준(노드, 네임스페이스, 서버)과 상세 정보 조회 기능을 제공하고 있죠. 쿠버네티스 모니터링 솔루션에는, 직관적이고 효율적인 모니터링을 위해 반드시 위와 같은 기능이 포함되어 있어야 합니다. [그림5] 노드(Node) 별 상세 모니터링 [그림6] 파드(Pod) 별 상세 모니터링 [그림7] 컨테이너(Container) 별 상세 모니터링 마지막으로 위의 Zenius-K8s의 예시 화면들처럼, 클러스터 내 각각의 구성요소에 대한 상세한 모니터링이 필요합니다. 이를 통해 산재된 데이터에 대한 효율적인 관리가 가능하기 때문이죠. 。。。。。。。。。。。。 지금까지 성공적인 쿠버네티스 모니터링을 위한 두 가지 조건을 살펴봤습니다. 쿠버네티스의 활용도와 중요성이 더 커지는 가운데, 운영의 안정성과 효율성을 높여주는 쿠버네티스 모니터링 솔루션 도입은 이제 선택이 아닌 필수가 되었습니다. 쿠버네티스 현황을 한눈에 볼 수 있고, 세부 요소를 세밀하게 들여다볼 수 있는 모니터링 솔루션을 통해서 성공적으로 쿠버네티스를 활용하시기 바랍니다.
2024.04.05
기술이야기
EMS, NPM, AIOps까지! NMS의 진화 자세히 보기
기술이야기
EMS, NPM, AIOps까지! NMS의 진화 자세히 보기
앞선 글들을 통해서 NMS의 기본 개념, 구성요소와 기능, 정보 수집 프로토콜에 대해서 알아봤었는데요. 이번 글에서는 NMS의 역사와 진화 과정, 그리고 최근 트렌드에 대해서 자세히 알아보겠습니다. EMS, NPM, 그리고 AIOps에 이르기까지 네트워크의 빠른 변화에 발맞추어 진화하고 있는 NMS에 대해서 하나씩 하나씩 살펴보겠습니다. ㅣNMS의 역사와 진화 과정 우선 NMS의 전반적인 역사와 진화 과정을 살펴보겠습니다. [1] 초기 단계 (1980년대 이전) 초기에는 네트워크 관리가 수동적이었습니다. 네트워크 운영자들은 네트워크를 모니터링하고 문제를 해결하기 위해 로그 파일을 수동으로 분석하고 감독했습니다. [2] SNMP의 등장 (1988년) SNMP(Simple Network Management Protocol)의 등장으로 네트워크 장비에서 데이터를 수집하고 이를 중앙 집중식으로 관리하는 표준 프로토콜을 통해 네트워크 관리자들이 네트워크 장비의 상태를 실시간으로 모니터링하고 제어할 수 있게 됐습니다. [3] 네트워크 관리 플랫폼의 출현 (1990년대 중후반) 1990년대 후반부에는 상용 및 오픈 소스 기반의 통합된 네트워크 관리 플랫폼이 등장했습니다. 이러한 플랫폼들은 다양한 네트워크 장비와 프로토콜을 지원하고, 시각화된 대시보드와 경고 기능 등을 제공하여 네트워크 관리의 편의성을 높였습니다. [4] 웹 기반 NMS (2000년대 중반) 2000년대 중반에는 웹 기반의 NMS가 등장했습니다. 이러한 시스템은 사용자 친화적인 웹 인터페이스를 통해 네트워크 상태를 모니터링하고 관리할 수 있게 했습니다. [5] 클라우드 기반 NMS (2010년대 이후) 최근 몇 년간 클라우드 기반 NMS의 등장으로 네트워크 관리의 패러다임이 변화하고 있습니다. 또한 빅데이터 기술과 인공지능(AI) 기술을 활용하여 네트워크 성능을 최적화하고, 향후 성능을 예측할 수 있는 성능 예측 기능까지 NMS에서 제공하고 있습니다. ㅣNMS에서 EMS로의 진화 네트워크 환경은 빠르게 변화하게 되고, 이에 따라서 NMS도 EMS로 진화하게 됩니다. NMS의 진화는 총 세 가지 세대로 나눌 수 있습니다. 1세대: 디바이스 관리 시스템 기존의 NMS는 외산 제조사에서 제공하는 전용 네트워크 솔루션이 주를 이루었습니다. CISCO의 시스코웍스(CiscoWorks), IBM의 넷뷰(NetView) HP의 네트워크 노드 매니저(Network Node Manager) 등 다양한 벤더들이 자사의 제품에 대한 모니터링 서비스를 제공하기 위해 특화된 디바이스 관리 솔루션을 내놓았죠. HP Network Node Manager 예시 화면(출처ⓒ omgfreeet.live) 물론 자사의 제품을 관리하기 위한 목적에서 출발한 솔루션이었기에, 대규모 이기종 IT 인프라 환경에 대한 모니터링 기능은 제공하지 못했습니다. 2세대: IT 인프라 관리 시스템 EMS의 등장 1세대의 NMS의 경우 빠르게 급변하는 네트워크 트렌드를 따라갈 수 없었습니다. 가상랜(VLAN), 클라이언트-서버 기술이 발달하게 되자, IP 네트워크 관계만으로 실제 토폴로지를 파악하기 어려웠습니다. 또한 네트워크장비 및 회선의 상태뿐 아니라, 서버 등의 이기종 IT 인프라 통합 모니터링에 대한 니즈와 함께 EMS(Enterprise Management System)의 시대가 시작됩니다. 이에 따라 서비스 관리 차원의 통합 관제 서비스가 등장합니다. 기존의 네트워크 모니터링뿐 아니라 서버, DBMS, WAS 등 IT 서비스를 이루고 있는 모든 인프라들에 대한 통합 모니터링에 대한 관심과 니즈가 증가했기 때문입니다. 3세대: 클라우드 네이티브 환경의 EMS 2010년 중 이후 서버, 네트워크 등 IT 인프라에 대한 클라우드 네이티브로의 전환이 가속화되었습니다. 기존의 레거시 환경에 대한 모니터링과 함께 퍼블릭, 프라이빗 클라우드에 대한 모니터링 니즈가 증가하면서 모든 환경에 대한 통합적인 가시성을 제공해 줄 수 있는 EMS가 필요하게 되었죠. 이외에도 AI의 발전을 통해 AIOps, Observability라는 이름으로 인프라에 대한 장애를 사전적으로 예측할 수 있는 기능이 필요하게 됐습니다. ㅣ네트워크 환경 변화(가상화)와 NMS의 변화 이번에는 네트워크 환경 변화에 따른 NMS의 변화에 대해서 알아보겠습니다. 네트워크 환경 변화(네트워크 가상화) 네트워크 구성 방식은 지속적으로 변화해왔습니다. 클라이언트-서버 모델부터 중앙 집중식 네트워크, MSA 환경에서의 네트워크 구성까지 이러한 변화는 기술 발전, 비즈니스 요구 사항, 보안 요구 사항 등 다양한 요인에 의해 영향을 받았는데요. 무엇보다 가장 중요한 변화는 전통적인 온 프레미스 네트워크 구조에서 네트워크 자원이 더 이상 물리적인 장비 기반의 구성이 아닌 가상화 환경에서 구성된다는 점입니다. ▪소프트웨어 정의 네트워킹(SDN, 2000년대 후반 - 현재): 네트워크 관리와 제어를 분리하고 소프트웨어로 정의하여 유연성과 자동화를 향상시키는 접근 방식입니다. SDN은 네트워크 관리의 복잡성을 줄이고 가상화, 클라우드 컴퓨팅 및 컨테이너화와 같은 새로운 기술의 통합을 촉진시켰습니다. ▪네트워크 가상화 (NFV, 현재): 기존 하드웨어 기반 전용 장비에서 수행되던 네트워크 기능을 소프트웨어로 가상화하여 하드웨어 의존성과 장비 벤더에 대한 종속성을 배제하고, 네트워크 오케스트레이션을 통해 네트워크 환경 변화에 민첩한 대응을 가능하게 합니다. ㅣ클라우드, AI 등의 등장에 따른 NMS의 방향 클라우드 네이티브가 가속화되고, AI를 통한 인프라 관리가 주요 화두로 급부상하면서 네트워크 구성과 이를 모니터링하는 NMS의 환경 역시 급변하고 있습니다. 클라우드 내의 네트워크: VPC VPC(Virtual Private Cloud)는 퍼블릭 클라우드 환경에서 사용할 수 있는 전용 사설 네트워크입니다. VPC 개념에 앞서 VPN에 대한 개념을 단단히 잡고 넘어가야 합니다. VPN(Virtual Private Network)은 가상사설망으로 '가상'이라는 단어에서 유추할 수 있듯이 실제 사설망이 아닌 가상의 사설망입니다. VPN을 통해 하나의 네트워크를 가상의 망으로 분리하여, 논리적으로 다른 네트워크인 것처럼 구성할 수 있습니다. VPC도 이와 마찬가지로 클라우드 환경을 퍼블릭과 프라이빗의 논리적인 독립된 네트워크 영역으로 분리할 수 있게 해줍니다. VPC가 등장한 후 클라우드 내에 있는 여러 리소스를 격리할 수 있게 되었는데요. 예를 들어 'IP 주소 간에는 중첩되는 부분이 없었는지', '클라우드 내에 네트워크 분리 방안' 등 다양한 문제들을 VPC를 통해 해결할 수 있었습니다. ▪서브넷(Subnet): 서브넷은 서브 네트워크(Subnetwork)의 줄임말로 IP 네트워크의 논리적인 영역을 부분적으로 나눈 하위망을 말합니다. AWS, Azure, KT클라우드, NHN 등 다양한 퍼블릭 클라우드의 VPC 서브넷을 통해 네트워크를 분리할 수 있습니다. ▪서브넷은 크게 퍼블릿 서브넷과 프라이빗 서브넷으로 나눌 수 있습니다. 말 그대로 외부 인터넷 구간과 직접적으로 통신할 수 있는 공공, 폐쇄적인 네트워크 망입니다. VPC를 이용하면 Public subnet, Private subnet, VPN only subnet 등 필요에 따라 다양한 서브넷을 생성할 수 있습니다. ▪가상 라우터와 라우트 테이블(routing table): VPC를 통해 가상의 라우터와 라우트 테이블이 생성됩니다. NPM(Network Performance Monitoring) 네트워크 퍼포먼스 모니터링(NPM)은 전통적인 네트워크 모니터링을 넘어 사용자가 경험하는 네트워크 서비스 품질을 측정, 진단, 최적화하는 프로세스입니다. NPM 솔루션은 다양한 유형의 네트워크 데이터(ex: packet, flow, metric, test result)를 결합하여 네트워크의 성능과 가용성, 그리고 사용자의 비즈니스와 연관된 네트워크 지표들을 분석합니다. 단순하게 네트워크 성능 데이터(Packet, SNMP, Flow 등)를 수집하는 수동적인 과거의 네트워크 모니터링과는 다릅니다. 우선 NPM은 네트워크 테스트(Synthetic test)를 통해 수집한 데이터까지 활용하여, 실제 네트워크 사용자가 경험하는 네트워킹 서비스 품질을 높이는데 그 목적이 있습니다. NPM 솔루션은 NPMD라는 이름으로 불리기도 합니다. Gartner는 네트워크 성능 모니터링 시장을 NPMD 시장으로 명명하고 다양한 데이터를 조합하여 활용하는 솔루션이라고 정의했습니다. 즉 기존의 ICMP, SNMP 활용 및 Flow 데이터 활용과 패킷 캡처(PCAP), 퍼블릭 클라우드에서 제공하는 네트워크 데이터 활용까지 모든 네트워크 데이터를 조합하는 것이 핵심이라 할 수 있습니다. AIOps: AI를 활용한 네트워크 모니터링 AI 모델을 활용한 IT 운영을 'AIOps'라고 부릅니다. 2014년 Gartner를 통해 처음으로 등장한 이 단어는 IT 인프라 운영에 머신러닝, 빅데이터 등 AI 모델을 활용하여 리소스 관리 및 성능에 대한 예측 관리를 실현하는 것을 말합니다. 가트너에서는 AIOps에 대한 이해를 위해 관제 서비스, 운영, 자동화라는 세 가지 영역으로 분류해서 설명하고 있습니다. ▪관제(Observe): AIOps는 장애 이벤트가 발생할 때 분석에 필요한 로그, 성능 메트릭 정보 및 기타 데이터를 자동으로 수집하여 모든 데이터를 통합하고 패턴을 식별할 수 있는 관제 단계가 필요합니다. ▪운영(Engine): 수집된 데이터를 분석하여 장애의 근본 원인을 판단하고 진단하는 단계로, 장애 해결을 위해 상황에 맞는 정보를 IT 운영 담당자에게 전달하여 반복적인 장애에 대한 조치 방안을 자동화하는 과정입니다. ▪자동화(Automation): 장애 발생 시 적절한 해결책을 제시하고 정상 복구할 수 있는 방안을 제시하여, 유사 상황에도 AIOps가 자동으로 조치할 수 있는 방안을 마련하는 단계입니다. 위의 세 단계를 거쳐 AIOps를 적용하면 IT 운영을 사전 예방의 성격으로 사용자가 이용하는 서비스, 애플리케이션, 그리고 인프라까지 전 구간의 사전 예방적 모니터링을 가능하게 합니다. 또한 구축한 데이터를 기반으로 AI 알고리즘 및 머신 러닝을 활용하여 그 어떠한 장애에 대한 신속한 조치와 대응도 자동으로 가능하게 합니다. Zenius를 통한 클라우드 네트워크 모니터링 참고로 Zenius를 통해 각 퍼블릭 클라우드 별 VPC 모니터링이 가능합니다. VPC의 상태 정보와 라우팅 테이블, 서브넷 목록 및 서브넷 별 상세 정보 (Subnet ID, Available IP, Availability Zone 등)에 대한 모니터링 할 수 있습니다. Zenius-CMS를 통한 AWS VPC 모니터링 이외에도 각 클라우드 서비스에 대한 상세 모니터링을 통해 클라우드 모니터링 및 온 프레미스를 하나의 화면에서 모니터링하실 수 있습니다. 。。。。。。。。。。。。 지금까지 살펴본 것처럼, 네트워크의 변화에 따라서 NMS는 계속해서 진화하고 있습니다. 현재의 네트워크 환경과 변화할 환경을 모두 완벽하게 관리할 수 있는 NMS 솔루션을 통해 안정적으로 서비스를 운영하시기 바랍니다.
2024.04.03
다양한이야기
지속적인 성과를 내기 위한 첫걸음, '이것'부터 관리 하라?!
다양한이야기
지속적인 성과를 내기 위한 첫걸음, '이것'부터 관리 하라?!
혹시 아래의 질문 중, 나에게도 해당하는 게 있으신가요? 단 하나라도 해당하는 게 있으시다면 이 글을 꼭 끝까지 읽어보시기 바랍니다. 25년간 수많은 리더들을 분석해 의학적으로 밝혀낸 '지속적으로 성과를 만드는 방법'에 대해서 하나씩 알아보려고 합니다. 오늘은 첫 번째로 지속적인 성과를 위해 가장 먼저 관리해야 할 '이것'에 대해서 알아보겠습니다. 과연 '이것'은 무엇일까요? (*알림: 이 글은 의사이자 CEO인 앨런 왓킨스의 [조율하여 리딩하라(Coherence)]라는 책을 기반으로 씌여졌습니다.) ㅣ가장 먼저 알고 관리해야 할 것은.. 비즈니스에서는 수익과 이익 시장 점유율 확대 등 좋은 '결과'를 내는 것이 가장 중요합니다. 그리고 그 결과를 만들기 전에는 당연히 '행동'이 있어야 하죠. 그렇다면 그 '행동'에 영향을 미치는 요인들은 무엇이 있을까요? 위 그림에서도 볼 수 있는 것처럼 우리의 '행동'을 결정하는 것은 바로 '생각'입니다. 이 글을 읽고 있다가도 '좀 별로인 것 같은데...' 하는 생각이 들면 바로 그만 읽는 행동을 하게 되는 것처럼. 그리고 그런 생각에 깊이 연관되어 큰 영향을 주는 것은 '느낌'입니다. 운동을 예로 들어보면, 건강한 몸(결과)을 위해 운동(행동)을 해야겠다고 생각하지만 아예 시작하지 못하거나 시작해도 오래 못 가는 경우가 많습니다. 바로 운동하고 싶다고 느끼지 않기 때문입니다. 의식적으로 아무리 좋은 생각을 하려고 해도 걱정이나 스트레스가 있다면 나쁜 '느낌'을 바꿀 수는 없습니다. 따라서 결국 좋은 결과를 만들기 위해서는 우리의 '느낌'을 바꿔야만 합니다. 행동을 결정하는 생각, 그리고 그 생각을 결정하는 느낌 그렇다면 느낌만 바꾼다면 모든 것이 해결될까요? 아쉽게도 답은 'No'. 느낌 역시 인간 시스템의 좀 더 깊은 곳에 존재하는 어떤 것이 결정하기 때문입니다. 느낌을 결정하는 것은 바로 날 것의 감정, 다른 말로는 움직이는 에너지(e-motion)입니다. 우리가 느낌을 통제하거나 바꾸기 힘든 이유는 우리가 깨닫지 못하는 사이 신체에서 발생하는 감정 때문이죠. 인간 신체의 생리학적 신호가 감정을 만듭니다. 부정적인 생리학적 신호는 감정의 소용돌이에 빠지게 만들고 이는 결국 느낌과 생각, 그리고 행동에 영향을 끼쳐서 안 좋은 결과를 만들고 맙니다. 결국 감정을 만들고 신체 내부의 무수한 생리학적 신호를 만들어 내는 것은 우리의 생리입니다. 생리는 생존하기 위해 끊임없이 이어지는 데이터의 거대한 흐름이라고 할 수 있습니다. (전기신호, 전자기 신호, 화학 신호와 압력까지 모두 포함) 우리의 생각과 감정을 만드는 것은 결국 몸속 정보의 흐름! 우리 모두의 몸은 24시간 내내, 생리적 정보의 지속적인 흐름을 가지고 있습니다. 그러나 대부분은 이러한 흐름의 중요성을 이해하지 못하고 있죠. 특히 우리나라의 경우 전통적으로 '몸이 아무리 아프거나 힘들어도 노력해야 해!', '감정에 휘둘리지 말고 집중하란 말이야!'라는 식으로 생리적 흐름을 무시해왔습니다. 하지만 일상생활과 업무에서 긍정적인 결과를 만들어 내려면 반드시 우리 몸의 생리적 흐름을 이해하고, 흐름의 질을 높이고자 노력해야 합니다. ㅣ꾸준하게 성과를 만드는 첫걸음 우리 몸의 생리적 흐름의 질을 높여서 꾸준한 성과를 만들기 위한 걸음은 바로 '에너지 관리'입니다. 우리 몸의 에너지 수준이 생리적 흐름에 가장 직접적인 영향을 주기 때문이죠. 에너지 관리는 크게 두 단계로 나눌 수 있습니다. 1단계: 나의 에너지 뱅크(E-Bank) 관리하기 에너지 뱅크란 쉽게 말해서 우리가 에너지를 얻고(예금), 빼앗기는지(출금)를 면밀하게 관리하는 것을 뜻합니다. 지금 바로 잠시 시간을 내서 나의 에너지를 증가시키는 모든 것과(예금), 빼앗는 모든 것(출금)을 기록해 보세요. 그 일들이 언제 일어났는지, 그리고 큰일인지 사소한 일인지 상관없이 모두 기록하는 것이 중요합니다.(혹 다소 어렵게 느껴지신다면 최근 일주일이나 한 달 사이에 벌어진 일을 기준으로 적어보셔도 됩니다.) 에너지 뱅크 작성예시 목록을 다 작성하셨으면, 예금과 출금 목록 중 가장 영향을 크게 미친다고 판단되는 것 3개씩 강조 표시를 합니다. 그리고 다음은 강조 표시된 항목들에 대한 조치를 취하는 것이죠. 간단히 말하면 '에너지를 얻는 활동을 의식적으로 더 열심히 하고, 빼앗기는 것은 의식적으로 피한다!' 제가 작성한 예시(위 이미지)를 예로 들어보면, 저는 7살이 된 아들과 함께 야구하고 둘이 시간 보내는 것과, 책을 읽는 것, 그리고 와이프와 둘이 시간 보내는 것에서 가장 크게 에너지를 얻어서 의식적으로 그 세 가지 활동에 시간을 많이 투자하고 있습니다. (퇴근 후 + 주말) 반대로 비효율적인 미팅으로 인해 에너지를 뺏기지 않기 위해, 미팅 전에 안건을 자세히 공유하거나 서면으로 대체할 수 있는 경우에는 미팅 대신 서면으로 커뮤니케이션을 하려고 노력하고 있습니다. 그리고 잠들기 전까지 SNS를 확인하는 것을 방지하기 위해 침대에 먼 곳에 스마트폰을 두고 잠자리에 향하고, 러시아워를 피하기 위해 조금 일찍 출근하려고 하고요. 여러분은 어떤 것을 통해 에너지를 얻으시나요? 어떻게 보면 거창해 보이진 않지만 위와 같은 노력들이 쌓이면 우리 몸의 에너지 레벨은 자연스럽게 높아지고, 결국 꾸준한 성과를 만들 수 있습니다. 결국 '지금은 성과를 내기 위해 바빠서 저런 것(예금)은 할 수 없으니까 조금만 미루자'라는 생각은 전혀 맞지 않는 것이고, 성과를 내기 위해 지금 의식적으로 나의 에너지 예금계좌를 채워나가야 합니다. 그리고 에너지 뱅크와 관련한 또 하나의 팁! 우리가 다른 사람들에게 친절한 행동과 격려의 말을 한다면 그 사람의 예금 계좌와 나의 예금 계좌가 동시에 불어나는 효과를 얻을 수 있습니다. 2단계: 일상생활 속에서 긍정 에너지 키우기 사람들은 대체로 반복되는 습관이나 의식적인 행동을 반복합니다. 직장인의 평일을 예로 들어보면, '일어나기 의식'부터 '씻고 아침 먹고 옷 입고 준비하는 의식', '직장으로 출근하는 의식', 그리고 회사에서는 개인 업무나 회의를 포함한 모든 '일과 관련된 의식'을 한 후, '퇴근 의식' 및 '잠들기 의식'으로 하루를 마무리하죠. 에너지 관리의 2단계는 바로 우리의 일상생활 속에 감사와 같은 긍정적인 감정이나, 내가 에너지를 얻는 행동들을 추가하는 의식적으로 추가하는 것! 예를 들면 아침에 일어나서 씻고 준비하는 동안 좋아하는 노래를 듣는다거나, 출근길에는 내가 좋아하는 분야의 콘텐츠(책, 아티클, 영상)를 보는 것이죠. 일상생활 속 여러분의 에너지를 높일 방법은?! 저의 경우에는 출퇴근길 차 안에서 제가 좋아하는 가수의 노래를 10분 이상씩 꼭 듣고 있고, 잠들기 전 아이와 함께 오늘 하루 중 감사했던 일 세 가지씩을 말하고 적는 것을 반복하고 있습니다. 여러분의 일상생활은 어떻게 흘러가고 있나요? 자칫 잘못하면 무의식적으로 반복되는 일상에서 한두 가지의 노력만 추가한다면 우리의 에너지 레벨이 기대 이상으로 높아질 수 있습니다. 。。。。。。。。。。。。 지속적인 성과를 높이기 위한 첫걸음을 알아봤습니다. 다음 시간에는 첫걸음 이후의 단계들에 대해서 함께 알아보려고 합니다. 에너지를 높이기 위한 실천의 1~2단계는 쉬우면서도 어려운 면이 있습니다. (연애나 다이어트는 방법을 몰라서 못하는 게 아니라는 말처럼...) 하지만 직장에서의 성공뿐 아니라 개인적으로도 행복한 삶을 누리고 싶다면 꼭 거쳐야 하는 단계입니다. 그리고 이 단계를 거치면 적지 않은 긍정적인 결과를 만들 수 있게 되죠. 자, 이제 같이 에너지 뱅크 작성과 실천부터 바로 진행해 보시죠!
2024.04.02
기술이야기
Helm과 Argo의 개념과 통합 활용법?!
기술이야기
Helm과 Argo의 개념과 통합 활용법?!
애플리케이션을 클라우드 네이티브 환경에서 효율적으로 관리하고 운영할 수 있는 플랫폼인 쿠버네티스(kubernetes)를 활용하는 기업들이 점점 더 늘어나고 있습니다. 이에 따라 효율적인 애플리케이션 관리를 통해 패키징 배포, 관리를 자동화하고 일관된 상태를 유지하는 것이 중요해지고 있습니다. 이번 글을 통해서는 애플리케이션 개발 및 도구 중 최근 많이 사용되는 Helm과 Argo에 대해서 자세히 알아보겠습니다. ㅣHelm의 등장 쿠버네티스를 활용한 애플리케이션 배포에 가장 기본이 되는 단위는 yaml 파일로, 주로 쿠버네티스 object(리소스)들을 정의하고 다루는데 활용됩니다. 쿠버네티스를 통해 애플리케이션을 배포하다 보면 비슷한 틀과 내용을 공유하고, 내부 값(configuration)만 일부 변경하는 작업을 하게 되는데요, 이 과정에서 애플리케이션마다 모두 yaml 파일을 만들어야 하나 보니 매우 번거로웠습니다. 위 이미지를 보면, A 애플리케이션은 정적 파일인 yaml을 오브젝트별(Service, Pod, ConfigMap)로 만들어서 생성하고 배포합니다. 그러다가 프로젝트의 확장에 따른 기능 추가로 인해 B와 C 애플리케이션으로 쪼개어 각각의 yaml 파일을 복사해서 사용합니다. 하지만, 팀 단위로 인프라가 확장될 경우는 어떻게 할까요? 개별 오브젝트에 대한 yaml 개별적으로 관리할 수 있을까요? 만약, 개별적으로 관리한다면 파일의 갯수와 코드량의 증가로 인해 개발자들은 매우 혼잡하게 될 것입니다. 이러한 문제점을 해결하기 위해, 쿠버네티스에서 애플리케이션을 배포하기 위해 사용되는 대표적인 패키징 툴인 Helm이 등장하게 됐습니다. Helm을 활용하면 컨테이너 배포뿐 아니라 애플리케이션을 배포하기 위해 필요한 쿠버네티스 리소스를Node의 npm, Ubuntu의 APT, Mac의 Homebrew처럼 모두 패키지 형태로 배포할 수 있습니다. ㅣHelm의 역사 Helm은 v1부터 v3에 이르기까지 아래와 같은 변화의 과정을 거쳐왔습니다. Helm v1 ◾ [2015년 11월] DEIS의 내부 프로젝트로 시작되어 KubeCon에서 발표 ◾ [2017년 04월] MS에서 DEIS를 인수 Helm v2 ◾ [2016년 01월] Google 프로젝트에 합류 ◾ [2016년 ~ 2018년] Helm v2 고도화, 2.15.0 릴리스 발표에서 v2 향후 계획 세부사항 공유 Helm v3 ◾ [2018년 06월] CNCF 프로젝트에 합류, MS, 삼성 SDS, IBM 및 Blood Orange의 구성원 등이 참여 ◾ [2019년 11월] 릴리스 발표 v2에서 v3로 고도화되면서 가장 눈에 띄는 변화는 Tiller(클러스터 내에서 Helm 패키지 및 배포 상태를 관리하는 서버 구성요소)의 제거입니다. Helm v2에서는 클러스터에 Tiller를 설치하여, API Server와 REST*1 통신을 하고, Client와 gRPC*2 통신을 진행했었는데요, Helm v3부터는 Tiller가 제거되면서 Client에서 바로 REST 통신을 통해 API Server로 요청하는 방식으로 변경되었습니다. 그 외에도 Helm v3으로 업그레이드되면서 보안 취약점이 줄어들었으며, 설치 및 관리 과정이 단순화되었습니다. 또한 사용자에게 보다 더 안전하고 효율적인 배포 및 관리 환경을 제공할 수 있게 되었습니다. *1 REST (Representational State Transfer) : 웹 기반 애플리케이션에서 자원을 관리하기 위한 아키텍처 스타일, 데이터를 고유한 URL로 표현하고 HTTP 메서드(GET, POST, PUT, DELETE 등)를 사용하여 해당 자원에 대한 행위를 정의함 *2 gRPC (google Remote Procedure Call) : 구글에서 개발한 오픈소스 프레임워크, 원격지에 있는 다른 시스템 또는 서버에 있는 함수를 호출하는 방식 ㅣHelm의 주요 개념 Helm은 애플리케이션을 배포해 주는 툴이라고 앞서 살펴봤는데요, Helm과 같이 사용되는 주요 개념들을 살펴보겠습니다. ◾ Helm Chart: 쿠버네티스 리소스를 하나로 묶은 패키지입니다. 이는 yaml 파일의 묶음(패키지)으로, 이 묶음 public 혹은 private registry에 push 해두고, helm 명령어를 통해 Helm Chart를 설치하여 쿠버네티스 리소스를 배포하는 역할을 합니다. ◾ Repository: Helm Chart 들의 저장소 ◾ Release: kubernetes Cluster에서 구동되는 차트 인스턴스이며, Chart는 여러 번 설치되고 새로운 인스턴스는 Release로 관리됩니다. ㅣHelm의 주요 기능 Helm의 두 가지 주요 기능을 살펴보겠습니다. [1] Helm Chart를 통한 손쉬운 배포 Helm을 사용하면 어떻게 되는지 그림으로 살펴보겠습니다. 개발 클러스터가 있고 앱 2개를 배포한다고 가정했을 때, Helm Chart Template을 만들면 변수 처리를 통해 yaml 파일을 하나하나 수정할 필요 없습니다. kubectl 명령어를 통해 yaml 파일의 동적 값을 치환하여 템플릿 형태로 편리하게 배포할 수 있다는 장점이 있습니다. [2] Helm Package를 이용한 오픈소스 설치 및 배포 Helm을 통해서 쿠버네티스에서 가동할 수 있는 아래와 같은 다양한 오픈소스들의 제품들을 쉽게 설치/배포할 수 있습니다. 위제품들 외에도 Helm Chart는 총 14,376개의 패키지와 281,373개의 릴리스를 오픈소스로 제공합니다. 이를 통해 사용자들은 자신의 요구에 맞는 가장 적합한 솔루션을 선택하여 개발할 수 있습니다. 또한 많은 사용자들이 검증하고 사용함에 따라 안정성 있는 운영도 가능하죠. 다양한 Helm Chart 패키지는 커스터마이징이 가능한 경우가 많은데요, 사용자는 필요에 따라 구성을 조정하고 수정해서 사용할 수 있는 장점이 있습니다. 다음으로는 Helm 못지않게 많이 활용되는 ArgoCD에 대해서 살펴보겠습니다. ㅣ ArgoCD란?! 기존의 kubernetes 애플리케이션을 배포하고 관리하는 방식은 수동적이었습니다. yaml 파일을 직접 편집하고, kubectl로 변경사항을 클러스터에 적용하는 수동 배포 방식은 실수를 많이 유발했죠. 또한 여러 개발자나 팀이 각자의 방식대로 배포 및 관리를 수행하는 경우, 클러스터 상태의 일관성이 저하되었는데요. 이로 인해 개발 및 운영팀 간의 협업이 어렵고 생산성이 감소되는 문제가 발생하기도 했습니다. 이러한 기존 접근 방식에 대한 대안으로 GitOps가 탄생했는데요, GitOps는 Git 저장소를 사용하는 소프트웨어 배포 접근 방식입니다. GitOps는 인프라와 소프트웨어를 함께 관리함으로써, Git 버전 관리 시스템과 운영환경 간의 일관성을 유지할 수 있도록 합니다. ArgoCD는 GitOps를 구현하기 위한 도구 중 하나로 kubernetes 애플리케이션의 자동 배포를 위한 오픈소스 도구입니다. kubernetes 클러스터에 배포된 애플리케이션의 CI/CD 파이프라인에서 CD 부분을 담당하며, Git 저장소에서 변경사항을 감지하여 자동으로 kubernetes 클러스터에 애플리케이션을 배포할 수 있습니다. kubernetes 애플리케이션 배포 과정을 살펴보겠습니다. ① 사용자가 개발한 내용을 Git 저장소에 Push(이때, kubernetes 배포 방식인 Helm 배포 방식의 구조로 Git 저장소에 Push 할 수 있습니다.) ② ArgoCD가 Git 저장소의 변경 상태를 감지 ③ Git 저장소의 변경된 내용을 kubernetes에 배포하여 반영 ㅣ ArgoCD의 주요 기능 ◾ 애플리케이션을 지정된 환경에 자동으로 배포 ◾ 멀티 클러스터 관리기능 제공 ◾ OCI, OAuth2, LDAP 등 SSO 연동 ◾ 멀티 테넌시와 자체적인 RBAC 정책 제공 ◾ 애플리케이션 리소스 상태 분석 ◾ 애플리케이션 자동 및 수동 동기화 기능 제공 ◾ Argo가 관리하고 있는 쿠버네티스 리소스 시각화 UI 제공 ◾ 자동화 및 CI 통합을 위한 CLI 제공 위 내용은 ArgoCD가 제공하는 주요 기능을 나열한 것인데요, 이 중에서도 대표적인 다섯 가지 기능에 대해서 자세히 살펴보겠습니다. ① 쿠버네티스 모니터링 ArgoCD는 쿠버네티스를 항상 추적하고 있다가 저장소의 변경사항이 감지되면, 자동으로 클러스터의 상태를 저장소의 상태와 동기화합니다. 또한 문제가 생기면 이전 상태로 롤백 할 수 있으며, 이를 통해 시스템 복구 및 문제 해결을 용이하게 합니다. ② 멀티 클러스터 관리 다중 클러스터 환경에서도 배포를 관리할 수 있어 복잡한 인프라 환경에서의 효율적인 작업을 가능하게 합니다. ③ ArgoCD 대시보드 Argo에서는 클러스터 상태를 효과적으로 관리하고 모니터링할 수 있는 대시보드를 제공합니다. ArgoCD 대시보드를 통해 애플리케이션의 실시간 상태와 동기화 상태와 같은 전체적인 배포 파이프라인을 자동화하여 시각적으로 확인할 수 있고, 롤백 및 이력 추적 기능도 동시에 제공하고 있습니다. ④ 안전한 인증 및 권한 관리 역할 기반 액세스 제어(RBAC) 및 권한 제어기능을 통해 민감한 정보에 대한 접근을 제어할 수 있습니다. ⑤ GitOps 지원 ArgoCD는 GitOps 방법론을 따르므로 애플리케이션의 배포를 Git Repository와 동기화할 수 있습니다. 이를 통해 코드와 인프라의 일관성을 유지하고 변경사항을 추적할 수 있습니다. ㅣ Helm과 ArgoCD의 통합 활용 프로세스 Helm과 Argo를 함께 사용하면 개발, 테스트, 배포 프로세스를 효과적으로 관리할 수 있습니다. Helm으로 애플리케이션을 패키징하고 버전을 관리하며, Argo를 활용하여 GitOps 워크플로우를 통해 지속적인 통합 및 배포를 자동화할 수 있습니다. ① develop: Helm을 사용하여 애플리케이션을 Helm Chart로 패키징 합니다. 이후 개발된 Helm Chart를 저장하기 위한 Git 저장소를 설정합니다. ArgoCD에서 저장한 저장소를 특정 배포 대상 Kubernetes 클러스터와 연결하여, Git 저장소의 변경사항을 감지하고 새로운 배포를 시작하여 클러스터에 적용합니다. ② git push: 개발자가 로컬 저장소 내용을 원격 저장소에 배포합니다. ③ Observe(GitOps): ArgoCD는 Git 저장소의 변경 사항을 감지하여, 변경사항이 발생하면 새로운 버전의 애플리케이션을 배포하여 자동화 및 일관성을 유지합니다. ④ 운영/테스트/개발 ㅣ마무리 오늘 함께 살펴본 Helm과 ArgoCD 두 가지 강력한 도구를 함께 이용한다면 CI/CD 통합, 버전 관리, 자동화 등의 이점을 활용해서 kubernetes 환경에서 애플리케이션을 더 효율적으로 관리할 수 있습니다. 한편 애플리케이션을 효과적으로 개발하는 것도 중요하지만, kubernetes 환경의 프로세스를 실시간 모니터링하고 추적하여 관리하는 것도 매우 중요합니다. 브레인즈컴퍼니의 kubernetes 모니터링 솔루션 Zenius-K8s는 다양한 CI/CD 도구를 이용하여 개발한 kubernetes 애플리케이션의 전체 클러스터 및 구성요소에 대한 상세 성능 정보를 모니터링하고, 리소스를 추적함으로써 시스템의 안정성과 성능을 높여주고 있습니다.
2024.03.08
기술이야기
무선 AP를 WNMS를 통해 올바르게 관리하는 방법
기술이야기
무선 AP를 WNMS를 통해 올바르게 관리하는 방법
이제 어디서나 인터넷을 빠르고 쉽게 이용하는 것은 '기본'이 되었습니다. 우리나라 정부와 지차체는 공공장소에서의 무료 와이파이(WiFi) 접근성을 높이기 위해, 공공와이파이 확대 프로젝트를 진행하고 있습니다. 한국 지능정보사회진흥원(NIA)에서는 23년에 공공와이파이를 4,400개소에 신규 구축하여 총 5만 8000개소의 공공장소에서 이용할 수 있게 된 것이죠. 또한 교육부에서는 디지털뉴딜 사업의 일환으로 「전교실 무선망 구축 사업」을 크게 확대시켜, 약 21만 개의 무선 AP(Access Points)를 교실에 설치했습니다. 이를 통해 온라인 학습 자료의 접근성을 높이고, 디지털 콘텐츠의 활용을 원활하게 하고 있습니다. 이 밖에도 대형 쇼핑몰, 카페 체인점, 호텔 등 무선 AP의 활용 범위가 지속적으로 확대되고 있는데요. 하지만 여러 장소에서 더 많은 무선 AP들이 설치됨에 따라, AP를 감지하고 관리하는 부분의 필요성이 커지고 있습니다. 이에 따라 AP를 중앙에서 관리할 수 있는 WLC(Wireless LAN Controller, 무선랜 컨트롤러)나 WNMS(Wireless Network Management System)의 중요성도 점점 더 커지고 있습니다. 이 중에서도 광범위한 네트워크 관리 기능을 제공하는 WNMS를 활용하는 사례가 많은데요. 오늘은 WNMS를 통해 '제대로' 무선 AP를 관리할 수 있는 방법을 알아보겠습니다. ㅣ무선 AP를 효과적으로 관리하는 법 WNMS는 AP 장비와 컨트롤러에 수집된 데이터를 바탕으로, 다양한 View를 통해 실시간으로 성능을 모니터링하고, 개선할 수 있도록 돕는 시스템입니다. 즉 무선 네트워크의 '눈'이 되어, 사용자들이 일상생활이나 업무에서 끊김 없이 높은 품질의 무선 인터넷 서비스를 이용할 수 있도록 제공하죠. 하지만 WNMS을 무조건 도입만 한다고 해서 AP와 컨트롤러를 올바르게 관리할 수 있을까요? WNMS를 제대로 '잘' 이용하기 위해서는, 다음과 같은 2가지 핵심 개념을 기억해야 합니다. 하나, AP 장비를 한눈에 모니터링할 수 있어야 합니다 우선 핵심 개념 첫 번째는 여러 위치에 분산된 무선 AP와 컨트롤러를 한눈에 쉽게 모니터링할 수 있어야 한다는 점입니다. 다시 말해, 네트워크 관리자가 AP의 핵심 현황들을 종합적으로 모니터링할 수 있어야 하죠. 예를 들어 AP가 네트워크에 연결되어 정상적으로 작동하는지(UP), 연결이 끊어지거나 오류 상태가 있는지(Down)는 필수적으로 확인할 수 있어야 합니다. AP Up/Down은 무선 네트워크 관리의 핵심 요소로, 네트워크의 신뢰성과 성능을 보장하는 데 필수적이기 때문이죠. 또한 전송량이 높은 AP와 전송량이 많은 사용자 또한 파악할 수 있어야 합니다. [그림] Zenius-WNMS : 핵심 요약 페이지 Zenius(제니우스) WNMS를 통해 구체적으로 살펴볼까요? Zenius WNMS는 무선 AP 관제 상황에 대한 핵심 요약 페이지를 제공하여, 한 화면에서 무선 네트워크 상황을 일목요연하게 확인할 수 있습니다. AP의 핵심 현황인 AP Up/Down 상태는 물론, 전송량이 높은 AP 장비, 사용자 별로 전송량이 많은 항목들을 Top 10으로 선별하여 제공하고 있죠. 이처럼 AP 핵심 요약 페이지를 통해 무선 네트워크 상태를 신속하게 파악할 수 있습니다. 둘, AP 장비의 성능을 직관적으로 확인할 수 있어야 합니다 두 번째 핵심 개념은 컨트롤러에 연결된 무선 AP 장비별 성능을 직관적으로 확인할 수 있어야 한다는 점입니다. 특히 각 AP 별로 In/Out bps(bits per second) 정보를 기간 단위로 성능 추이를 확인할 수 있어야 하는데요. 이는 네트워크 트래픽의 흐름을 파악하여, 어느 시간대에 트래픽이 집중되는지를 알 수 있는 중요한 지표이기 때문이죠. 이에 따라 잠재적인 네트워크 문제나 과부하 상황을 사전에 식별하고, 이에 대응할 수 있습니다. 쉽게 예를 든다면 온라인 대형 쇼핑몰에서 특별 이벤트 기간일 경우 방문객이 급증하곤 하는데요. 이때 WNMS를 통해 AP 별 In/Out bps 정보를 모니터링한다면, 트래픽 패턴을 파악할 수 있습니다. 이 정보를 바탕으로 관리자는 네트워크 용량을 사전에 조정하고, 방문객에게 끊김 없는 와이파이 서비스를 제공할 수 있게 되죠. [그림] Zenius-WNMS : AP 장비 성능 모니터링 페이지 Zenius WNMS를 통해 좀 더 자세히 살펴보겠습니다. 위 이미지에 나와있듯이, Zenius WNMS는 무선 AP 장비 별 In/Out bps 성능 추이를 직관적으로 모니터링할 수 있습니다. 특정 시간대에 데이터 트래픽이 집중되는 경우, 추가적인 네트워크 자원을 할당하여 사용자의 불편을 최소화할 수 있죠. 이처럼 네트워크의 전반적인 성능을 평가하고, 필요한 경우 네트워크 구성을 조정하여, 전체 성능을 최적화할 수 있습니다. 또한 커서의 움직임에 따라 실시간으로 In/Out bps와 AP 사용자 수를 동시에 확인할 수 있습니다. 이에 따라 평소보다 많은 데이터를 소비하는 AP나, 비정상적으로 많은 사용자가 연결된 AP를 모니터링하고 조치할 수 있죠. 이처럼 가시성 높은 직관적인 UI를 통해 네트워크의 성능을 지속적으로 개선하고, 사용자에게 최적의 서비스를 제공할 수 있습니다. [그림] Zenius-WNMS : AP 장비 세부 항목별 추이 모니터링 뿐만 아니라 관리하고 있는 무선 AP 장비와 컨트롤러 페이지를 각각 한눈에 확인할 수 있고, 성능 항목에 대해서 일/주/월/년 기간 별 추이 모니터링도 지원하고 있습니다. 이를 통해 장기적인 네트워크 사용 패턴을 파악할 수 있으며, 예측 가능한 네트워크 용량 계획을 수립할 수 있습니다. 。。。。。。。。。。。。 스마트시티 구축, IoT(사물인터넷)의 증가, 산업 자동화 확대 등 무선 네트워크를 활용한 다양한 분야에서 WNMS의 역할이 확대되고 있습니다. 앞서 언급했듯 WNMS는 '사용자 입장'에서 무선 AP 장비와 성능을 직관적으로 모니터링할 수 있는지가 매우 중요합니다. 사용자가 손쉽게 네트워크 상태를 확인할 수 있어야, 필요한 조치를 신속하게 취할 수 있기 때문이죠. 분산된 AP 장비에 대한 통합 모니터링 UI를 제공하여 장애 발생 시 빠른 조치를 할 수 있게 하는 Zenius(제니우스) WNMS와 같은 도구를 활용하여, 성공적으로 무선 AP를 관리하시길 바랍니다!
2024.03.04
기술이야기
네트워크 정보 수집 프로토콜의 모든 것 (SNMP, RMON, ICMP, Syslog)
기술이야기
네트워크 정보 수집 프로토콜의 모든 것 (SNMP, RMON, ICMP, Syslog)
지난 포스팅을 통해 NMS의 기본 개념과 NMS의 구성요소와 역할에 대해서 살펴보았는데요. 오늘은 네트워크 정보 수집을 위한 다양한 프로토콜에 대해서 자세히 알아보겠습니다. 네트워크 프로토콜(Network Protocol)은 네트워크에 연결된 장비 간의 메시지 흐름을 통제하고 관리하는 기본적인 절차와 규칙을 정한 규약입니다. 웹 브라우저, 파일 전송, 이메일 송수신, 미디어 스트리밍 등과 같은 모든 온라인 활동을 가능하게 하기 때문에 네트워크 정보 전달의 핵심요소라고 할 수 있죠. 이번 시간에는 주요 네트워크 프로토콜인 ICMP, SNMP를 중점적으로 알아보겠습니다. ㅣICMP는 무엇이고 어떻게 동작하는가? ICMP(Internet Control Message Protocol)는 주로 네트워크의 경로상의 문제나, 호스트(단말)의 문제 등을 파악할 때 사용하는 프로토콜인데요. 대표적인 서비스가 ping입니다. 구체적인 동작원리를 살펴보면 다음과 같습니다. 오류 보고 ◾ 네트워크에서 데이터를 보낼 때 오류가 발생하면, 오류를 발생시킨 장비(예: 라우터, 스위치)는 오류 정보를 담아 ICMP 메시지를 처음 보낸 사람에게 전송합니다. 이를 통해 무엇이 잘못됐는지 정확히 파악하고 문제를 해결할 수 있습니다. ◾ 예를 들어 한 컴퓨터에서 인터넷을 통해 데이터를 보내는데, 그 데이터가 목적지에 도달하지 못하면 ICMP가 '이 주소로는 데이터를 배달할 수 없어!'라고 알려주는 역할을 하죠. 이렇게 사용자나 네트워크 관리자가 문제를 알리고 대응할 수 있게 도와주는 게 ICMP의 주요 역할입니다. [그림] ICMP 동작 방식 진단 및 테스트 ◾ 네트워크의 연결 상태나 성능을 테스트하기 위해 ICMP 에코 요청과 에코 응답 메시지를 사용합니다. 이를 통해 네트워크의 지연시간(latency)이나 패킷 손실(packet loss) 등을 측정할 수 있습니다. '핑(ping, Packet INternet Groper)'을 대표적인 예로 들 수 있습니다. ◾ 쉽게 표현하면 '너 지금 연결 잘 되어 있니?'라고 물었을 경우 대상 장비가 '응, 잘 되어 있어!'라고 대답하면 연결이 잘 되어 있는 것이고, 대답이 없거나 늦는 것과 같은 문제를 식별하는 것이죠. ICMP도 좋은 도구이지만, 네트워크의 복잡성이 빠르게 증가하고 호스트 수가 증가하면서 ICMP만으로는 네트워크 관리가 어려워지는 문제가 발생했는데요. 이를 개선하기 위해서 탄생한 것이 바로 SNMP입니다. 우선 SNMP의 히스토리부터 살펴보겠습니다. ㅣSNMP 히스토리: 각 버전별 개념과 차이점은? SNMP(Simple Network Management Protocol)는 1988년에 아래의 세 가지 니즈에 부합하기 위해 등장했습니다. ◾ ICMP보다 많은 기능의 탑재 ◾ 네트워크 문제를 직관적이고 쉽게 해결할 수 있어야 함 ◾ 표준화된 프로토콜의 사용 이후 몇 가지 버전을 거쳐서 현재는 네트워크 장비를 모니터링하기 위한 프로토콜로 자리를 잡아서 대부분의 NMS 상에서 이용되고 있습니다. 잠깐 SNMP의 처리단계를 살펴보면, SNMP는 Get/Set/Trap의 단순 명령 구조로 구성되는데요, 메시지 타입별 역할은 아래와 같이 정리할 수 있습니다. 위와 같은 처리단계를 가지고 있는 SNMP는 보안 기능 강화 및 기능 개선을 위해서 초기 v1 버전에서 v3 버전까지 업그레이드됐습니다. 각 버전은 보안, 성능, 유연성 등의 측면에서 발전되었으며 현재는 SNMPv2가 가장 많이 사용되고 있죠. SNMP 버전 별 특징에 대해서 자세히 알아보겠습니다. SNMP v1 가장 초기에 만들어진 프로토콜로 기본적인 정보만을 주고받아서 네트워크 장비들의 상태를 확인하고, 간단한 명령 정도만 내릴 수 있습니다. 보안에 많이 약한 편이고, 정보를 주고받을 때 특별한 암호화나 보호 방법을 사용하지 않기에 정보가 노출될 위험이 있습니다. SNMP v2 SNMPv1의 단점을 해결하기 위해 개발된 버전입니다. 보안 기능과 네트워크 과부하, 관리 효율성 등에 대한 기능이 향상되었습니다. MIB(Management Information Base) 구조를 개선하여, 새로운 데이터 타입과 객체 식별자(프로그래밍에서 특정 객체를 식별하는 데 사용되는 값이나 이름)을 도입했습니다. 이로써 더 많은 종류의 데이터를 효과적으로 다룰 수 있게 되었지만, v1과 호환이 안되는 문제가 있어 상용화에는 실패했습니다. SNMP v2c (Community-Based Security) SNMPv2c는 '커뮤니티 기반' 방식을 사용하며 'Community String' (공동체 문자열)을 이용합니다. Community String은 정보를 주고받기 위해 인증 과정에서 비밀번호를 사용하는 것으로, 학교에서 특정 비밀번호를 알고 있는 사람들만 특정 정보를 볼 수 있게 하는 것과 비슷합니다. 하지만 비밀번호가 복잡하지 않은 편이라, 조금 더 높은 보안을 필요로 하는 경우에는 적합하지 않을 수 있습니다. 현재 가장 많이 사용되고 있는 버전입니다. SNMP v3 보안과 관리 기능을 대폭 강화한 버전입니다. SNMPv3는 정보를 주고받을 때 강력한 인증과 암호화를 사용하여, 네트워크 상의 중요한 정보를 안전하게 지킬 수 있습니다. 또한 복잡한 네트워크 환경에서 사용자가 많을 경우에도, 각 사용자의 접근 권한을 관리할 수 있는 기능이 있습니다. 하지만 이전 버전들보다 더 복잡한 보안 모델과 설정 등의 이유로 널리 사용되고 있지는 않습니다. [그림] SNMP 버전과 수를 한눈에 볼 수 있는 제니우스 EMS 화면 참고로 SNMP에는 위와 같이 다양한 버전이 있기 때문에 모든 NMS는 제니우스처럼 어떤 버전으로 수집했는지와 수를 파악할 수 있어야 합니다. 이제 SNMP에 대해서 조금 더 자세하게 살펴보겠습니다. ㅣSNMP 자세히 보기: MIB의 개념과 구조 MIB(Management Information Base)는 관리 정보 기반이라고 불립니다. SNMP를 통해 관리되어야 할 정보나 자원들을 모아둔 것으로, Manager와 Agent 간 정보를 주고받는 정보의 집합체입니다. MIB에는 SNMP를 통해 주고받는 정보가 어떤 의미를 가지고 어떻게 사용될 수 있는지에 대한 정의가 포함되어 있습니다. 또한 각각의 정보는 '객체'라고 불리며, 이 객체들은 계층적으로 구성되어 있기에 관리하고자 하는 정보를 쉽게 찾을 수 있게 도와주죠. 대표적으로 CPU 사용량, 메모리 사용량, 포트의 up/down 같은 상태 정보 등이 MIB에 포함됩니다. 마치 항해사가 바다를 항해하기 위해 지도를 사용하는 것처럼, MIB를 통해 네트워크의 상태를 정확히 파악하고 필요한 조치를 취할 수 있습니다. MIB의 구조를 자세히 살펴보면 우선 큰 나무를 뒤집어 놓았다고 생각한다면 이해하기 쉽습니다. 큰 나무의 밑동(Root) → 각각의 가지(Branches) → 잎사귀(Leavers)로 나누어져 내려오는 형태인데요, 부분별로 자세히 살펴보겠습니다. ◾ 밑동(Root): 모든 MIB 트리의 시작점으로, 'iso(1)', 'org(3)', 'dod(6)', 'internet(1)' 등으로 구성되어 있습니다. 여기서 'internet'은 네트워크 장비와 관련된 표준 MIB를 나타냅니다. ◾ 가지(Branches): 밑동에서 나온 큰 가지들은 네트워크 장비의 다양한 부분을 나타냅니다. 예를 들어 'mgmt(2)' 가지는 일반적인 관리 정보, 'private(4)' 가지는 각 제조업체의 고유 정보 등을 의미합니다. ◾ 잎사귀(Leaves): 가장 작은 단위의 정보를 나타내는 부분으로 특정 장비의 상태, 성능 지표, 설정값 등 구체적인 데이터가 저장됩니다. MIB에서는 네트워크 장비의 정보가 여러 '분류'로 나누어져 있는데, '네트워크 인터페이스'라는 분류 아래에는 네트워크 카드의 상태, 속도, 전송된 데이터의 양과 같은 정보들이 담겨 있습니다. MIB는 복잡해 보일 수 있지만, 네트워크 장비와 관련된 정보를 체계적으로 관리하고 접근할 수 있도록 설계되어 있습니다. 이 구조 덕분에 네트워크 관리자는 네트워크의 건강 상태를 쉽게 체크하고 필요한 조정을 할 수 있습니다. 다음으로는 MIB 내의 각 객체를 고유하게 식별하는 OID에 대해서 알아보겠습니다. ㅣSNMP 자세히 보기: OID 확인 방법과 수집항목 OID(Object Identifier)는 MIB 내에 포함되어 있는 각 개별 정도에 대한 ID 값입니다. 아래 그림에서 볼 수 있듯이, 트리의 하단 값이 OID인데 MIB의 각 개별 정보에 대한 ID를 의미합니다. [그림] OID Tree 구조 대형 도서관에서 원하는 책을 찾을 때 책의 번호를 확인하여 빠르고 정확하게 찾는 것처럼, 특정 오브젝트의 ID(Num)을 부여한 게 OID입니다. OID는 포함하고 있는 각 정보를 숫자로 표현합니다. ◾ Enterprise OID: 네트워크 업계에서 공통으로 사용하는 OID ◾ Private OID: 각 네트워크 벤더사에서 사용하는 독자적인 OID 예를 들어 Juniper Networks라는 네트워크 스위치 벤더에서 사용하고 있는 OID 값을 [1.3.5.6.1.9 ]라는 전용 OID 값을 사용한다고 가정하면, Juniper Networks 라우터의 경우 뒤에 라우터 제품별 OID '11'이 더 붙은 [1.3.5.6.1.9.11 ] 형태의 OID로 구성됩니다. [그림] 제니우스 예시 화면 지금까지 네트워크 모니터링에 필요한 ICMP, SNMP 그리고 MIB, OID에 대해 살펴봤습니다. 참고로 제니우스(Zenius)-NMS에서는 OID 사전을 제공하고 있으며, 이를 통하여 관리하고 싶은 항목의 MIB 항목 및 OID 정보를 쉽게 찾을 수 있습니다. 이제 SNMP의 주요 개념 중 하나인 SNMP Trap에 대해서 알아보겠습니다. ㅣSNMP Trap의 개념 그리고 특징은? Manager(관리자)는 Server(Agent)로 메시지 요청(Polling)을 하게 되고, Server(Agent)는 응답(Notifying)을 하는 방식으로 진행됩니다. 그런데 Server가 비정상적인 이벤트를 감지하면 Manager의 Polling을 기다리지 않고 바로 Manager에게 메시지를 보내는데요, 이 긴급 메시지를 Trap(트랩)이라고 합니다. 우리가 날씨에 대해서 찾아보지 않아도 폭설이 예상될 때 폭설을 경고하는 자동 알림 시스템과 비슷한 개념입니다. [그림] SNMP 프로토콜 동작 방식 SNMP Trap은 일반적으로 높은 CPU 사용량이나 디스크 공간 부족과 같이 해결해야 할 문제를 나타냅니다. 중앙 모니터링 시스템으로 전송되어 분석 및 조치를 취할 수 있죠. 이를 통해 Manager는 큰 문제가 발생하기 전에 잠재적인 문제를 신속하게 식별하고 해결할 수 있습니다. SNMP Trap의 방식과 기능을 네 가지로 나누어 살펴보겠습니다. (1) 비동기적 알림 SNMP Trap는 주기적인 폴링이 아닌, 이벤트 기반의 알림을 통해 즉각적으로 대응할 수 있도록 비동기적인 방법을 제공합니다. (2) 실시간 알림 SNMP Trap은 이벤트가 발생하는 즉시 알림을 제공하여, 실시간으로 네트워크 상태 및 장치 상태를 모니터링해서 문제 발생 시 즉각적인 대응과 조치를 가능하게 합니다. (3) 이벤트 기반 모니터링 SNMP Trap은 장치나 응용 프로그램에서 특정 이벤트가 발생했을 때만 알림을 보내기 때문에, 불필요한 트래픽을 발생시키지 않습니다. 따라서 자원을 효율적으로 사용하면서 중요한 상태 변경을 식별합니다. (4) 자동화된 대응 SNMP Trap을 사용하면 이벤트 발생 시, 자동으로 대응 조치를 취할 수 있는 자동화 시스템을 구축할 수 있습니다. 이를 통해 관리자의 개입 없이 특정 이벤트에 대한 대응을 효과적으로 수행할 수 있습니다. [그림] Zenius Syslog 감시 설정 등록 페이지(위), Zenius Syslog 이벤트 페이지(아래) 이와 같은 SNMP Trap을 통해 빠르게 이상을 탐지하는 것이 중요한데요. 제니우스(Zenius)-Syslog와 Trap에서는 Syslog, Trap에 각각 특정 이벤트 조건을 설정하여 이벤트를 감지하고, 장애를 통보할 수 있는 기능을 제공하고 있습니다. 이제 마지막으로 SNMP 못지않게 네트워크 관리에 중요한 역할을 하는 Syslog, RMON에 대해서 알아보겠습니다. ㅣ Syslog, RMON의 개념과 동작원리는? Syslog Syslog는 컴퓨터 시스템, 네트워크 장비, 보안 장비 등에서 일어나는 모든 상황과 변화를 서버에 기록하는 프로토콜입니다. 관리 대상인 장비에서 일어나는 모든 상황을 메모리에 기록하죠. 로그/오류 관리가 주 목적이고 Unix와 Linux에서 많이 사용됩니다. 대부분의 라우터와 스위치들은 Syslog 프로토콜을 이용하여 Log들을 Syslog 서버로 보내고, 수백수천 대의 장비에 일일이 접속하여 로그를 볼 수 없기 때문에 '중앙 집중식'으로 관리합니다. 작업 방식은 주로 Client-Push 모델로 이러우지고 있고, 장비에서 일어나는 모든 상황 변화를 Layer4 프로토콜이 메모리에 기록하며, Syslog 서버는 UDP 포트 514에서 메세지를 수신합니다. Syslog 수집항목은 시스템 운영/네트워크/보안/애플리케이션 등과 관련된 로그를 수집 및 분석하고, 각 항목별로 오류와 트랜잭션 등에 대한 내용을 확인합니다. 출처ⓒ viettelco.net RMON RMON(Remote Network Monitoring)은 네트워크 장비나 서버에서 발생하는 트래픽과 문제들을 원격에서 감시하기 위해 만들어진 프로토콜로, SNMP보다 확장된 개념이라고 할 수 있습니다. 네트워크 관리자는 RMON을 통해, 네트워크의 성능을 측정하고 문제가 발생했을 때 신속하게 해결할 수 있습니다. 회사에서 인터넷이 느려지거나 연결이 되지 않을 때 RMON을 사용하면 원인을 빠르게 찾아내어 문제를 해결할 수 있죠. RMON과 SNMP의 연관성을 우선 아래 이미지를 통해 살펴보겠습니다. 출처ⓒ dpstele.com/blog/what-is-rmon.php 좀 더 자세히 살펴보면 ◾ RMON은 SNMP 위에서 작동하며, SNMP 보다 더 광범위한 데이터를 수집/분석할 수 있는 기능을 제공합니다. ◾ SNMP가 네트워크의 '기본적인 통신'을 담당한다면, RMON은 그 위에서 보다 '세밀한 관찰과 분석'을 가능하게 합니다. ◾ RMON은 SNMP의 특정 데이터를 사용하여 네트워크 트래픽 패턴이나, 성능 문제, 네트워크 내의 비정상적인 활동 등을 실시간으로 감시하고 기록할 수 있게 해줍니다. ◾ RMON에서 Probe라는 수행 장비를 사용하며, 네트워크 트래픽 및 통계 수집 그리고 성능 모니터링을 위해 활용합니다. 결과적으로 RMON의 기능을 통해 네트워크의 문제를 더 빨리 발견하고, 효율적으로 대응할 수 있죠. 마지막으로 SNMP, RMON, ICMP, Syslog의 주요 내용들을 아래 표를 통해 한눈에 살펴보겠습니다. 。。。。。。。。。。。。 지금까지 네트워크 정보 수집을 위한 다양한 프로토콜의 종류와 특징에 대해서 알아보았습니다. 효과적인 네트워크 관리를 위해서 혁신적인 기술들이 많이 개발되고 있는데요, 이를 활용해서 성공적으로 네트워크를 운영하시기를 바라겠습니다!
2024.03.04
기술이야기
SMS를 통한 서버관리는 꼭 이렇게 해야만 한다?!
기술이야기
SMS를 통한 서버관리는 꼭 이렇게 해야만 한다?!
Gartner에서 진행한 연구에 따르면 기업에서 서버의 다운타임이 발생할 경우, 시간당 약 748억 ~ 1,202억의 손실 비용이 발생한다고 합니다. 또한 서버 다운타임등 서버를 제대로 관리하지 못했을 경우에는, 금전적인 손실뿐 아니라 고객이탈이나 브랜드이미지 하락 등의 치명적인 손실도 입게 되죠. 따라서 올바른 서버 관리를 통해 문제를 미리 예방하고, 혹여나 문제가 발생할 경우에는 빠르게 대응할 수 있어야 합니다. 그렇다면 '올바른 서버 관리'란 정확히 무엇을 의미하는 걸까요? ㅣ올바른 서버 관리를 위한 첫 걸음 ⓒoutsource2india 올바른 서버 관리를 위한 첫걸음은 바로 '통합 서버 관리' 도구의 도입입니다. 가장 많이 활용하는 도구가 바로 SMS(Server Management System)죠. SMS는 복잡한 IT 인프라를 효과적으로 관리하고, 모니터링할 수 있는 해결책을 제공하여, 서버 사태를 쉽게 파악하고, 필요한 조치를 신속하게 처리할 수 있도록 도와줍니다. SMS는 기업의 서비스 안정성과 비즈니스 연속성을 보장하는 데 필수적인 도구인 셈이죠. 최근에는 관리하는 서버의 규모와 상관없이 대부분 SMS을 사용하고 있습니다. 하지만 SMS를 도입하고 구축만 한다고 해서, 모든 과제를 해결할 수 있을까요? ㅣSMS를 제대로 활용하는 방법 SMS를 '제대로' 활용하기 위해서는 단순한 모니터링을 넘어, 문제 발생 시 알림을 받고 이를 통해 신속하게 문제를 해결할 수 있는 적극적인 조치가 필요합니다. 적극적인 조치 중의 대표적인 예이자 서버 관리의 핵심은 바로 '감시 설정'입니다. 그렇다면 구체적으로 '감시 설정'을 통해 어떻게 서버를 관리해야 하는지, 이를 위한 SMS의 조건은 무엇인지 살펴보겠습니다. 최적화된 감시 설정 값을 간편하게 설정할 수 있어야 한다 SMS의 감시항목설정은 사용자가 기본적인 모니터링 환경을 빠르게 구축할 수 있도록 간편하게 설정할 수 있어야 합니다. 통합 서버 관리에 대한 경험이 부족한 사용자더라도, 제품을 쉽게 설정하고 사용할 수 있도록 최적화된 감시 설정 값을 제공해야 하죠. 예를 들면 CPU 사용률이 몇% 였을 때 심각하고 위험한지를 각 항목별로 제공해야 합니다. Zenius SMS의 경우 사용자의 OS에 따라 감시 설정 항목(CPU 사용률, MEM 사용률 등)의 심각도와 임계치 조건은 어떻게 해야 하는지 기본적인 디폴트 값을 제공합니다. 더불어서 제니우스만의 최적의 감시 설정 가이드라인을 제공하여, 복잡한 설정 과정을 거치지 않더라도 모니터링할 수 있도록 도와주죠. 물론 기업과 조직의 환경에 맞춰 감시 설정을 조정할 수 있습니다. 필수적인 감시 설정 기능을 갖추고 있어야 한다 또한 SMS의 감시 항목을 설정할 때는 필요한 주요 기능으로 구성되어야 합니다. 사용자는 복잡한 설정 절차 없이 필요한 감시 항목을 설정해야 하고, 서버 관리에 소요되는 시간을 줄일 수 있어야 하기 때문이죠. 예를 들어 시스템의 중요한 지표(예: CPU 사용량, 메모리 사용량, 디스크 I/O 사용률)를 확인할 수 있는 감시 항목 설정이 있는지, 각 감시 항목에 대해 심각도 수준과 임계치를 설정할 수 있는지, 다양한 방식의 알림 방식 기능을 제공하는지 등을 직관적으로 확인할 수 있어야 합니다. Zenius SMS의 경우 사용자에게 꼭 필요한 기능(감시 항목, 서버, 심각도, 임계치, 알림 설정, 복구 스크립트 등)만 집중할 수 있도록 구성되어 있습니다. 감시 항목에서는 사용 중인 OS를 설정하고, 원하는 감시 항목을 선택하여, 원하는 서버를 감시 설정 할 수도 있죠. 또한 심각도와 임계치 설정에서는 무해-주의-위험-긴급-치명 각 값에 맞게 임계치 값을 설정할 수 있습니다. 예를 들어 '긴급'이라는 항목에 80%라고 설정했는데 임계치 값이 80%를 넘어설 경우, 사용자에게 즉각적으로 알려줍니다. 또한 지속시간을 1분 발생 횟수를 1이라고 설정할 경우, 1분을 넘길 때 사용자에게 알림을 통보해 주죠. 알림 통보 서비스가 잘 갖춰져 있어야 한다 감시 항목 설정 중 알림 통보는 서버를 관리하는 데 있어 매우 중요한 기능입니다. 서버에 문제점이 발생할 경우, 사용자에게 즉각적으로 알려줄 수 있는 장치이기 때문이죠. 또한 문제가 더 심각해지기 전에 신속하게 조치를 취할 수 있게 해주며, 시스템의 다운타임을 최소화하는 데 결정적인 역할을 합니다. 이 밖에도 알림 통보 기능에서는 사용자의 업무 환경과 선호도에 따라, 알림의 유형이나 수신자를 유연하게 선택할 수 있어야 합니다. Zenius SMS를 예를 들어 살펴보면 감시 설정에 임계값을 초과하거나, 예상치 못한 이벤트가 발생했을 때 다양한 형태로 알림 서비스를 제공하고 있습니다. 이메일, 문자 Push App은 물론 외부 연동을 통해 슬랙이나, 카카오톡으로도 편리하게 알람을 받아볼 수 있죠. 이 밖에도 알림의 임계값과 조건, 적용 시간이나 요일, 알림을 받을 사용자도 별도로 지정할 수 있습니다. 자동화 복구스크립트 기능을 제공해야 한다 서버에 문제가 감지되었을 때는 알림 통보 기능뿐만 아니라, 사전에 정의된 스크립트를 자동으로 실행하여 문제를 신속하게 해결할 수 있어야 합니다. 예를 들어 데이터베이스 서버의 응답 지연이 감지될 때 '캐시를 클리어하고 서비스를 재시작해 줘!'라는 스크립트 실행을 통해 즉각적으로 문제를 해결할 수 있어야 하죠. 이러한 자동화 복구스크립트 기능은 사용자가 알림을 받고 대응하기까지의 시간을 대폭 줄여줄 수 있고, 이에 따라 시스템 다운타임을 최소화할 수 있습니다. 또한 반복적이거나 단순한 문제 해결 과정을 자동화함으로써, 더 중요한 작업에 집중할 수 있겠죠. 위에 언급한 내용을 Zenius SMS를 통해 살펴보면, 장비에 장애가 발생할 경우 즉시 복구스크립트가 구동되어 문제를 자동적으로 해결할 수 있게 합니다. 예를 들어 A 서버에 임계치를 80%로 설정한 후, 복구스크립트를 통해 'C라는 방법으로 조치를 취해줘!'라고 미리 설정할 경우 자동적으로 문제를 해결할 수 있죠. 이러한 자동화 복구스크립트 기능은 수백 혹은 수천 대의 서버와 장비를 효율적으로 관리할 수 있어, 관리 부담을 줄이는 데 매우 효과적입니다. 또한 '정상 복구 시 통보' 옵션을 설정하면, 복구 스크립트가 완료됨에 따라 알림 통보를 사용자에게 재차 알려줍니다. 이 과정을 통해 사용자는 만족도와 제품에 대한 신뢰도를 높일 수 있겠죠. 감시 항목들을 한눈에 관리할 수 있어야 한다 이젠 앞에서 감시 설정하고 등록했던 감시 항목들을 모니터링할 수 있어야 하겠죠? 이때 중요한 점은 필수적인 감시 항목은 보여주되, UI는 단순화해야 한다는 점입니다. 이는 주요 감시 항목의 상태를 신속하게 파악하고, 문제가 발생했을 때 즉각적으로 대응하기 위해서죠. 또한 감시 항목 상태를 색상 코드(예: 녹색은 정상, 노란색은 경고, 빨간색은 심각)와 아이콘으로 구분하여, 사용자가 감시 항목의 상황을 즉각적으로 인식할 수 있도록 해야 합니다. Zenius SMS의 경우 주요 감시 항목들의 현황을 통합적으로 모니터링할 수 있습니다. 불필요한 항목들을 줄이고 핵심적인 항목들만 선별하여, 서버의 감시 항목을 신속하게 모니터링할 수 있죠. 감시 현황은 직관적인 UI가 중요한 만큼, 심각도 현황(정상-무해-주의-위험-긴급-치명)을 색상으로 구분하여 문제가 생겼을 때 신속하게 대응할 수 있도록 구성하였습니다. 또한 사용자의 환경에 맞춰 필수적인 감시 항목을 쉽게 선택하여 모니터링할 수 있습니다. 이 밖에도 많은 서버의 감시 항목을 관리하다 보면, 중요한 감시 항목을 추가하지 못한 상황이 발생할 수 있는데요. 최악의 경우에는 막대한 손실 비용 발생 등의 심각한 결과를 초래할 수 있겠죠. 이에 따라 감시 현황은 더더욱 직관적으로 모니터링할 수 있어야 합니다. 주요한 감시 항목을 실수로 설정하지 않더라도, 신속하게 파악하고 등록하여 대처할 수 있기 때문이죠. Zenius SMS는 감시 설정해 둔 항목 수가 예상과 다를 경우(예: 만약 관리하는 서버에 감시 항목이 2건이어야 하는데 → 1건으로 표기된 경우) 미등록 건 감시 항목을 조회하여 등록할 수 있습니다. 주요 감시 항목을 설정하고 동작여부에 '미등록' 항목으로 검색하면, 감시 설정하지 않은 항목을 조회할 수 있죠. 이처럼 Zenius SMS은 자칫 놓칠 수 있는 주요 감시 항목도 신속하게 찾아 등록할 수 있습니다. 。。。。。。。。。。。。 지금까지 살펴본 것처럼 Zenius와 같은 SMS를 통해서 서버를 한눈에 모니터링하고, 감시 설정 기능을 통해 체계적으로 관리하며, 문제 발생 시 다양한 알림과 자동화된 복구스크립트로 문제점을 신속히 해결해야 합니다. Zenius SMS 대규모 서버자원을 관리하고 있는 한 고객사 관계자의 말씀으로 이 글을 마무리하려고 합니다. "이 많은 서버의 감시 항목들을 휴일 없이 24시간 동안 지켜볼 수는 없잖아요. 그래서 서버를 통합 관리할 수 있는 Zenius SMS을 도입했죠. 이용하면서 좋았던 점은 감시 현황 페이지를 통해 한눈에 감시 항목을 관리할 수 있어 편리하다는 점이에요. 감시 설정을 걸어둔 항목들이 많아 종종 등록을 못한 경우가 발생해도, 직관적으로 확인하고 감시 항목을 추가할 수 있어요. 특히 복구 스크립트 기능을 애용하는 편인데요. 서버에 장애가 발생했을 때 복구 스크립트를 미리 걸어두면, 장비에 장애가 발생해도 신속하게 문제 해결을 할 수 있어 매우 만족스럽습니다!"
2024.02.22
1
2
3
4
5
6
7
8
9
10