반복영역 건너뛰기
주메뉴 바로가기
본문 바로가기
제품/서비스
EMS Solution
Features
클라우드 관리
서버관리
데이터베이스 관리
네트워크 관리
트래픽 관리
설비 IoT 관리
무선 AP 관리
교환기 관리
운영자동화
실시간 관리
백업 관리
스토리지 관리
예방 점검
APM Solution
애플리케이션 관리
URL 관리
브라우저 관리
ITSM Solution
서비스데스크
IT 서비스 관리
Big Data Solution
SIEM
AI 인공지능
Dashboard
대시보드
Consulting Service
컨설팅 서비스
고객
레퍼런스
고객FAQ
문의하기
가격
자료실
카탈로그
사용자매뉴얼
회사소개
비전·미션
연혁
2016~현재
2000~2015
인증서·수상
투자정보
재무정보
전자공고
IR자료
새소식
공고
보도자료
오시는 길
채용
피플
컬처
공고
FAQ
블로그
열기
메인 페이지로 이동
블로그
최신이야기
블로그
최신이야기
사람이야기
회사이야기
기술이야기
다양한이야기
브레인즈컴퍼니 ‘2023 소프트웨어대전’ 참가
클라우드(Cloud) 관리와 AWS가 뭔가요?
이운형
2023.11.16
페이스북 공유하기
트위터 공유하기
링크드인 공유하기
블로그 공유하기
[행사] 브레인즈컴퍼니 전략사업본부 ‘happy 호프데이’
오늘날 IT 인프라 운영환경은 매우 복잡해졌어요. 갑작스러운 환경 변화에 따라 신속한 대응도 필요한 시점이죠. 이러한 현상으로 많은 기업들이
온프레미스(On-premise) 환경에서 클라우드(Cloud) 환경으로 전환하는 추세
이기도 해요.
클라우드 컴퓨팅 서비스 중에는 여러 벤더가 있는데요. 대표적으론 Amazon Web Services(AWS), Microsoft Azure, Google Cloud Platform(GCP)가 있어요.
그중 ‘AWS’는 국내 클라우드 시장에서 3년 간 70% 내외의 시장점유율로, 1위를 차지했는데요
(*클라우드 서비스 분야 실태조사(2022), 공정거래위원회)
이처럼 높은 점유율을 가진
1) AWS의 주요 서비스를 살펴보고 2) 하이브리드 클라우드 모니터링이 필요한 이유는 무엇인지 3) AWS의 각종 서비스를 모니터링할 수 있는 제니우스(Zenius)
도 함께 소개해 드릴게요!
AWS(Amazon Web Services)란?
AWS는 ‘Amazon Web Services’의 약어로, 아마존 닷컴이 제공하는 클라우드 컴퓨팅 플랫폼 및 서비스의 집합이에요. AWS에서 제공하는 여러 가지 서비스를 이용하면, 기업 및 개인이 필요한 컴퓨팅 리소스를 유연하게 확장하고 관리할 수 있죠. AWS 주요 서비스는 다음과 같아요!
AWS 주요 서비스
▪
Amazon VPC
(Amazon Virtual Private Cloud)
격리된 네트워크 환경을 구성하게 해주는 서비스예요. AWS의 동일 계정이나, 서로 다른 계정 간에 격리된 네트워크를 연결할 수 있도록 다양한 옵션들을 제공해 줘요.
▪
Amazon EC2
(Amazon Elastic Compute Cloud)
AWS에서 가장 많이 사용되는 컴퓨팅 서비스예요. 가상 서버를 호스팅 할 때 사용하죠. 리눅스나 윈도우 환경 등 다양한 인스턴스 유형을 지원하고, 필요에 따라 성능을 조정할 수 있어요. 생성 가능한 인스턴스 타입은 리전 별 차이가 있으나, 100개~300개에 이를 정도로 방대하답니다.
▪AWS Lambda
AWS에서 제공하는 서버리스 컴퓨팅 플랫폼이에요. 여기서 ‘서버리스’란 개발자가 서버의 존재를 신경 쓸 필요가 없다는 뜻이에요. AWS에서는 서버 인프라에 대한 프로비저닝, 유지관리 등을 대신 처리해 주죠. 이처럼 개발자가 비즈니스 로직에 집중하여 코드를 실행하게 해줘요.
▪Amazon S3
AWS에서 제공하는 스토리지 서비스예요. S3는 파일시스템이 아닌 오브젝트 스토리지 서비스로, 모든 파일에 API를 통해 접근 가능해요. 무제한적인 확장성, 높은 가용성과 내구성을 제공하며 단일 파일을 최대 5TB까지 업로드할 수 있어요.
▪Amazon EBS
(Amazon Elastic Block Store)
EC2 인스턴스에 장착하여 사용할 수 있는 가상 저장 장치에요. EBS를 연결하여 파일을 저장하면, EC2 인스턴스와 관계없이 데이터를 영구적으로 보관 가능해요. 이 밖에도 AWS에서 제공하는 서비스는 매우 방대한대요. 아래 URL로 접속 시, 필요한 서비스 목록 확인이 가능하답니다!
?
더 많은 AWS 서비스가 궁금하다면?
온프레미스와 AWS의 차이
온프레미스 방식은, 클라우드 컴퓨팅 서비스가 나오기 전까지 기업에서 전통적으로 사용한 ‘일반적인 인프라 구축 방식’이에요. 온프레미스 환경에서 서버를 운영하면, 호스팅 서비스를 이용하거나 서버를 직접 구매 또는 임대하죠. 그다음 데이터 센터(IDC, Internet Data Center) 또는 기업 전산실에 설치하여 운영해요.
하지만 물리적인 서버를 직접 설치할 경우, 많은 시간과 비용이 소모되어 이를 위한 운영 공간과 인력이 필요할 수 있어요.
예시를 들어 볼게요. 대형 콘서트 예매, 대학교 수강신청, 입시 원서 접수 등 단기간에 트래픽이 급증했다가 감소되는 경우를 생각해 볼까요? 이때 ‘온프레미스 방식’으로 시스템을 구축한다면, 매우 많은 비용 낭비가 발생하게 될 거예요.
반면 AWS의 경우는 어떨까요? 인터넷이 연결된 어디에서든 쉽게 인프라를 구축하고, 사용한 만큼 비용을 지불할 수 있어요. 큰 이벤트를 처리한 후 생성된 리소스를 간편하게 삭제할 수 있죠. 이처럼 온프레미스 방식과 대비한다면, 남는 자원에 대한 비용 고민이 없어지겠죠?
하이브리드 클라우드 모니터링이 필요한 이유
이처럼 AWS는 매우 유연하고 확장성 있는 클라우드 서비스예요. 하지만 모든 서비스를 AWS를 이용해서 서비스하는 것은 한계가 있는데요. 이유는 다음과 같아요.
▪보안 및 규정 준수
민감한 데이터나 규정 준수가 필요한 업무의 경우, 사설 클라우드나 온프레미스 환경의 자체 데이터 센터를 통해 운영하려는 경향이 있어요.
▪비용 효율
AWS는 사용한 만큼 비용을 지불하기 때문에, 예측할 수 없는 트래픽 증가 등에 대응하기에 좋아요. 하지만 서비스에 따라 온프레미스 환경에서 운영하는 것이 비용 측면에서 더 효율적인 경우가 있죠.
이처럼 많은 기업이 AWS를 이용한 클라우드 서비스로 전환하는 추세지만, 당분간 온프레미스 방식과 결합한 하이브리드 클라우드 운영환경이 많은 편이에요.
그렇다면 이러한 하이브리드 클라우드 운영 환경을 모니터링할 수 있는 방법이 없을까요? 바로
‘제니우스’를 활용한다면
가능해요!
제니우스를 이용한 하이브리드 클라우드 모니터링 구성도
제니우스 하이브리드 클라우드 모니터링 프로세스를 간략히 소개할게요!
우선
클라우드 환경
단계에서는 AWS 서비스를 이용하여 구축된 클라우드 환경 정보를 RestAPI 방식으로 수집해요.
CMS Manager
는 AWS 클라우드 환경에서 수집한 정보를 취합 후 스토리지에 저장해 주죠.
EMS Manager
는 온프레미스 환경에서 수집한 정보를 취합 후 스토리지에 저장해 줘요.
Web UI
에서는 스토리지에 저장된 데이터를 이용하여, 사용자에게 모니터링 정보를 제공한답니다!
제니우스에서 AWS 모니터링하기
제니우스를 이용한 ‘하이브리드 클라우드 모니터링 구성’을 좀 더 자세히 살펴볼까요?
▪CMS > 모니터링 > 요약 :
위 그림은
AWS 통합 요약
페이지인데요. EC2, RDS, VPC 등 과금 현황까지 통합 모니터링할 수 있어요.
▪EMS > 토폴로지 > 클라우드 맵 :
리전 별 자동 구성형 클라우드 맵 페이지에서는, AWS 리전 별 이용하는 서비스와 연관관계를 클라우드 맵이 자동으로 구성해 줘요.
▪
CMS > 클라우드서비스 > EC2 > 주요 성능 지표 :
주요 성능지표 모니터링
페이지에서는 AWS 콘솔에 접속하지 않고, AWS 주요 성능 지표에 대한 모니터링 추이를 확인할 수 있어요.
▪EMS > 오버뷰 :
오버뷰를 통한 온프레미스 + AWS 통합 모니터링
페이지에서는, AWS 모니터링 항목과 온프레미스 환경 모니터링 항목의 통합 현황판을 확인할 수 있어요.
이처럼 AWS와 온프레미스 환경은 물론, 더 다양한 환경의 인프라 모니터링을 위해 제니우스를 사용을 해보는 건 어떨까요?
#클라우드
#AWS
#Cloud
#브레인즈컴퍼니
#클라우드컴퓨팅
#제니우스
#AWS클라우드
#하이브리드클라우드
이운형
Technical Consulting팀
Technical Consulting팀에서 제품구축과 유지보수 업무를 수행하고 있습니다.
필진 글 더보기
목록으로
추천 콘텐츠
이전 슬라이드 보기
이상 징후 탐지 솔루션, Zenius AI의 주요기능과 특장점
이상 징후 탐지 솔루션, Zenius AI의 주요기능과 특장점
IT 인프라의 복잡성과 운영 환경이 점점 더 고도화됨에 따라, 시스템 장애를 사전에 탐지하고 선제적으로 대응하는 기술의 중요성이 크게 부각되고 있습니다. 기존의 장애 관리 방식은 주로 장애 발생 이후에 원인을 분석하고 복구 조치를 취하는 사후 대응(Post-Mortem Response) 중심이었습니다. 그러나 이러한 접근 방식은 서비스 다운타임 증가, 운영 비용 상승, 장애의 반복 발생과 같은 문제를 야기하며, 기업의 디지털 운영 안정성을 위협합니다. Zenius AI는 이러한 한계를 극복하기 위해 머신러닝 기반의 이상징후 탐지 및 장애 예측 기능을 제공하는 이상 징후 탐지 솔루션입니다. 대규모 IT 인프라 환경에서 수집되는 로그, 메트릭, 이벤트 데이터를 실시간으로 분석하여 정상 패턴에서 벗어나는 이상 징후를 조기에 감지하고, 잠재적인 장애를 사전에 예측할 수 있도록 지원하는 Zenius AI의 주요기능과 특장점을 자세히 알아보겠습니다. 이상 징후 탐지 솔루션, Zenius AI의 주요 기능 Zenius AI는 IT 운영 환경에서 이상징후를 실시간으로 감지하고 대응할 수 있도록 설계된 AI 기반의 모니터링 솔루션입니다. 이 솔루션은 데이터 수집 및 관리, AI 모델 학습 및 예측, 이상징후 감지 및 대응, 대시보드 시각화 및 운영관리의 네 가지 핵심 기능을 제공합니다. 1) 데이터 수집 및 관리 Zenius AI는 Kafka 기반의 고성능 메시징 시스템과 OpenSearch 기반의 스토리지 및 검색 엔진을 통해, 대규모 로그 및 메트릭 데이터를 실시간으로 안정적이고 유실 없이 수집할 수 있도록 설계되었습니다. 이를 통해 시스템 전반에서 발생하는 다양한 이벤트 및 상태 정보를 정밀하게 추적하고, 이상징후 탐지에 최적화된 정제된 학습용 데이터셋을 구축할 수 있습니다. 특히 Zenius EMS(Enterprise Monitoring System)와의 직접적인 연동 기능을 제공함으로써, 서버, 네트워크, 애플리케이션 등 다양한 IT 인프라에서 생성되는 실시간 성능 데이터를 효과적으로 수집할 수 있습니다. 이를 통해 기존 IT 운영 환경과 유기적으로 연결된 데이터 수집·분석 체계를 구현할 수 있으며, 수집된 데이터를 기반으로 한 AI 기반 이상징후 탐지 및 선제적 대응 체계 구축이 가능해집니다. 또한, 데이터 수집 단계에서부터 AI 학습 및 예측 모델 구축에 이르기까지 전체 파이프라인이 긴밀하게 통합되어 있어, 운영 효율성과 데이터 신뢰성을 동시에 확보할 수 있는 것이 Zenius AI의 큰 강점입니다. 2) AI 모델 학습 및 예측 Zenius AI는 시계열 데이터 기반의 정밀한 이상징후 탐지를 위해 Amazon Web Services(AWS)에서 제공하는 DeepAR 시계열 예측 모델을 활용합니다. DeepAR은 다수의 시계열 데이터를 동시에 처리하고, 시간 축을 따라 변화하는 패턴을 학습하여 정상 범위를 벗어나는 이상 징후를 사전에 감지할 수 있도록 지원합니다. 이를 통해 단순 임계값 기반 감지를 넘어선 지능형 예측 분석이 가능해집니다. 또한, Zenius AI는 AutoGluon 기반의 AutoML 기능을 통합하여 모델 개발 전반을 자동화합니다. 하이퍼파라미터 최적화, 특성 선택, 다양한 알고리즘 기반 학습 등을 자동으로 수행하고, 정확도 기준에 따라 최적의 모델을 자동으로 선택함으로써 분석 정확도와 효율성을 동시에 향상시킵니다. 데이터의 특성과 계절성이 반영된 학습 모델은, 각 서비스에 맞는 맞춤형 예측 알고리즘으로 적용되며, 모델 자동 배포, 버전 관리, 스케줄 기반 재학습 기능을 통해 지속적으로 개선되고 고도화됩니다. 3) 이상 징후 감지 및 대응 Zenius AI는 머신러닝 기반의 시계열 예측 모델을 활용하여, 시간에 따라 변화하는 메트릭 데이터의 정상적인 흐름을 학습하고, 예측값과 실제 관측값 간의 오차를 분석함으로써 예상 범위를 벗어나는 이상징후를 조기에 감지합니다. 이 방식은 단순한 임계치 설정을 넘어서, 모델이 정상 상태를 스스로 학습하고 예외 상황을 자동으로 판별함으로써, 더 높은 민감도와 신뢰성을 갖춘 예측 기반 감지 체계를 구현합니다. 또한, 감지된 이상징후에 대해 이벤트의 심각도를 자동 분류하고, 사전에 정의된 조건에 따라 이메일, 문자, 사운드 등 다양한 채널을 통한 실시간 알림을 제공함으로써, 운영자가 신속하게 대응할 수 있도록 지원합니다. 뿐만 아니라, Zenius AI는 메트릭 기반 탐지 외에도 로그 기반 이상징후 감지 기능을 제공합니다. 특히, 로그가 정상적으로 수집되지 않거나 누락될 경우를 실시간으로 탐지하는 로그 미수집 감지 기능을 통해, 분석에 필요한 데이터의 공백을 사전에 차단하고 이상 탐지 누락을 방지할 수 있습니다. 이 기능은 장애의 근본 원인을 조기에 식별하는 데 중요한 역할을 하며, 호스트 단위의 로그 수집 현황을 시각화하여 운영자가 이상 상황을 한눈에 파악하고 조치할 수 있도록 지원합니다. 4) 대시보드 및 시각화 기능 Zenius AI는 실시간 이상징후 감지 결과를 직관적으로 파악할 수 있도록, 고도화된 대시보드 및 시각화 기능을 제공합니다. 서비스 그룹, 호스트, 모델별로 논리적으로 구성된 시각화 컴포넌트를 통해, 운영자는 전체 IT 인프라의 상태와 이상징후 발생 현황을 한눈에 파악할 수 있으며, 각종 지표에 대한 심층 분석도 즉각적으로 수행할 수 있습니다. 또한, WYSIWYG(What You See Is What You Get) 기반의 시각 보고서 생성 기능을 통해, 이상징후 탐지 결과와 예측 데이터를 시각적으로 정리하고, 이를 분기별 보고서, 사용자 정의 통계 리포트 등 다양한 형식으로 출력할 수 있어 IT 운영팀 및 경영진과의 효율적인 커뮤니케이션과 의사결정을 지원합니다. 운영관리 측면에서는 사용자 권한 및 알림 통보 설정 기능이 포함되어 있어, 역할 기반 접근 제어(RBAC)를 통해 사용자별 접근 권한을 세밀하게 관리할 수 있습니다. 장애 또는 이상 이벤트 발생 시에는 이메일, 문자, 사운드 알람 등 다양한 매체를 통해 실시간 경보를 전송하고, 알림의 심각도, 전송 시간대, 수신자 그룹 등을 세분화하여 설정할 수 있어 운영의 유연성과 대응 속도를 크게 향상시킵니다. 이상 징후 탐지 솔루션, Zenius AI의 특장점 Zenius AI는 실시간 데이터 분석 역량과 AI 기반 모델 최적화 기능을 결합한 차세대 이상징후 탐지 솔루션으로, 기존 시스템 대비 한층 정교하고 신속한 대응 체계를 제공합니다. 이를 통해 IT 운영 환경에서 보다 신뢰도 높은 장애 예측과 효율적인 운영 관리가 가능해집니다. 첫째, Zenius AI는 초고속 인덱싱 및 검색 성능을 통해 대규모 로그 데이터를 실시간으로 분석할 수 있습니다. 최대 162만 EPS(Events Per Second)의 로그 인덱싱 처리 속도를 제공하며, 1TB 규모의 로그도 단 0.02초 내에 검색할 수 있어, 장애 발생 시 즉각적인 원인 진단과 대응이 가능합니다. 또한, 대용량 환경에서도 로그 유실 없이 안정적인 저장 및 분석이 가능하여, 운영 신뢰성과 가용성을 크게 향상시킵니다. 둘째, Zenius AI는 AI 기반의 자동화된 모델 관리 기능을 갖추고 있어, 모델의 학습, 최적화, 배포를 전 과정 자동화할 수 있습니다. 수작업 없이도 성능을 지속적으로 개선할 수 있으며, 스케줄 기반 학습 관리를 통해 최신 데이터를 반영한 정기적 모델 업데이트가 가능합니다. 또한, Zenius EMS(Enterprise Monitoring System) 및 다양한 3rd Party 시스템과의 연동 기능을 통해 기존 IT 인프라와 유기적으로 통합된 분석 환경을 구현할 수 있습니다. 셋째, 머신러닝 기반의 이상징후 조기 탐지 및 대응 체계를 통해 서비스 장애를 사전에 감지하고 신속하게 대응할 수 있습니다. 예측값과 실제값의 오차 기반 분석을 통해 정밀한 이상징후를 탐지하며, 장애 패턴 분석 기능을 통해 유사 장애의 반복 가능성을 최소화합니다. 이를 통해 운영자는 보다 체계적이고 선제적인 장애 대응이 가능하며, 전체 IT 서비스의 안정성과 연속성을 효과적으로 유지할 수 있습니다. Zenius AI는 AI 기반의 이상징후 탐지를 통해 IT 운영의 효율성을 높이고, 장애를 사전에 방지할 수 있도록 지원합니다. 머신러닝 기반의 학습과 장애 패턴 분석을 통해 장애 재발 가능성을 최소화하고, 선제적인 예방 및 대응 체계를 구축함으로써 장애 원인을 조기에 차단할 수 있습니다. 이를 통해 서비스 다운타임을 최소화하고, 안정적인 운영 환경을 유지하여 서비스품질과 신뢰도를 향상시킵니다. 또한, Zenius AI는 운영 비용 절감과 IT 생산성 향상에도 기여합니다. 장애 처리에 소요되는 인력과 시간을 절감해 운영팀이 핵심 업무에 집중할 수 있도록 돕고, 자동화된 감지 및 대응 시스템을 통해 전반적인 운영 부담을 효과적으로 완화합니다. 이상 징후 탐지 솔루션 Zenius AI도입을 통해 IT 운영의 안정성과 효율성을 강화하고, 보다 신뢰도 높은 서비스 환경을 구축하시기 바랍니다.
2025.04.03
다음 슬라이드 보기