반복영역 건너뛰기
주메뉴 바로가기
본문 바로가기
제품/서비스
EMS Solution
Features
클라우드 관리
AI 인공지능
서버관리
데이터베이스 관리
네트워크 관리
트래픽 관리
설비 IoT 관리
무선 AP 관리
교환기 관리
운영자동화
실시간 관리
백업 관리
APM Solution
애플리케이션 관리
URL 관리
ITSM Solution
서비스데스크
IT 서비스 관리
Big Data Solution
SIEM
Dashboard
대시보드
Consulting Service
컨설팅 서비스
고객
레퍼런스
고객FAQ
문의하기
가격
자료실
카탈로그
사용자매뉴얼
회사소개
비전·미션
연혁
2016~현재
2000~2015
인증서·수상
투자정보
재무정보
전자공고
IR자료
새소식
공고
보도자료
오시는 길
채용
피플
컬처
공고
FAQ
블로그
열기
메인 페이지로 이동
블로그
기술이야기
블로그
최신이야기
사람이야기
회사이야기
기술이야기
다양한이야기
카프카를 통한 로그 관리 방법
메모리 누수 위험있는 FinalReference 참조 분석하기
김진광
2023.10.12
페이스북 공유하기
트위터 공유하기
링크드인 공유하기
블로그 공유하기
[행사] 브레인즈컴퍼니 ‘가을문화행사 2023’
Java에서 가장 많이 접하는 문제는 무엇이라 생각하시나요? 바로 리소스 부족 특히 ‘JVM(Java Virtual Machine) 메모리 부족 오류’가 아닐까 생각해요.
메모리 부족 원인에는 우리가 일반적으로 자주 접하는 누수, 긴 생명주기, 다량의 데이터 처리 등 몇 가지 패턴들이 있는데요. 오늘은 좀 일반적이지 않은(?) 유형에 대해 이야기해 볼게요!
Java 객체 참조 시스템은 강력한 참조 외에도 4가지 참조를 구현해요. 바로 성능과 확장성 기타 고려사항에 대한 SoftReference, WeakReference, PhantomReference, FinalReference이죠. 이번 포스팅은
FinalReference를 대표적인 사례
로 다루어 볼게요.
PART1. 분석툴을 활용해 메모리 누수 발생 원인 파악하기
메모리 분석 도구를 통해 힙 덤프(Heap Dump)를 분석할 때, java.lang.ref.Finalizer 객체가 많은 메모리를 점유하는 경우가 있어요. 이 클래스는 FinalReference와 불가분의 관계에요. 나눌 수 없는 관계라는 의미죠.
아래 그림 사례는 힙 메모리(Heap Memory)의 지속적인 증가 후 최대 Heap에 근접 도달 시, 서비스 무응답 현상에 빠지는 분석 사례인데요. 이를 통해 FinalReference 참조가 메모리 누수를 발생시킬 수 있는 조건을 살펴볼게요!
Heap Analyzer 분석툴을 활용하여, 힙 덤프 전체 메모리 요약 현황을 볼게요. java.lang.ref.Finalizer의 점유율이 메모리의 대부분을 점유하고 있죠. 여기서 Finalizer는, 앞에서 언급된 FinalReference를 확장하여 구현한 클래스에요.
JVM은 GC(Garbage Collection) 실행 시 해제 대상 객체(Object)를 수집하기 전, Finalize를 처리해야 해요.
Java Object 클래스에는 아래 그림과 같이 Finalize 메서드(Method)가 존재하는데요. 모든 객체가 Finalize 대상은 아니에요.
JVM은 클래스 로드 시, Finalize 메서드가 재정의(Override)된 객체를 식별해요. 객체 생성 시에는 Finalizer.register() 메서드를 통해, 해당 객체를 참조하는 Finalizer 객체를 생성하죠.
그다음은 Unfinalized 체인(Chain)에 등록해요. 이러한 객체는 GC 발생 시 즉시 Heap에서 수집되진 않아요. Finalizer의 대기 큐(Queue)에 들어가 객체에 재정의된 Finalize 처리를 위해 대기(Pending) 상태에 놓여있죠.
위 그림과 같이 참조 트리(Tree)를 확인해 보면, 많은 Finalizer 객체가 체인처럼 연결되어 있어요. 그럼 Finalizer 객체가 실제 참조하고 있는 객체는 무엇인지 바로 살펴볼까요?
그림에 나온 바와 같이 PostgreSql JDBC Driver의 org.postgresql.jdbc3g.Jdbc3gPreparedStatement인 점을 확인할 수 있어요. 해당 시스템은 PostgreSql DB를 사용하고 있었네요.
이처럼 Finalizer 참조 객체 대부분은 Jdbc3gPreparedStatement 객체임을 알 수 있어요. 여기서 Statement 객체는, DB에 SQL Query를 실행하기 위한 객체에요.
그렇다면, 아직 Finalize 처리되지 않은 Statement 객체가 증가하는 이유는 무엇일까요?
먼저 해당 Statement 객체는 실제로 어디서 참조하는지 살펴볼게요. 해당 객체는 TimerThread가 참조하는 TaskQueue에 들어가 있어요. 해당 Timer는 Postgresql Driver의 CancelTimer이죠.
해당 Timer의 작업 큐를 확인해 보면 PostgreSql Statement 객체와 관련된 Task 객체도 알 수도 있어요.
그럼 org.postgresql.jdbc3g.Jdbc3gPreparedStatement 클래스가 어떻게 동작하는지 자세히 알아볼까요?
org.postgresql.jdbc3g.Jdbc3gPreparedStatement는 org.postgresql.jdbc2.AbstractJdbc2Statement의 상속 클래스이며 finalize() 메서드를 재정의한 클래스에요. Finalize 처리를 위해 객체 생성 시, JVM에 의해 Finalizer 체인으로 등록되죠.
위와 같은 코드로 보아 CancelTimer는, Query 실행 후 일정 시간이 지나면 자동으로 TimeOut 취소 처리를 위한 Timer에요.
정해진 시간 내에 정상적으로 Query가 수행되고 객체를 종료(Close) 시, Timer를 취소하도록 되어 있어요. 이때 취소된 Task는 상태 값만 변경되고, 실제로는 Timer의 큐에서 아직 사라지진 않아요.
Timer에 등록된 작업은, TimerThread에 의해 순차적으로 처리돼요. Task는 TimerThread에서 처리를 해야 비로소 큐에서 제거되거든요.
이때 가져온 Task는 취소 상태가 아니며, 처리 시간에 아직 도달하지 않은 경우 해당 Task의 실행 예정 시간까지 대기해야 돼요.
여기서 문제점이 발생해요.
이 대기 시간이 길어지면 TimerThread의 처리가 지연되기 때문이죠. 이후 대기 Task들은 상태 여부에 상관없이, 큐에 지속적으로 남아있게 돼요.
만약 오랜 시간 동안 처리가 진행되지 않는다면, 여러 번의 Minor GC 발생 후 참조 객체들은 영구 영역(Old Gen)으로 이동될 수 있어요.
영구 영역으로 이동된 객체는, 메모리에 즉시 제거되지 못하고 오랜 기간 남게 되죠. 이는 Old(Full) GC를 발생시켜 시스템 부하를 유발하게 해요. 실제로 시스템에 설정된 TimeOut 값은 3,000초(50분)에요.
Finalizer 참조 객체는 GC 발생 시, 즉시 메모리에서 수집되지 않고 Finalize 처리를 위한 대기 큐에 들어가요. 그다음 FinalizerThread에 의해 Finalize 처리 후 GC 발생 시 비로소 제거되죠. 때문에 리소스의 수집 처리가 지연될 수 있어요.
또한 FinalizerThread 스레드는 우선순위가 낮아요. Finalize 처리 객체가 많은 경우, CPU 리소스가 상대적으로 부족해지면 개체의 Finalize 메서드 실행을 지연하게 만들어요. 처리되지 못한 객체는 누적되게 만들죠.
요약한다면 FinalReference 참조 객체의 잘못된 관리는
1) 객체의 재 참조를 유발 2) 불필요한 객체의 누적을 유발 3) Finalize 처리 지연으로 인한 리소스 누적을 유발
하게 해요.
PART2.
제니우스 APM을 통해 Finalize 객체를 모니터링하는 방법
Zenius APM에서는 JVM 메모리를 모니터링하고 분석하기 위한, 다양한 데이터를 수집하고 있어요. 상단에서 보았던
FinalReference 참조 객체의 현황에 대한 항목도 확인
할 수 있죠.
APM 모니터링을 통해 Finalize 처리에 대한 문제 발생 가능성도
‘사전’
에 확인
할 수 있답니다!
위에 있는 그림은 Finalize 처리 대기(Pending)중인 객체의 개수를 확인 가능한 컴포넌트에요.
이외에도 영역별 메모리 현황 정보와 GC 처리 현황에 대해서도 다양한 정보를 확인 할 수 있어요!
이상으로 Finalize 처리 객체에 의한 리소스 문제 발생 가능성을, 사례를 통해 살펴봤어요. 서비스에 리소스 문제가 발생하고 있다면, 꼭 도움이 되었길 바라요!
------------------------------------------------------------
©참고 자료
◾ uxys, http://www.uxys.com/html/JavaKfjs/20200117/101590.html
◾ Peter Lawrey, 「is memory leak? why java.lang.ref.Finalizer eat so much memory」, stackoverflow, https://stackoverflow.com/questions/8355064/is-memory-leak-why-java-lang-ref-finalizer-eat-so-much-memory
◾ Florian Weimer, 「Performance issues with Java finalizersenyo」, enyo,
https://www.enyo.de/fw/notes/java-gc-finalizers.html
------------------------------------------------------------
#APM
#Finalize
#제니우스
#메모리 누수
#Zenius
#FinalReference
#제니우스 APM
김진광
APM팀(개발3그룹)
개발3그룹 APM팀에서 제품 개발과 기술 지원을 담당하고 있습니다.
필진 글 더보기
목록으로
추천 콘텐츠
이전 슬라이드 보기
2022 상반기 New Brainzer 인터뷰 | (1) 개발자 편
2022 상반기 New Brainzer 인터뷰 | (1) 개발자 편
2022년, 브레인즈컴퍼니에는 새로운 브레인저들이 많이 입사했습니다. 특히, 사업을 확장하며 개발자들이 대거 들어왔는데요. 그 중, 상반기에 입사해 6개월 이상 재직 중인 개발자들을 모아 브레인즈를 선택한 이유, 입사 후 느끼는 브레인즈의 매력 등에 대한 이야기를 나눴습니다. 브레인즈컴퍼니에 입사하길 원하는 개발자분들, 주목해주세요! Question List 1. 자기소개 2. 업무소개 3. 브레인즈컴퍼니를 선택한 이유 4. 브레인즈의 매력 5. 성장을 느꼈던 순간 6. 브레인즈에서 이루고 싶은 목표 7. 예비 브레인저에게 한 마디 1. 안녕하세요, 브레인즈컴퍼니 개발 3그룹 위성조입니다. 저는 대학에서 컴퓨터공학을 전공했고 졸업 전에 4개월 정도 다른 곳에서 인턴 생활 후, 입사한지 10개월 정도 됐습니다. 2. 저는 현재 회사의 주력 제품인 제니우스의 차세대를 만드는 팀에서 백엔드 개발자로 일하고 있습니다. 처음 입사 당시에는 프론트엔드 개발자로 입사해 동료들과 함께 페이지의 여러 컴포넌트 및 데이터 처리 로직을 제작했었는데, 우연히 기회가 닿아서 백엔드 개발자로 직무전환 할 수 있었습니다. 백엔드 개발자로서 프론트엔드 개발자 동료들과 협력해, 기존 제니우스에서 지원하던 기능 혹은 새로운 기능들을 추가하거나 기존에 작성됐던 코드들을 개선하는 작업들을 하고 있어요. 3. 인턴 생활 당시에 대시보드에 관해 접할 기회가 있었는데, 꽤나 마음에 들어서 관련 분야에서 일해 보고 싶다는 생각을 했었습니다. 마침 취업을 준비하는 기간에 모니터링 솔루션 국내 1위 업체(브레인즈컴퍼니)에서 올린 채용 공고를 보게 됐고, 관련 업무를 할 수 있을 것 같아 지원했어요. 면접 당시 면접관님이 지금 부서의 부서장님이셨는데, 질의를 주고받는 과정에서 합이 잘 맞았던 것 같아 이 회사에 들어오고 싶다고 생각했었는데, 다행히 합격할 수 있었습니다. 4. 조식과 전자동 에스프레소 머신 포함 각종 음료가 무제한 제공되는 복지가 있고, 업무적으로 수평적인 분위기에서 자유로운 의견 교환이 가능하다는 장점이 있습니다. 제가 있는 개발 3그룹은 최근 저를 포함한 신입분들을 대규모로 신규 채용해, 같은 나이대의 동료들이 매우 많고 운 좋게도 다들 주변과 잘 어울리는 성격이라 부서 분위기가 매우 좋아요. 5. 제가 올린 Pull Request가 머지됐을 때, 제 의견이 맞다고 인정받았을 때, 새로 배운 기술•기능•기법 등을 사용해 이전엔 어려웠던 구현을 간단하게 혹은 효율적으로 완성했을 때, 직무 전환 후 새로운 업무에 적응한 내 모습을 볼 때 등이 있습니다. 6. 우선적으로 제가 제작에 참여한 차세대 제니우스가 시장에 나가서 활약하는 모습을 보고 싶고, 차세대 제니우스가 완성될 즈음에는 제가 사용한 기술 스택 중 한 가지라도 익숙해져서 ‘전문가’ 라는 타이틀이 어색하지 않은 개발자가 되고 싶습니다. 7. 화려한 기술도 좋지만 왜 이 기술을 선택했는지, "이렇게 하면 되더라" 보다 이게 어떻게 되는지 등 기본적이고 본질적인 내용에 충실하시면 좋은 결과 있으실 거라고 생각합니다. 1. 개발 3그룹에 소속돼 있으며, 소프트웨어를 전공한 1년차 개발자 김현수입니다. 대학교 졸업 후 1년 정도 취업 준비를 하다가 브레인즈컴퍼니에 입사하게 됐어요. 2. 저는 현재 서비스되고 있는 제니우스의 차세대 버전인 제니우스 뉴 제너레이션(이하 ZNG)의 프론트엔드를 개발하고 있습니다. 프로그램의 뼈대가 되는 화면 설계, 기능 개발 등을 하고 있습니다. 사용자가 직접 만지고 경험하는 화면을 개발한다는 점에서 사용자와 가장 직접적으로 소통하는 개발자라고 할 수 있겠습니다. 3. 새로운 프로젝트인 ZNG에 초기부터 투입돼 개발을 많이 할 수 있고, 이를 통해 실력적으로 높은 성장을 할 수 있을 것이라고 기대했습니다. 주변 개발자 친구들에게 물어봤을 때 일반적으로 유지보수나 버그 리포트를 하는 경우가 많은데 그에 비해서 '절대적으로 개발하는 시간'이 압도적으로 많아요. 4. 회사가 임직원에게 해줄 수 있는 가장 큰 복지는 '좋은 동료'라고 생각합니다. 실력적으로나, 인성적으로나 말입니다. 그런 측면에서 브레인즈컴퍼니는 높은 수준의 복지를 제공하고 있습니다. 코드리뷰를 하거나 얘기를 나눌 때마다 동료들로부터 배울게 많다고 항상 느껴요. 5. 가끔 코드가 마음에 들지 않아 고치려고 보면 과거에 제가 짰던 코드였던 적이 종종 있습니다. 아마 지금 짜는 코드도 몇 년 후에는 같은 생각으로 고치고 있겠죠?ㅎㅎ 6. ZNG 개발을 무사히 완료해 실제 서비스되는 ZNG를 보고 싶습니다. 그리고 꾸준히 유지보수를 해야겠죠?ㅎㅎ 7. 개인적으로 브레인즈컴퍼니의 개발 문화에 대해서 굉장히 만족하고 있습니다. 코드 리뷰를 통해 개발자 관점에서 높은 수준의 코딩을 하기 위해 노력하고 있습니다. 직급에 상관없이 자기 의견을 내는데 자유로운 분위기가 형성돼 있으며 '논리, 설득력'을 중요시합니다. 만약 개발자로서 성장하기 위한 '진짜 개발 문화'를 느끼고 싶다면, 저는 자신 있게 브레인즈컴퍼니를 추천합니다! 1. 안녕하세요. 현재 개발 3그룹에서 일하고 있는 권오민이라고 합니다. 2. 차세대 개발에서 프론트엔드 부분을 담당하고 있습니다. 특정 화면이나 기능을 구현하고 버그를 고치거나 코드를 개선하는 등의 일을 합니다. 3. 입사 전에 경험했던 간단한 팀 프로젝트가 모니터링에 대한 것이었는데, 이를 계기로 모니터링 쪽에 관심을 갖게 됐고 운 좋게 브레인즈컴퍼니에 입사할 수 있었어요. 4. 같은 팀에 속한 분들이 성격도 좋으시고 그 덕분에 팀 분위기 자체가 밝은 것 같습니다. 또 하나의 프로젝트를 초기 단계부터 시작해 배울 점도, 성장할 수 있는 가능성도 높다고 생각합니다. 5. 제가 이전에 짰던 코드를 보고 의문을 가지거나 마음에 들지 않는다고 생각할 때입니다. 6. 과거의 저보다 나아지는 걸 목표로 합니다. 성장한 면을 억지로 찾는 게 아니라, 스스로가 자연스레 성장했다고 느낄 정도로 성장하고 싶어요. 7. 입사 후 처음에는 업무가 이해하기가 쉽지 않고 어렵게 느껴질 수도 있습니다. 하지만, 그렇기 때문에 배울 점이 많고 더 성장하며 앞으로 나아갈 수 있다고 생각합니다. 1. 안녕하세요, 긍정적인 사고로 도전하기를 좋아하는 이윤지입니다. 컴퓨터 공학부 졸업 후 교육회사에서 개발 업무를 5개월 가량했습니다. 새로운 도전을 하기 위해 브레인즈컴퍼니로 이직하게 됐습니다. 2. 브레인즈컴퍼니에서 APM을 개발하는 팀에서 근무하고 있습니다. APM은 어플리케이션의 성능을 관리하고 통제하는 모니터링 도구입니다. 초단위의 실시간 모니터링을 통해 정밀한 성능 감시 및 분석을 지원합니다. 웹서버 및 매니저와의 통신을 통해 web UI 모니터링 기능을 개발하는 업무를 하고 있어요. 3. 기사를 통해 회사에서 직원들을 진심으로 아끼고 존중하는 문화와 복지를 볼 수 있었습니다. 브레인즈와 같이 성장하며 회사를 즐겁게 다닐 수 있을 거 같아 지원했습니다. 4. 브레인즈컴퍼니는 수평적인 업무환경을 가지고 있습니다. 직원들이 자유롭게 의견을 개진하고 업무에 적극적으로 반영하는 분위기를 갖고 있어요. 5. 일을 하면서 스스로 만족스러운 코드를 작성했을 때 성장했다고 느꼈습니다. 6. 제니우스가 국내를 넘어 세계1위 모니터링 솔루션 회사가 될 수 있도록 노력하겠습니다. 7. 브레인즈컴퍼니에 지원하시는 모든 분들을 진심으로 응원합니다! 1. 안녕하세요, 소프트웨어학을 전공하고 웹개발 부트캠프 및 인턴과정을 거쳐 브레인즈컴퍼니 개발4그룹에서 근무하고 있는 김영욱입니다. 2. 브레인즈컴퍼니 로그매니저의 기능개발 및 유지보수 작업을 맡았습니다. 개발은 프론트엔드와 백엔드를 모두 진행했으며, 다양한 기술스택들을 배우며 로그매니저의 기능 개선 및 CC인증을 위한 사전점검 작업들도 진행했던 한 해였습니다. 이후에는 Zenius AI의 빅데이터 및 AI 개발을 하게 될 예정입니다. 3. 풀스택 기술뿐만 아니라, 빅데이터 및 AI 기술을 활용해 차세대 기술을 개발하는 브레인즈컴퍼니의 채용공고를 접했습니다. 이 회사에서라면 많은 것을 배워 역량을 키우고 성장하며 일할 수 있겠다는 생각에 지원했고, 면접 끝에 첫 직장에 취업하게 됐습니다. 4. 모든 그룹원분들께서 잘 다독여주시고, 좋은 피드백을 줘서 지속적으로 배워가고 성장할 수 있는 회사 및 부서라고 생각합니다. 그룹의 상래님, 신후님, 천웅님, 태민님 모두 제게 좋은 피드백과 도움을 주고 계세요. 개선돼야 할 점과 공부해야 할 부분, 그리고 개발을 하면서 고쳐야할 습관들을 알려주셔서 점차 앞으로 나아갈 수 있어요. 5. 최근 카프카, ELK 등을 통한 로그 분산처리 작업을 하면서 배우는 점이 많았는데, 시행착오를 겪으면서 성장하고 있다고 느꼈고 매우 뿌듯한 시기를 보냈습니다. 6. 백엔드 작업에서 아직 배울 점들이 많고 이러한 것들을 모두 제 것으로 만들어 어느 부분에서 문제가 생기더라도 그것을 해결할 수 있을 정도의 실력있고 도움이 되는 개발자가 되는 것을 목표로 하고 있습니다. 7. 점점 발전하고 있으며, 배우고 성장함에 있어서 무궁무진한 가능성을 주는 회사라고 생각합니다. 본인이 성장을 하고 싶고, 실력을 발휘하고 싶다면 주저없이 입사 지원을 해보는것을 추천드려요! 1. 안녕하세요 개발 2그룹 인프라웹팀에서 근무하고 있는 김청룡입니다. 대학에서는 경영학을 전공했고, 브레인즈컴퍼니가 첫 직장입니다. 2. 인프라웹팀 안에서도 여러가지 업무가 있지만 신입인 저는 주로 고객사에서 요청하는 커스터마이징 보고서를 개발하는 업무를 하고 있습니다. 커스터마이징 보고서 개발업무에 대해서 간략히 말씀드리면, Zenius는 여러 인프라 장비 혹은 서버의 데이터를 수집하고, 사용자가 수집된 데이터를 보고서 형태로 볼 수 있도록 기본 보고서 기능을 제공을 해주고 있어요. 그 외에도 사용자가 원하는 양식(요구사항)으로 수집된 데이터를 볼 수 있도록 보고서를 개발합니다. 3. 국비지원 학원에서 여러 기업에서 나와 소개를 해줄 때 가장 인상깊었어요. 다른 기업들과 다르게 기업에서 어떤 사업을 진행하는지, 채용 과정은 어떻게 되는지 등 상세하게 알려줘서 이 회사에 입사를 하고 싶다면 알아야할 것들을 전달 받은 느낌이 있었어요. 또, 업무적으로 대용량 데이터베이스를 빠르게 처리하기 위해 어떻게 노력하고 있는지 궁금해 지원하게 됐어요. 4. 브레인즈컴퍼니는 무엇보다 사람이 좋은 것 같습니다. 모두 각자의 역할에서 책임을 다하고 최선을 다하는 모습, 그리고 질문을 할 때도 최대한 도움을 주려고 하는 모습에서 느껴졌습니다. 5. 코드를 작성하면서 여러가지 경우를 생각할 때입니다. 처음 코드를 작성할 때는 절차식처럼 그저 생각나는 대로 작성했는데, 입사 후 작성된 코드를 보고 어떻게 잘 나눠야 하는지, 성능을 고려하면서 작성했는지 등 다양한 고민을 하고 있는 제 자신을 볼 때 성장하고 있다고 느꼈습니다. 6. 다방면으로 역량이 있는 개발자를 목표하고 있습니다. 7. 사람 좋은 기업을 찾는다면 브레인즈컴퍼니입니다!
2022.12.09
APM의 핵심요소와 주요기능은?!
APM의 핵심요소와 주요기능은?!
지난 글을 통해서 APM의 필요성과 '트랜잭션' 현황 파악의 중요성에 대해서 알아봤습니다. 이번 시간에는 트랜잭션을 어떤 방식으로 추적하는지 APM 동작 과정을 통해 살펴보고, APM 시스템을 최적화하는 핵심 요소와 기능은 무엇인지 자세히 알아보겠습니다. │APM 동작 과정 APM은 Client-Web Application-DBMS와 같은 구성요소 사이에 트랜잭션1을 추적할 수 있어야 합니다. 이를 통해 웹 서비스 전반적인 성능을 모니터링하고, 문제가 발생했을 때 원인을 신속하게 진단할 수 있기 때문인데요. 그렇다면 각 단계별로 APM가 어떻게 트랜잭션1을 추적하는지 좀 더 자세히 살펴보겠습니다. *트랜잭션1: 쉽게 말해 데이터베이스에 실행되는 작업 단위를 의미합니다. 트랜잭션은 작은 여러 작업들을 하나의 그룹으로 묶어 처리하기 때문에, A라는 작업에서 일부가 성공했다고 하더라도 하나의 트랜잭션 처리가 비정상적으로 종료되면 모두 실패한 것이죠. 클라이언트(Client) 웹 서비스 사용자가 이용하는 디바이스 또는 브라우저입니다. 클라이언트에서 발생하는 요청과 응답을 추적하여 페이지 로딩 시간, 사용자 활동, 에러 발생 등을 파악할 수 있습니다. 이 정보들을 통해 사용자 경험을 분석하고 개선하는데 기초 자료로 사용되죠. 웹서버(Web Server) 클라이언트 요청을 받아, 적절한 답을 생성하여 보내는 서버입니다. 이 단계에서 APM은 서버(예: Apache, Nginx) 로그와 성능 지표를 분석하여 요청 처리 시간, 데이터 전송량, 서버 오류 등 정보를 모니터링하고 기록합니다. 웹 애플리케이션 서버(WAS) WAS는 Web Application Server의 약자로, 애플리케이션에서 사용하는 데이터를 저장하고 관리하는 시스템입니다. 이 단계에서 APM은 데이터베이스 성능을 모니터링하여 DB 쿼리 실행시간과 DB 서버 부하 등을 측정하고, 성능 문제를 파악하는 데 도움을 줍니다. WAS 종류로는 WebLogic, Websphere, JEUS, Tomcat 등이 있습니다. 데이터베이스(DBMS) DBMS(Database Management System)는 기업에서 발생하는 모든 데이터를 저장하고 관리하는 소프트웨어입니다. 이 단계에서는 DB 성능 관리 솔루션을 통해, 애플리케이션 개발자가 작성한 SQL 튜닝과 DBMS 소프트웨어 병목 현상 등을 모니터링할 수 있습니다. 특히 데이터베이스는 IT 인프라에서 필수 요소입니다. 기업 서비스 대부분이 데이터베이스에 접근하여, 데이터를 조회하고 수정해야 하기 때문에 DB 관리는 매우 중요하다 할 수 있죠. 이처럼 APM은 Client-Web Server-Was-DB 각 구성요소 사이에 있는 트랜잭션을 추적하여 웹 서비스 성능을 평가할 수 있습니다. 그다음으로는 APM 시스템 전체적인 성능을 평가하고 최적화하는 핵심 요소는 무엇인지 살펴보겠습니다. │APM 성능을 최적화하는 핵심요소 APM 시스템은 크게 5가지 요소를 통해, 전체적인 성능을 최적화할 수 있습니다. 우선 Resource는 시스템 성능과 안정성을 평가하는데 중요한 역할을 하며, DataBase는 SQL 쿼리의 실행 계획이나 DB 연결 상태와 같은 세부 정보를 분석하여 데이터베이스 성능을 최적화합니다. Alert는 모니터링된 데이터에서 문제를 식별하고 사용자나 운영자에게 경고를 보내며, User 경험과 행동을 추적하여 서비스 품질을 평가합니다. WAS는 서버 내부에서 발생하는 이벤트를 모니터링하고, 서버 성능을 평가하는 역할을 합니다. Resource-Database-Alert-User-WAS 이 5가지 요소는 APM 아키텍처를 구성하는 핵심 요소이기도 한데요. 다음 내용을 통해 APM 아키텍처를 좀 더 자세히 살펴보겠습니다. │APM 아키텍처 APM 아키텍처는 Agent를 통해 WAS(관리대상) 실시간 데이터를 수집하고 → Manager에서 데이터를 수집/분석/가공 한 뒤 → 다양한 UI로 시각화합니다. 특히 꼭 기억해야 할 APM 아키텍처 핵심 3가지는 에이전트, 데이터베이스, 통신방식인데요. 좀 더 자세히 알아보겠습니다. 에이전트 APM 관리대상(예시: WebSphere, WebLogic, JBoss, JEUS, Tomcat 등)에 Agent라고 불리는 소프트웨어를 설치합니다. 그다음 모니터링 대상 시스템(WAS)에서 데이터를 수집하죠. 에이전트는 애플리케이션 내부 동작을 모니터링하고, 성능 데이터를 수집하는 역할을 합니다. 이러한 데이터를 활용하여 에이전트는 서비스 구간별 현황과 초당 처리 건수, 서비스 응답시간, 동시 접속자 수, 트랜잭션 거래량, 에러 등 상세한 지표를 제공해 주죠. 데이터베이스 수집된 데이터를 보관하고 분석하기 위해서는, 데이터베이스(DataBase)를 사용합니다. 이 데이터베이스는 대규모 데이터를 저장하고 관리하는 구조여야 하며, 분석하고 보고서를 생성하는데 필요한 데이터를 효율적으로 쿼리 할 수 있어야 합니다. 통신방식 APM 시스템은 보통 다양한 통신 프로토콜(Communication Protocol)을 사용하여, 데이터를 수집하고 전송합니다. 예를 들어 웹 소켓(WebSocket)을 통해 실시간 데이터를 전송하거나 http(s)를 사용하여 주기적으로 데이터를 전송하는 방식이 일반적입니다. 그다음으로는 APM은 어떤 주요 기능을 제공하는지 알아보도록 하겠습니다. │APM 주요기능 APM은 대표적으로 웹사이트와 소프트웨어 애플리케이션 및 서비스에서, 성능을 모니터링하고 분석하는 기능이 있는데요. 좀 더 자세한 APM 기능을 살펴보겠습니다. 실시간 성능 통합 모니터링 [그림] Zenius-APM 토폴로지 맵 APM은 Tomcat, Jboss, WebLogic, JEUS 등 다양한 애플리케이션 서버(WAS) 환경에서 실행되는 애플리케이션 통합 모니터링을 제공합니다. 시스템 간의 처리 성능과 현황 정보는 토폴로지 뷰를 통해 시각적으로 파악할 수 있죠. [그림] Zenius-APM 모니터링 상황판 또한 각 서버의 트랜잭션 처리량, 처리 속도, 자원 사용량을 실시간으로 분석하여 시스템 성능을 관리합니다. 특정 트랜잭션 실행 경로를 추적하고 분석하여, 성능 병목 현상도 식별할 수 있습니다. [그림] Zenius-APM 모니터링 서비스 응답분포 APM은 서비스 응답 분포도를 제공하여, 비정상적인 트랜잭션을 집중적으로 조회하고 분석할 수 있습니다. 장애관리 APM은 메모리 누수, 서비스 응답 지연과 같은 장애 원인을 실시간으로 추적하고 분석하는 기능을 제공합니다. Rawdata를 기반으로 장애 발생 시점을 재현하여, 문제의 근본 원인을 파악하는 데 도움을 주죠. 또한 자동 이벤트 처리는 장애 관리 규칙(Rule)에 따라 이루어지며, 문제 발생 시에는 사용자에게 즉각적인 알림을 제공합니다. 성능 분석과 통계 APM은 애플리케이션 성능을 다양한 지표(예: 성능비교, 기간비교, 증설 필요성, 시간대별 등)를 통해 분석하고, 여러 파일 형식의 보고서로 제공합니다. 또한 애플리케이션 성능 문제와 SQL 쿼리 간의 연관성을 분석하여 성능 개선 방안을 제안합니다. 다양한 환경 지원 레거시 시스템에서 클라우드 인프라에 이르기까지, APM은 다양한 IT 환경을 효과적으로 지원합니다. 또한 WAS 중심 성능 관리와 MSA(마이크로 서비스 아키텍처) 환경 모니터링을 가능하게 하는 기술을 제공하죠. 이번 시간에 알아본 내용처럼 APM은 다양한 애플리케이션 서버(WAS) 환경에서 실행되며, 트랜잭션 성능을 관리하는 통합 모니터링 제품입니다. Zenius-APM와 같이 다양한 WAS 환경에서의 통합 모니터링과 트랜잭션 처리 현황을 체계적으로 파악할 수 있는 APM을 통해, 효과적으로 웹 애플리케이션을 관리해 보세요!
2024.07.19
웹 애플리케이션 모니터링 솔루션, Zenius APM의 주요기능과 특장점
웹 애플리케이션 모니터링 솔루션, Zenius APM의 주요기능과 특장점
웹 애플리케이션은 이제 단순한 서비스 제공 도구를 넘어 기업의 경쟁력을 좌우하는 중요한 요소로 자리 잡았습니다. 웹 애플리케이션의 성능은 사용자 경험의 품질을 결정짓는 중요한 요소이기 때문에, 매출 증가와 브랜드 신뢰도 형성에 직접적인 영향을 미칩니다. 그러나 트랜잭션 처리량이 급격히 증가하고, 데이터의 양과 복잡성이 더해지면서, 웹 애플리케이션의 안정적이고 효율적인 운영을 위해 실시간 모니터링과 정교한 성능 관리가 반드시 필요합니다. Zenius APM은 이러한 복잡한 요구를 충족시킬 수 있는 솔루션으로, 웹 애플리케이션의 성능 최적화와 운영 안정성 강화를 위한 다양한 기능을 제공합니다. 특히, 실시간 모니터링, 심층 분석, 장애 관리와 같은 핵심 역량을 기반으로 IT 환경의 복잡성을 효과적으로 관리하고 운영 효율성을 높일 수 있도록 돕습니다. Zenius APM이 제공하는 주요 기능과 특장점을 자세히 살펴보겠습니다. Zenius APM의 주요기능 [1] 효과적인 실시간 모니터링 Zenius APM은 웹 애플리케이션의 성능을 실시간으로 모니터링하여 운영자가 시스템 상태를 시각적으로 파악하고, 잠재적 문제를 조기에 발견해 신속히 대응할 수 있도록 지원합니다. 우선 Zenius APM의 대시보드는 사용자별로 맞춤 설정이 가능합니다. WYSIWYG 방식을 채택하여 운영자가 원하는 모니터링 항목을 직관적으로 구성할 수 있습니다. 운영자는 드래그 앤 드롭으로 모니터링 항목을 배치하고, 데이터 포인트를 중심으로 상황판을 제작해 각자의 운영 환경에 최적화된 대시보드를 손쉽게 구축할 수 있습니다. Real-Time Topology Map은 트랜잭션의 흐름과 병목 구간을 시각적으로 보여주는 기능입니다. 응답 시간과 처리량을 색상과 노드로 표시하며, 문제 발생 지점을 직관적으로 파악할 수 있도록 설계되었습니다. 병목 구간이나 성능 저하가 발견될 경우, 해당 노드를 클릭하여 상세한 분석 화면으로 즉각 이동할 수 있어 문제를 신속히 해결할 수 있습니다. Zenius APM이 제공하는 주요 모니터링 항목으로는 트랜잭션 응답 시간과 병목 구간, JVM 힙 메모리와 CPU 사용량, JDBC 연결 상태와 SQL 실행 건수, 동시 접속 사용자 수와 TPS(초당 트랜잭션 처리량) 등이 있습니다. 이러한 지표를 통해 운영자는 성능 최적화와 안정성을 효과적으로 관리할 수 있습니다. [2] 장애 관리 지원 Zenius APM은 웹 애플리케이션의 안정적인 운영을 위해 장애를 사전에 방지하고, 발생한 장애를 신속하고 정확하게 분석할 수 있는 기능을 제공합니다. 우선, 장애 정책 기반 이벤트 감지 기능을 통해 서비스 처리량(TPS), 응답 시간, JVM 자원 사용률 등 주요 성능 지표에 임계치를 설정할 수 있습니다. 임계치가 초과되면 SMS, 이메일, Push App 등을 통해 실시간 경고를 전송하여 운영자가 즉각적으로 대응할 수 있도록 지원합니다. 또한, Snapshot 분석 기능은 장애가 발생한 시점의 성능 데이터를 Raw 데이터 기반으로 재현하여 문제를 정밀하게 분석할 수 있도록 도와줍니다. 이를 통해 장애의 정확한 원인을 파악하고, 향후 동일한 문제가 발생하지 않도록 사전에 대비할 수 있습니다. 이와 더불어, 통합 이벤트 관리 기능은 발생한 이벤트 이력을 체계적으로 기록하고 관리합니다. 이를 통해 장애 처리 과정을 명확히 추적할 수 있으며, 과거 데이터를 기반으로 유사한 상황이 발생했을 때 신속하고 효과적인 대처가 가능합니다. 이벤트 관리 시스템은 처리 상태, 발생 시간, 지속 시간, 장애 유형 등의 세부 정보를 저장하며, 운영자는 이를 활용하여 문제 해결 프로세스를 최적화할 수 있습니다. [3] 다양한 성능 분석 지원 Zenius APM은 다양한 성능 분석 도구를 통해 운영자가 애플리케이션 성능 데이터를 심층적으로 이해하고, 데이터 기반의 최적화된 결정을 내릴 수 있도록 지원합니다. 주제별 성능 분석은 애플리케이션 및 데이터베이스 성능을 심층적으로 이해하고 개선하는 데 중요한 역할을 합니다. 애플리케이션 분석은 호출 건수, 실패 건수, 응답 시간 등을 통해 애플리케이션 상태를 종합적으로 파악할 수 있도록 돕습니다. 반면, SQL 분석은 데이터베이스 쿼리 호출 빈도, 평균 응답 시간, 실패 건수 등 세부 데이터를 제공하여 비효율적인 SQL 쿼리를 식별하고 데이터베이스 성능을 최적화할 수 있도록 지원합니다. 또한, 품질 이슈 분석은 Exception과 Error 발생 원인을 트랜잭션 데이터와 연관시켜 문제를 효과적으로 해결할 수 있도록 돕습니다. 특히, 자동 연관 분석은 SQL, 애플리케이션, 트랜잭션 데이터를 연결하여 성능 문제의 원인과 연관성을 시각적으로 표현합니다. 이를 통해 복잡한 데이터를 직관적으로 이해하고, 문제 해결에 필요한 핵심 정보를 빠르게 파악할 수 있습니다. 마지막으로, 기간별 증감 추이 비교 기능은 특정 기간 동안의 호출 건수, 응답 시간 등의 데이터를 비교하여 성능 변화 추이를 명확히 파악할 수 있습니다. 이를 기반으로 성능 저하의 원인을 식별하고, 구체적인 시스템 개선 방향을 도출할 수 있습니다. [4] 사용자 맞춤형 통계 및 보고서 Zenius APM은 사용자 맞춤형 데이터 시각화와 보고서 생성을 통해 운영자가 필요한 정보를 효율적으로 제공하며, 데이터 기반 의사결정을 지원합니다. 통계 템플릿 기능은 Zenius APM이 제공하는 대표적인 사용자 편의 도구 중 하나로, 방문자 수, 시스템 자원 사용률, 트랜잭션 처리 건수 등 35개 이상의 주요 성능 지표를 기반으로 템플릿을 저장하고 재활용할 수 있습니다. 이를 통해 운영자는 빈번히 사용하는 보고서 양식을 템플릿화함으로써 반복적인 작업 시간을 줄이고, 데이터 분석과 의사결정에 더 많은 시간을 할애할 수 있습니다. 또한, 다양한 유형의 보고서를 생성할 수 있는 기능은 Zenius APM의 또 다른 강점입니다. 성능 비교, 이벤트 발생 현황 분석, 자원 증설 필요성 평가 등 다양한 보고서를 통해 운영 상황을 종합적으로 분석하고, 개선 방안을 도출할 수 있습니다. 이러한 맞춤형 통계와 보고서는 운영자에게 명확하고 유용한 인사이트를 제공하여, 효율적이고 전략적인 시스템 운영을 가능하게 합니다. 이러한 맞춤형 통계와 보고서는 단순한 데이터 시각화 도구를 넘어, 운영자가 운영 상태를 명확히 이해하고 전략적인 결정을 내릴 수 있도록 지원하는 중요한 역할을 합니다. Zenius APM의 특장점 지능형 IT 인프라 통합 관리 솔루션인 Zenius의 핵심 구성 요소인 Zenius APM은 다양한 IT 자원의 연관성을 체계적으로 분석하며, 효율적이고 신뢰할 수 있는 모니터링 환경을 제공합니다. EMS Framework를 기반으로 구축된 Zenius APM은 웹 애플리케이션과 서버, 네트워크 등 다양한 인프라를 중앙에서 집중적으로 모니터링할 수 있는 기능을 지원합니다. 또한, 하드웨어와 미들웨어를 포함한 이기종 인프라를 통합 관리하기 위한 도구를 제공하며, Overview와 Service Map을 통해 시스템 전반의 상호작용을 명확히 파악할 수 있습니다. 특히, 서버와 DBMS를 비롯한 IT 인프라 전반의 상호작용을 분석하여 장애의 원인과 영향을 신속히 파악하고, 이를 바탕으로 심층적이고 효율적인 관리를 지원합니다. 이러한 기능을 통해 운영자는 문제를 조기에 발견하고 신속히 해결할 수 있으며, 안정적이고 효율적인 IT 환경을 유지할 수 있습니다. 또한 최근 많이 활용되는 쿠버네티스 모니터링 솔루션(Zenius K8s)과의 연계를 통해 컨테이너 기반의 마이크로서비스 아키텍처 및 분산 환경에서도 뛰어난 관리 성능을 발휘합니다. 쿠버네티스 클러스터의 POD와 컨테이너 상태를 실시간으로 모니터링하며, 자동 스케일링과 같은 클라우드 네이티브 기능을 통해 변화가 잦은 환경에서도 안정적인 서비스 운영을 보장합니다. 또한 Zenius APM은 장애가 발생한 특정 시점(예: 예외 발생 또는 오류 시점)의 애플리케이션 성능 정보를 정밀하게 재현할 수 있습니다. Raw 데이터 기반의 스냅샷 분석을 활용하여 과거의 실시간 운영 상태를 정확히 복원하며, 이를 통해 문제의 원인을 신속하고 정밀하게 파악할 수 있습니다. 사용자가 필요에 따라 분석 항목과 화면 구성을 선택적으로 조정할 수 있어, 상황에 맞춘 유연하고 효율적인 분석이 가능합니다. Zenius APM은 세분화된 장애 심각도 설정과 SMS, 이메일, Push 알림 등 다양한 방식으로 장애 발생을 빠르게 알립니다. 또한, 에스컬레이션 통보 기능을 통해 운영자는 중요한 장애가 누락되지 않도록 관리하며 대응 시간을 단축할 수 있습니다. 이와 더불어, 애플리케이션과 인스턴스를 논리적으로 그룹화하여 비즈니스 관점에서 실시간 서비스 성능을 모니터링할 수 있도록 지원합니다. 이를 통해 인스턴스 관점과 비즈니스 관점의 실시간 듀얼(Dual) 모니터링 환경을 제공하며, 실제 서비스와 연계된 성능 관리를 더욱 효과적으로 수행할 수 있습니다. Zenius APM은 복잡한 IT 환경에서 웹 애플리케이션의 성능을 최적화하고 운영 안정성을 보장하는 데 필요한 모든 기능을 제공합니다. 실시간 모니터링, 장애 관리, 성능 분석, 그리고 사용자 맞춤형 보고서 기능은 운영자가 문제를 사전에 예방하고 효율적으로 대처할 수 있는 기반을 마련합니다. 이를 통해 기업은 안정적이고 효율적인 IT 운영을 실현하며 비즈니스 경쟁력을 강화할 수 있습니다.
2024.11.29
다음 슬라이드 보기