사람이야기 | 브레인즈컴퍼니

메인 페이지로 이동
블로그
사람이야기

블로그

SMS, APM, ITSM, SIEM, NMS, DBMS 등 끊임없이 진화하는 브레인즈컴퍼니 동료들의 솔직담백한 이야기를 들어보세요.

[통합로그관리] Filebeat에서 안정적으로 하드웨어 자원 사용하기

정태민 2022.11.17

Filebeat는 Elastic Stack에서 사용하는 경량(light-weight) 데이터 수집기로 logstash 대비 상대적으로 리소스(CPU와 RAM)를 상당히 적게 소모한다는 장점이 있습니다. 또, Filebeat는 간단한 필터 기능도 제공합니다. 하지만 말 그대로 간단한 필터 기능이라 한번에 대용량의 파일을 관리해야 하는 경우 호스트 서버에 부담이 갈 정도로 많은 리소스를 사용할 수 있습니다. 따라서 브레인즈컴퍼니가 운영하는 통합로그관리 에이전트는 호스트의 서버 환경에 따라 filebeat 에이전트의 설정 파일을 수정해서 안정성을 제공하고 있습니다.

본 내용은 Filebeat 리소스 점유율이 높을 때 트러블슈팅 관련 설정 수정사항입니다.

수정에 필요한 기본 파일 위치

linux : /etc/filebeat/filebeat.yml

docker: /usr/share/filebeat/filebeat.yml

filebeat 프로세스 메모리 확인하는 방법

top -d 1 | egrep "PID|filebeat"

수정에 앞서 filebeat의 메인 컴포넌트인 harvester의 개념을 간략하게 설명하겠습니다.

하나의 harvester는 하나의 파일을 읽어드립니다. harvester가 실행 중인 경우 파일을 한 줄씩 읽습니다. 각 파일 당 하나의 harvester가 실행됩니다.

브레인즈컴퍼니 통합로그관리 제니우스 로그매니저, Elastic Stack에서 제공하는 filebeat overview 이미지

상단의 이미지를 보면 filebeat의 컴포넌트인 input과 harvester가 보입니다. 또한 filebeat이 harvester를 관리하며 어느 파일을 읽을지 관리하는걸 알 수 있습니다.

harvester가 실행 중인 경우 파일 설명자(File Descriptor) 열린 상태로 유지됩니다. 이는 파일이 삭제되거나 파일명이 변경된다 하더라도 파일을 계속 읽게 해줍니다. 하지만 파일 설명자는 harvester가 닫힐 때까지 디스크 공간을 예약합니다.

1. filebeat.inputs:

2. - type: filestream

3. id: my-filestream-id

4. paths:

5. - /var/log/system.log

6. - /var/log/wifi.log

7. - type: filestream

8. id: apache-filestream-id

9. paths:

10. - "/var/log/apache2/*"

11. fields:

12. apache: true

13. fields_under_root: true

<filebeat에서 제공하는 input example>

1. scan_frequency

파일비트가 설정된 filebeat_inputs의 path에 있는 파일들의 갱신 여부를 체크하는 주기입니다. 너무 길게 설정하면 한번에 많은 파일들을 수집하게 됩니다. 반대로 너무 짧게 설정하면 스캔을 너무 잦게 해서 CPU점유율이 올라갑니다. 적당한 조절이 필요합니다.

기본값은 10초입니다. Scan_frequeny가 동작하는 방식은 아래와 같습니다.

harvester 읽기 종료 또는 파일 삭제 → scan_frequency 만큼 대기 → 파일 갱신 확인 → 파일 갱신 시 새 harvester 시작