본문 바로가기
IT 공부/AWS Solution Architect Associate(완)

AWS MONITORING

by 랜턴K 2024. 3. 12.
반응형

AMAZON CLOUDWATCH METRIC (지표)

- CPUUTILIZATION / NETWORKIN  / SIZE OF BUCKET ETC

- 지표는 NAMESPACES에 속함 > 서비스당 이름 공간 하나!!

- 지표의 측성기준 = DIMENSTION EX) '특정인스턴나 특정환경'의 CPU 사용률 ; 최대 지표당 30개!! 

- CLOUDWATCH 대시보드에 추가 가능

- 사용자 지정 메트릭 ; 

- 메트릭은 외부로 스트리밍도 가능 ; 거의 실시간 / 지연시간 짧음 ; KINESIS FIREHOSE > 타사 서비스 제공자 

- CLOUDWATCH > FIREHOSE > S3 > ATHENA 

                                                            > REDSHIFT > OPENSEARCH 

- 네임스페이스 메트릭의 일부만 필터링 가능 

- 기간을 클릭하여 세부 데이터를 조회 가능 (최소 1분단위의 데이터!!)

- 누적영역형 / 선숫자/ 파이차트 / CSV 파일 생성 가능 

 

CLOUDWATCH LOGS ; 애플리케이션 로그 저장 

- 로그 그룹 정의 ; 다수의 로그 스트림을 포함하는 컨테이너 

- 로그 만료 정책 

- 전송 ; 배치로 S3 / KINESIS > LAMBDA / OPENSEARCH / SDK / CLOUDWATCH UNIFIED AGENT 

- ELASTIC BEANSTALK > 애플리케이션에서 직접 수집 후 CLOUDWATCH로 보낼 수도 

- EC2도 바로 CLOUDWATCH 

- CLOUDWATCH LOGS 쿼리 > CLOUWATHCH LOGS INSIGHTS 이용 

- CREATEEPXPORTTASK ; 배치 작업 

- CLOUDWATCH LOGS SUBSCRIPTION > 로그 데이터 실시간 스트림!! 

- 발신자 수신자 다를 때, 전송 대상 액세스 정책 첨부 허용 / 수신자계정에서 IAM 역할 생성 

 

CLOUDWATCH AGENT / CLOUDWATCH LOGS AGENT

- 기본적으로, EC2 > CLOUDWATCH로 어떤 로그도 옮겨지지 않음 

- CLOUDWATCH AGNET EC2에 실행시켜 로그를 푸시해야 함 + EC2의 IAM 롤 필요 

- 최신버전의 UNIFIED AGENT는 프로세스나 RAM 같은 추가적인 시스템 단계 메트릭도 수집 (로그만 수집하는 게 아닌!)

- SSM PARAMETER STORE 이용 > 에이전트 쉽게 구성 

 

CLOUDWATCH ALARMS 

- 3가지 상태 ; OK(트리거 X) INSUFFICIENT DATA (불충분)  ALARM(한도 초과)

- 3가지 주요타깃 ; 1. 액션(정지 종료 재부팅 복구) 2.오토스케일링 액션 3.SNS 서비스에 알림 전송 

- 복합 알람 (원래는 하나의 메트릭 적용)

- 1. 상태 검사 2. EC2 VM 검사 3. 시스템 상태 검사 

 

EVENTBRIDGE (CLOUDWATCH EVENTS의 새 버전)

- CRON 작업 예약 ; 스크립트 예약 ; 한 시간마다 람다 함수를 트리거 스크립트를 실행하는 것 

- + 이벤트에 반응도 할 수 있음 ; 예컨데, IAM 루트 사용자 로그인 이벤트에 반응하여 보안 기능으로 활용 가능 

- 다양한 DESTINATION 설정 가능 ; SQS SNS 활용

- 시작 중단 종료 -> EC2  / 실패한 빌드 -> CODEBUILD / 객체 업로드 이벤트 -> S3 EVENT
   / 새 보안 문제 -> TRUSTED ADVISOR 

- EVENTBRDIGE + CLOUDTRAIL -> 좋은 조합 ; 모든 API를 가로챔 

- EVENTBRDIGE 전송되는 이벤트에 필터 설정 가능 

- 기본이벤트버스 + 파트너 이벤트 버스(파트너의 이벤트 버스에 반응) + 사용자 지정 이벤트 버스(자체 버스)

- 리소스 기반 정책 (다른 계정의 이벤트 버스에 액세스 가능)

- 이벤트 아카이빙!! (무제한 또는 일정기간 설정) > 트러블 슈팅 또는 프로덕션 수정 시 유용 

- 이벤트를 어떻게 파악 ?> 이벤트는 json 형식 > EVENTBRDIGE는 스키마를 추론한다

- 스키마 레지스트리 활용 > 어플리케이션 코드 생성 및 스키마 정형화 추론!!
- 리소스 기반 정책 ; 특정 이벤트 버스의 권한 관리!! ; 특정 이벤트 버스가 다른 리전 또는 계정의 이벤트를 허용/거부하게

- 스키마 레지스트리 + 리소스 기반 정책 ; 

 

CLOUDWATCH INSIGHTS AND OPERATION VISIBILITY 

- CONTAINER INSIGHT ; 컨테이너의 지표와 로그를 수집 집계 요약 

- 컨테이너화된 버전의 CLOUDWATHCH AGENT를 사용해야 함

- LAMBDA INSIGHT ; 서버리스 어플리케이션 모니터링 트러블 슈팅 

- CONTRIBUTOR INSIGHT ; 컨트리뷰터의 데이터와 로그를 분석 ; 직접 또는 AWS 규칙 

- 예시 ; 불량 호스트 식별 / 사용량이 가장 많은 네트워크 사용자 식별 / DNS 로그에서 오류 빈번 URL 찾기 

- APPLICATION INSIGHTS ; 잠재적 문제와 진행 중 문제를 분리 -> 자동화 대시보드 제공 

   - 특정 웹 서버 또는 디비로만 어플리케이션 실행 가능  

- 자동화 대시보드 시, 백그라운드에서 SAGEMAKER가 사용됨 

- 발견된 문제 알림은 EVENTBRDIGE / SSM OPSCENTER로 전달 

 

CLOUDTRAIL ; AWS 계정 거버넌스 컴플라이언스 감사 실현 방법 

- 기본 값으로 활성화 

- 모든 이벤트 / API 호출 이력 > SDK / 콘솔 / CLI / 기타 AWS 서비스로 얻을 수 있음 

- CLOUDTRAIL > CLOUDWATCH LOGS / S3에 넣을 수 있음 

- 1. 관리이벤트 ; 계정 안의 리소스에 수행된 작업 / 읽기 또는 쓰기 이벤트

- 2. 데이터 이벤트 ; 로깅X 가 디폴트 ; S3 뿐 아니라 람다함수실행활동도 카운트

- 3. 클라우드트레일 인사이트 이벤트 ; 

- CLOUDTRAIL INSIGHTS ; 많은 API 호출이 빠르게 이어진다면 정상/비정상 판단 어려움!!

- 이벤트 분석 > 비정상적인 활동 탐지(부정확 리소스 프로비저닝/서비스한도도달/IAM액션폭증 등)

- 계속적 분석 > 기준선 결정 

- 콘솔 / S3 / EVENTBRIDGE / 등과 연결 가능

- 이벤트 보관 - 기본  90일 > 더 길게는 S3 보관 

 

CLOUDTRAIL + EVENTBRIDGE 

- CLOUDTRAIL이 로깅되는 이벤트를(AWS 내부 API 등) 가로채서, 트레일 이벤트 생성

- DYNAMODB의 DELETETABLE API 등 

- CLOUDTRAIL 이벤트로 EVENTBRIDGE를 트리거 > 액션 실행

 

AWS CONFIG ; 리소스 감사 규정 준수 여부 기록 

- 설정된 규치 기간, 구성+구성변화를 기록

- 트러블슈팅 + 롤백 / SNS 알림 연동 

- 리전별 서비스
- 규칙 ; 1. AWS 관리형 CONFIG 규칙 75가지 2. LAMBDA를 통한 규칙 

- 준수를 위한 것 (예방이나 차단은 안됨!!)

 

 

반응형

'IT 공부 > AWS Solution Architect Associate(완)' 카테고리의 다른 글

AWS 보안 및 암호화  (0) 2024.03.19
AWS IDENTITY AND ACCESS MANAGEMENT(IAM)  (0) 2024.03.13
AWS 머신러닝  (0) 2024.03.10
AWS 데이터 & 분석  (0) 2024.03.10
AWS NOSQL DB  (1) 2024.03.08