티스토리 뷰

IT/Elasticsearch

Node

Some day 2021. 10. 2. 12:14
반응형
  • 클러스터는 물리적인 노드 인스턴스들의 집합체
  • 분산 처리를 위해서는 다양한(?) 노드들로 구성해야 함
  • 기본개념: 마스터-노드(전체 클러스터 관리용), 데이터-노드(실제 데이터 관리용)

 

  • 노드 기본 유형 4가지
    1. Master node
      • Cluster 관리
      • Node 추가와 제거 등 cluster에 대한 전반적인 관리
      • 네트워크 속도가 빠른 노드를 마스터 노트로 선정
      • 다수의 노드를 마스터 노드로 설정할 수 있으나, 단 하나의 노드만이 마스터로 선발되어 동작하게 됨
    2. Data node
      • 데이터 저장
      • 검색, 통계처리 같은 데이터 관리작업 수행
      • 컴퓨팅 자원 (CPU, MEM, Storage)을 많이 필요로 함
      • 노드의 리소스 운영상태를 지속적으로 모니터링해야 함
      • Master node와는 가급적 분리해서 구성하는 것이 바람직함
    3. Coordinating node
      • 사용자 요청만 처리
      • Cluster 관련 요청은 Master node로, 데이터 관련 요청은 Data node로 전달
      • 들어오는 요청을 단순히 round-robin(RR) 방식으로 분산처리
    4. Ingest node
      • 문서(Document, 엘라스틱서치에 저장되는 데이터의 최소 단위) 전처리 담당
        즉, 색인에 앞서 데이터를 전처리하기 위한 노드
      • 인덱스 생성 전 문서의 형식을 다양하게 변경
반응형

'IT > Elasticsearch' 카테고리의 다른 글

data type: text  (0) 2021.10.03
data type: keyword  (0) 2021.10.03
Mapping 중요성  (0) 2021.10.02
문서관리 API  (0) 2021.10.02
Mapping error - "include_type_name is set to true"  (0) 2021.10.02