티스토리 뷰

IT/Elasticsearch

data type: keyword

Some day 2021. 10. 3. 12:35
반응형
  • Keyword 형태로 사용할 데이터에 적합
  • 별도의 분석기를 거치지 않고, 원문 그래도 색인을 하기 때문에 특정 코드나 키워드 등 정형화된 컨텐츠에 사용
  • 형태소 분석을 사용하지 않아야 할 경우에도 사용
  • 주로 아래와 같은 경우에는 반드시  keyword 타입을 사용해야 함
    • 검색 시 필터링 되는 항목
    • 정렬이 필요한 항목
    • 집계(aggregation)해야 하는 항목

  • 예를들어, keyword 타입으로 지정된 항목에 "Seoul Korea"라는 문자열이 있을 경우
    "Seoul" 이나 "Korea"라는 질의어로는 검색이 되지 않는다.
    정확하게 "Seoul Korea"라고 질의해야 검색이 된다.

 

  • keyword 데이터 타입의 파라메터는 아래 표 참고
boost 필드의 가중치로 검색 결과 정렬에 영향을 줌. 기본값은 1.0으로 1보다 크면 score가 높게 오르고, 1보다 적으면 점수가 낮게 오른다. 이를 이용해 검색에 사용된 키워드와 문서 간의 유사도 score 값을 계산할 때 필드의 가중치 값을 얼마나 더 줄 것인지 판단한다.
doc_values 엘라스틱 서치에서 사용하는 기본 cache. Text 타입을 제외한 모든 타입에서 기본적으로 사용함.
OS의 파일 시스템 캐시를 통해 데이터에 빠르게 접근. GC의 비용이 들지 않으면서 메모리 연산과 비슷한
성능을 보여줌
필드를 정렬, 집계할 필요가 없다면 디스크 절약을 위해 비활성화 할 수 있음. 단, 한 번 비활성화된 필드는
인덱스를 재색인하지 않는 한 변경이 불가능
기본값은 true.
index 해당 필드를 검색에 사용할 지 설정. 
기본값은 true.
null_value 엘라스틱 서치는 데이터의 값이 없으면 기본적으로 필드를 생성하지 않음. 
데이터의 값이 없는 경우 null로 필드의 값을 대체할 지 설정
store 필드 값을 필드와 별도로 _source에 저장하고 검색 가능하게할 지 설정.
기본값은  false

 

반응형

'IT > Elasticsearch' 카테고리의 다른 글

data type: text  (0) 2021.10.03
Mapping 중요성  (0) 2021.10.02
문서관리 API  (0) 2021.10.02
Mapping error - "include_type_name is set to true"  (0) 2021.10.02
Node  (0) 2021.10.02