티스토리 뷰

IT/Elasticsearch

data type: text

Some day 2021. 10. 3. 12:49
반응형
  • Text 데이터 타입을 사용하면 색인 시 지정된 analyzer가 컬럼의 데이터를 문자열로 인식하고 이를 분석한다.
  • Analyzer를 지정하지 않으면, 기본적으로 standard analyzer가 사용된다.
  • 어떤 설명문같이 문장 형태의 데이터에 사용하기에 적합
  • Text 데이터 타입은 "전문 검색"이 가능하다는 것이 가장 큰 장점

 

  • Text 데이터 타입으로 데이터를 색인하면, 전체 텍스트가 토큰화되어 생성되며, 특정 단어를 검색하는 것이 가능
  • 검색 뿐 아니라, 정렬이나 집계 연산을 사용해야 할 경우에는 text 타입과 keyword 타입을 동시에 갖도록 설정

 

  • Text 타입의 주요 파라메터는 아래 표와 같음
analyzer 인덱스 검색에 사용할 형태소 분석기를 선택.
기본값은 standard analyzer.
boost 필드의 가중치로 검색결과에 영향을 줌. 기본값은 1.0으로 1보다 크면 score가 높게 오르고, 1보다 작으면 내려감
fielddata 정렬, 집계, 스크립트 등에서 메모리에 저장된 필드 데이터를 사용할지 설정
기본값은 false
index 해당 필드를 검색에 사용하지 설정
기본값은 true
norms 유사도 점수를 계산할 때, 필드 길이를 고려할지 여부를 결정
기본값은 true
store 필드 값을 필드와 별도로 _source에 저장하고 검색 가능하게 할지 결정
기본값은 false
search_analyzer
(analyzer)
검색에 사용할 형태소 분석기를 선택한다.
similarity 유사도 점수를 구하는 알고리즘을 선택.
기본값은 BM25
term_vector Analyzed 필드에 term vector를 저장할지 여부를 결정
기본값은 no

 

반응형

'IT > Elasticsearch' 카테고리의 다른 글

data type: keyword  (0) 2021.10.03
Mapping 중요성  (0) 2021.10.02
문서관리 API  (0) 2021.10.02
Mapping error - "include_type_name is set to true"  (0) 2021.10.02
Node  (0) 2021.10.02