Elastic Search는 검색엔진이다.

기본적으로 한글 형태소가 지원되지 않아서

별도 한글형태소가 지원되도록 설치를 해줘야 한다.


한글형태소는 아는 사람은 쉬울수 있지만,

일반인에게는 검색이라는것 자체도 어려운 계념인데

한글형태소라는 말은 국어책을 다시 뒤지게 만드는 쉽지 않은 계념이다.

그런데 동전한잎 프로젝트(http://eunjeon.blogspot.kr/)에서 한글 형태소를 만들어서 배포한다.

Elastic Search의 Plugin 정도로 생각하면된다.


얼마전까지만 해도 Elastic Search의 최신버전을 지원하지 않아서 Elastic Search의 최신 버전을 사용할 수 없었으나

최근 16년 12월에 감사하게도 Elastic Search 5.1.1 을 지원하도록 만들어 주었다.

Lucene/Solr용

Elastic Search 용


나는 Elastic Search 에만 관심이 있기 때문에 본글은 Elastic Search기준으로 작성해본다.


형태소분석기는 "mecab-ko-dic은 오픈 소스 형태소 분석 엔진인 MeCab을 사용하여, 한국어 형태소 분석을 하기 위한 프로젝트입니다. 말뭉치 학습과 사전 목록 일부는 21세기 세종계획의 성과물을 사용하였습니다. " 이라고한다.

대충 이런것 같다.   Elastic Search 한글 검색 = (mecab + 동전한닢커스터마이징 ) + Elastic Search  뭐 이정도.??


라이센스 부분부터 훌터보자 mecab-ko-dic 는 Apache License Version 2.0 를 따르고 있기 때문에 사용 및 재배포가 자유롭다.

소스변경 후 재배포는 잘 모르겟네..


동전한닢프로젝트의 설치가이드는 elasticsearch 2.1.1 + mecab-kr 0.2.1로 되어 있는데

ElasticSearch 5.1.1 까지 지원된다고 하니 일단 ElasticSearch 5.1.1 + mecab-kr 0.2.1 를 CentOS 6.6에 설치하는것으로  진행 해보겠다. (잘되려나..)


일단 바이너리 파일만 받아놓고. 설치기는 다음에.


Elastic Search 5.1.1 

https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-5.1.1.zip  전체파일은 여기서 받을 수 있다.

(tistory 10메가파일만 업로드되어 원시파일 압축해제 후 재 압축)

elasticsearch-5.1.1.zip.001

elasticsearch-5.1.1.zip.002

elasticsearch-5.1.1.zip.003

elasticsearch-5.1.1.zip.004

tar : https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-5.1.1.tar.gz


mecab-ko-dic v0.21

elasticsearch-analysis-mecab-ko-5.1.1.0.zip



'linux' 카테고리의 다른 글

ElasticSearch 5.1.1 외부에서 접근  (0) 2017.03.22
ElasticSearch 5.1.1 설치  (0) 2017.03.22
Apache + PHP + Oracle  (0) 2015.02.28
CentOS NFS 설정  (0) 2015.02.27
Linux shell(1분동안 계속 반복 수행)  (0) 2015.02.27

+ Recent posts