본문 바로가기

lucene korean analyzer

최근 lucene-Korean-Analyzer 프로젝트의 근황 아주 먼 옛날.... 한 6년전쯤? GS모사에 있을때 루씬으로 처음 검색엔진 만들어보고자 했을때 한글 분석기가 없어서 세종프로젝트의 양해를 구해 명사 사전을 받아 단순 탐색+매칭으로 명사추출을 시키고, 스테머, 동의어필터등을 구현해서 만들어왔던 프로젝트가 하나있습니다. https://github.com/need4spd/lucene-Korean-Analyzer 인데요.. 이게 그로부터 1-2년 후 이수명님께서 한글형태소분석기를 개발해 오픈(http://cafe.naver.com/korlucene)해주시면서 제가 그 형태소분석기를 명사추출 모듈의 하나로 사용하여 필터를 보강하였고, 현재 crescent를 gradle build하면 바로 이 라이브러리를 다운받아 사용하도록 되어있습니다. 최근에 이수명님의 한글.. 더보기
[lucene-korean-analyzer] github 프로젝트 변경 lucene-korean-analyzer 프로젝트를 기존에 lucene 버전에 따라서 나누어져있던repository를 https://github.com/need4spd/lucene-Korean-Analyzer 로 통합하고멀티프로젝트로 lucene-3.X와 lucene-4.x로 구성하였습니다. gradle을 사용하여 작업을 진행하였습니다. 더보기
[lucene-korean-analyzer] 루씬 4.0 버전을 추가하였습니다. Lucene_Korean_analyzer를 루씬 4.X 버전에서도 사용하실 수 있도록 추가 프로젝트를 생성하였습니다. https://github.com/need4spd/lucene-Korean-Analyzerhttps://github.com/need4spd/lucene-Korean-Analyzer_4x 또한, 이수명님께서 패치하신 최근 형태소분석기의 소스도 같이 반영해주었습니다. 더보기