본문 바로가기

Lucene

현재 사용중인 루씬쪽.. 약간의 변경 작업

로그분석/조회 프로그램에 대한 루씬쪽 약간의 변경작업..

1. 전체 document 약 2억6천만개
 - 하루 약 40만개씩 증가 
 - 색인파일 연도별로 분리
 - MultiSearcher 사용

2. 검색속도 개선을 위한 작업
 - date필드를 int형 필드로 마이그레이션
 - value 필드를 int형 필드로 마이그레이션
 - rangeQuery를 Filter로 변경하여 검색

3. 리소스 개선을 위한 작업
 - long타입을 int로 마이그레이션 

까지는 완료... 

4. 더 할 수 있는 작업
 - 색인 조건 최적화
 - TermVector, Norm값등은 필요 없으므로 가지고 가지 않도록

5. replication 기능 개발

역시 책을 읽어야해...;;

1판에 있던 내용도 지금 다시 읽으니 참 새롭다.