로그분석/조회 프로그램에 대한 루씬쪽 약간의 변경작업..
1. 전체 document 약 2억6천만개
- 하루 약 40만개씩 증가
- 하루 약 40만개씩 증가
- 색인파일 연도별로 분리
- MultiSearcher 사용
2. 검색속도 개선을 위한 작업
- date필드를 int형 필드로 마이그레이션
- value 필드를 int형 필드로 마이그레이션
- rangeQuery를 Filter로 변경하여 검색
3. 리소스 개선을 위한 작업
- long타입을 int로 마이그레이션
까지는 완료...
4. 더 할 수 있는 작업
- 색인 조건 최적화
- TermVector, Norm값등은 필요 없으므로 가지고 가지 않도록
5. replication 기능 개발
역시 책을 읽어야해...;;
1판에 있던 내용도 지금 다시 읽으니 참 새롭다.