본문 바로가기

Crescent

[Crescent] 기능패치 및 사전 관리 페이지에 Bootstrap을 적용했습니다. 강한구님께서 알려주시고기본틀을 pull request해주셔서 그걸바탕으로 해서적용해보았습니다. 워낙 CSS나 HTML을 잘 못해서..처음에 "이게 뭐야 도대체..."라는 생각이 들었었는데..역시 그냥 맨땅의 헤딩을 해보며 조금씩 붙여보니까 아~~ 하겠더라구요.. 기본적으로 위와 같은 형태의 UI를 계속 적용해볼 생각입니다. 기능패치 내용입니다. 1. 동의어사전 탐색시 "오라클,oracle"을 찾을 때 "오라클" 과 같은 동의어셋을 구성하는 단일 단어로 검색이 되지 않던 부분을 수정하였습니다. 2. 동의어사전에서 동의어셋추가 혹은 삭제시 사전을 re-indexing 하도록 수정하였습니다. 3. SearcherManager 클래스를 적용하였습니다. 4. bootstrap 프레임워크를 적용하였습니다. 더보기
[Crescent] 10월 22일 수정리스트 1. 증분색인 기능을 구현하여 실시간으로 Update, Delete가 일어나게 되는 경우에러가 발생 할 수 있는 버그를 발견하여 이를 수정하면서 Lucene에서 기본으로 제공되는 SearcherManager를 적용하였습니다. (3.5 버전부터 제공) 이 클래스에 대해서는 NRTManager와 함께 별도로 포스팅을 해볼 예정입니다. 테스트 할 것이 꽤 많아 보여요... (좋아보입니다..^^) 2. 결과 JsonForm에 들어오는 error_code, error_msg의 생성 로직을 수정하였습니다. https://github.com/need4spd/crescenthttps://github.com/need4spd/lucene-korean-analyzer 더보기
[Crescent] 10월 18일 수정리스트 10월 18일 간단하게 수정된 수정 리스트입니다. 1. 관리자페이지에서 사전을 수정하면, 해당 사전을 바로 rebuild하여 이후 명사추출 결과에 바로 적용됩니다. - 단, 루씬 메모리 인덱싱을 사용하는 동의어사전은 좀 더 후에 re-indexing 기능을 구현 할 예정입니다. 2. 관리자페이지의 사전관리 페이지에서 바로 간단한 형태소분석 결과를 조회 할 수 있도록 하였습니다. 3. 정렬 필드로 설정한 _sort 필드로 정렬이 제대로 되지 않던 현상을 수정하였습니다. 4. 1번과 관련하여 walkingword의 DictionaryFactory에 사전 rebuild 메서드가 추가되었습니다. 5. 사전관리 페이지에서 사전의 길이가 짧을 경우 페이징에서 에러가 발생하는 문제를 수정하였습니다. 6. 검색 로깅 .. 더보기
[crescent] AWS에 올려놓은 형태소분석 결과 조회 페이지입니다. Crescent의 admin 기능 중 형태소 분석 결과를 조회 할 수 있는 페이지입니다. http://ec2-54-248-115-161.ap-northeast-1.compute.amazonaws.com/morphMain.devys AWS에 올려놓은 crescent의 형태소분석 결과 조회 페이지입니다. 한글자 형태소 분석은 빼야하나.. 싶기도 하네요... 보통 인덱싱할때와 검색 쿼리 분석 할 때 형태소 분석이 좀 차이가 있습니다.그래서 Analyzer의 모드도 두개로 나누고..분석 결과도 두개로 나누어서 보여주도록 하였습니다. 출력 포맷은 "단어,startoffset, endoffset, type"입니다. 이수명님께서 만드신 형태소분석기에 의해서 명사로 판별되었거나제가 만든 명사추출 Analyzer에서 사.. 더보기
[Crescent] Lucene으로 개발한 Http 기반의 검색엔진 9월 마감이 예정되어 있는 공개소프트웨어 개발자대회에 출품하려고 준비했던 프로그램입니다. 루씬을 사용한 검색엔진으로는 이미 아파치에서 나온 너무나도 출중한 Solr가 있습니다. 제가 만든 이 프로그램도 Solr를 모티브로 하여 개발을 하게 되었습니다. 그래서 사용법등이Solr랑 비슷한 점도 많구요.. indexingUtil.jar 같은 경우는 Solr의 소스를 보고 많이 따라하기도 했습니다. 프로젝트명도 태양을 뜻하는 Solr를 따라가고 싶지만 한 없이 모자람을 뜻하기 위해Crescent(초승달)로 지었습니다. ㅋㅋ 상용 솔루션을 대체 하기위한 프로그램은 아닙니다. 그리고 제가 왜 이렇게까지 검색엔진 개발이라는.. 사실 상용에 사용하기에는 턱 없이 부족하고엔진을 개발하기에도 실력과 준비도 부족한 상황에서.. 더보기