'동의어필터' 태그의 글 목록

본문 바로가기

동의어필터

[루씬] 동의어 필터 제가 만들어서 사용하던 Analyzer에서 쓰던 동의어 필터입니다. 쇼핑몰을 염두해두고 작업했던 분석기라서 동의어 처리가 필요했는데요 아이디어 및 기초 소스는 루씬인액션 책에서 얻었고.. 그 소스를 좀 수정해서 만들었습니다. 책에는 영어의 동의어를 어디 사이트에서 가져올 수 있다고 되어 있었는데 한글은 그런 사이트를 찾을 수가 없어서 생각해보다가 Analyzer의 최초 인스턴스 생성시 RamDirectory를 사용해서 동의어를 색인해 놓고 Token에 대한 동의어를 뽑아주는 방식을 사용했습니다. 동의어사전의 형식은 그냥 오라클,oracle 노트북,notebook,note피씨 식으로 한 row에 ,로 구분해서 넣어주시면 되고 사전명은 디폴트로 synonym.txt로 설정되어 있습니다. 위치는 webappl.. 더보기

이전 1 다음

티스토리툴바