'TermsEnum' 태그의 글 목록

본문 바로가기

TermsEnum

[lucene] MultiFields.getTerms. getSumTotalTermFreq in Lucene 4.2.1 예전에 루씬으로 색인한 인덱스파일로부터 Term Freq를 뽑는 포스팅을 한적이 있는데요.. http://devyongsik.tistory.com/577http://devyongsik.tistory.com/578 그 당시에는 인덱스리더로부터 TermVector를 하나 들고와서 TermVector로부터 Terms 객체를 얻어서getSumTotalTermFreq()를 실행했었고 이 값이 -1이 나왔었습니다. 이건 전체 Term의 Freq의 합이죠.. IndexReader ir = IndexReader.open(dir);Terms terms1 = ir.getTermVector(0, "f"); System.out.println(terms1.getSumTotalTermFreq()); 당시 루씬 메일링 리스트에 질.. 더보기

[lucene] TermFreqVector 얻기. (lucene 3.6, lucene 4.0) 루씬 3.X 버전까지는 IndexReader로부터 Term과 TermFreq를 얻기 위해서 아래와 같은 코드를 사용하였습니다. IndexReader로부터 TermFreqVector termFreqVector1 = ir.getTermFreqVector(0, "f"); 와 같은 형태로 document 하나에 대한 TermFreqVector를 얻어내고 이를 통해서 term 배열과 freq 배열을 얻어서 조합하는 방식입니다. 4.0에서는 IndexReader.getTermFreqVector 메서드가 사라지고 대신 아래와 같은 방법을 사용합니다. IndexReader.getTermVector(0, "f") 메서드를 사용합니다. 이때 Terms라는 클래스의 인스턴스를 얻을 수 있는데, 위 코드의 예에서는 doucm.. 더보기

이전 1 다음

티스토리툴바