Java全文検索ライブラリApache Lucene 3.5リリース。Solrも同時にアップデート

 Apache Lucene Projectは11月27日、Javaベースの全文検索エンジン「Apache Lucene 3.5」をリリースした。同時に、Luceneを利用した全文検索システム「Apache Solr 3.5」も公開されている。

 Apache LuceneはApache Software Foundationのトップレベルプロジェクトとして開発が進められているテキスト全文検索エンジン。シンプルなAPIで強力な検索機能を提供するとしている。スケーラビリティやインデクシング性能に優れており、最近のハードウェアであれば1時間に95GBものインデクシングが可能という。ワイルドカードなどさまざまな検索クエリをサポートし、検索結果の順位付けやソートといった機能も備えている。

 Apache Lucene 3.5.0では、IndexReaderクラスにおけるメモリ消費の大幅な削減や「IndexSearcher.searchAfter」メソッドの追加、複数の検索スレッドからIndexSearcherクラスを共有・再利用するための「SearcherManager」クラスの導入などが行われている。n-gram解析利用時にフレーズクエリを30~50%高速化する「NGramPhraseQuery」クラスも追加された。

 また、Apache Luceneを検索エンジンとして使用する検索エンジンApache Solrもバージョン3.5にアップデートされた。分散検索で検索結果のグルーピングがサポートされたほか、言語判別のための「langid」モジュールの追加などが行われている。

 Apache LuceneとApache Solrはプロジェクトのページよりダウンロードできる。

Apache Lucene
http://lucene.apache.org/

Apache Solr
http://lucene.apache.org/solr/