米ClouderaがHadoop向けの検索モジュール「Cloudera Search」を一般リリース

 米Clouderaは9月5日、「Apache Hadoop」向けの検索モジュール「Cloudera Search 1.0」を発表した。これまではベータ版として公開されていた機能で、初の一般提供(GA)となる。

 Cloudera Searchは「Apache Solr」や「Apache Lucene」をベースとし、「Hadoop Distributed File System (HDFS)」と「Apache HBase」に保存されたデータを検索するためのモジュール。Hadoopのファイルフォーマットに最適化された「Apache Avro」などを利用して、HDFSに保存されたデータのフィールド抽出が可能になる。これにより、インタラクティブな全文検索やインデックス化などの機能を利用でき、データの活用を加速しオペレーションを合理化できるという。インデックス化には「Apache Flume」や「Lily HBase Indexer」を利用し、HDFSとHBase上のデータをほぼリアルタイムでインデックス化できる。このほか、HDFS/Hbase上でのファセットナビゲーション、Kerberos認証によるクラスタレベルのアクセス制御、拡張性のあるMapReduce経由バッチインデックス、HDFSでのSolrCloud実装などの機能も提供する。「Cloudera Manager」との統合も可能で、運用環境の状況モニタリングを改善できるという。

 ClouderaはGA版公開に合わせて、Apache SolrおよびApache Luceneのアップストリームプロジェクトにコードを貢献したことも明らかにしている。

Cloudera Search
http://www.cloudera.com/content/cloudera/en/products/cdh/search.html

米Cloudera
http://www.cloudera.com/