さて、いよいよメインイベント、接続したデータベースの表にあるデータを解析してみよう。左パネルのツリーから解析したい表を探し、展開してその表にある欄を表示し、その中から解析したい欄を選択する。右クリックして「Create New Analysis」画面を表示し、実行する統計の種類を指定する。具体的には、欄ごとに統計のタイプ(Simple、Text、Summary、Advanced)を指定していく。そして、解析を実行する。こうした操作を解説したOpen Profiler Getting Started Guideが用意されており、手順に従ってオプションが説明されている。もう少し詳しく説明してほしいとは思うが、ともあれ、これを見ながら使い始めることはできる。
筆者はCentOS 5システム、Javaバージョン1.6.0_06、Perl v5.8.8、Oracle 11gデータベースという環境で試用したのだが、ダウンロードとインストールは簡単、かつ、すぐに終わった。Downloadページを開いてから起動して画面が表示されるまで、10分ほどしかかからなかった。
最後に、この試用で見つけた課題をいくつか指摘しておこう。リフレッシュ頻度はもう少し高い方がよいと思われる。表、ビュー、欄の各種件数が表示されるが、ツリーを一旦出て再び戻るまで更新されないものがあるようだ。今後への希望として、OracleとMySQL以外のデータベースのサポートを挙げておこう。
データアナリストやDBAや業務の専門家は定期的にデータの妥当性を調べる必要があるが、通常、その調査には特殊なスキルだけでなく、料金の高い専門家や高価なツールが必要だ。しかし、Talend Open Profilerを利用すれば、一般の利用者とアナリストやDBAが一緒にデータについて考えることができる。
