Wikimedia、セマンティック技術を利用したフリーのナレッジベース「Wikidata」プロジェクトを発表

 フリーの百科事典プロジェクト「Wikipedia」の運営母体となるWikimedia Foundationは3月30日、新プロジェクト「Wikidata」を発表した。セマンテック技術を利用した構造化データによるナレッジベースとなり、280以上の言語を持つWikipediaが利用する。

 WikidataはドイツのWikimedia Deutschlandが提案したもので、Wikimedia Foundationとしては2006年以来のプロジェクトとなる。プロジェクトの予算は130万ユーロで、Paul Allen氏が設立した人工知能研究を支援する非営利団体Allen Institute for Artificial Intelligenceが半分を、残り半分は米Intel設立者、Gordon Moore氏のGordon and Betty Moore Foundationと米Googleが出資する。

 Wikimedia FoundationではすでにWikimedia Commonsがマルチメディアファイルのデータベースを持っているが、Wikidataもこれと同様、全言語のWikipediaが共通して利用する単一の構造化データベースとなる。これにより、全言語での記事の一貫性と質を改善を図り、貢献者の少ない言語の編集者も情報を得やすくなるという。データ管理の手間も削減できるとしている。

 Wikidataプロジェクトは3段階で進める。第1段階ではリンクを中央に一元化し、現行の言語間リンクシステムを置き換える。時期は2012年8月終了を見込む。第2段階では、編集者がInfoboxでWikidataのデータを追加したり利用できるようにする。時期は2012年12月の予定。第3段階では、Wikidataのデータをベースにリストやチャートを自動生成できるようにする。

 第1段階はWikimedia Deutschlandが開発し、その後Wikimedia Foundationが作業を引き継ぎ、ホスティングとメンテナンスもWikimedia Foundationが行う。WikidataはCreative Commonsライセンスを利用する。

Wikimedia Foundation
http://wikimediafoundation.org/