10月の記事にあるとおり、OSMのDave Hansen氏は、国勢調査局のTIGER(Topologically Integrated Geographic Encoding and Referencing)システムからデータを取得してOSMで使える形式にオフラインで変換するというやり方を取った。
それで満足のいく結果が得られると、プロジェクトは3つの専用デーモンを一斉に稼働させてOSMのメインシステムへのデータのインポートを開始した。インポートされたすべてのデータが手作業で収集されたGPS軌跡データと同じようにOSMサーバのAPIを通るようにするには時間がかかったが、APIを通さずにデータベースを直接変更しようとするよりは安全な方法だった。
Quadtilesの活用
インポート開始時には、完了が2008年の5月下旬~6月上旬になると予測されていた。だが幸運なことに、管理者のTom Hughes氏が4分割方式を利用してデータベースのインデキシングをやり直す方法を発見し、データベースの検索時間が大幅に短縮されたのだった。
Quadtilesは地図を再帰的に4分割するもので、詳細情報が必要な部分だけをさらに分割することで記憶領域の利用効率を向上できる。たとえば、領域全体が海で道路のない部分はそれ以上分割する必要はないが、大都市の中心街であればさらに分割を行うわけだ。
4分割方式のキーによるデータベースのインデキシングは、結果的に2つの利点をもたらした。まず、キーのデータ長が短くなる。以前の緯度/経度によるインデックスの16バイトに対し、32ビットで済むので、必要なメモリ領域が減少する。また、階層的な特性により、地理的に隣接するノードどうしはデータベースのインデックスも近くなるので、キャッシュのパフォーマンスが向上する。
新しいデータベースインデックスは、インポートの速度だけでなく、すべてのAPI要求の処理速度に好ましい影響を与えたため、Hughes氏にはその他のOSM関係者からその功績を讃える賞(lolcat of awesomeness)が与えられた。
