ハードディスクの中身を誤って消した場合のファイル復旧方法 2ページ

復元処理の後始末

これでファイルをすべて復元できたが、ハードディスク上にたくさんのファイルができてしまった。1つ1つのファイルを手動で確認していくのでは時間もかかるし面倒である。そこで、私はまず/var/recoveryディレクトリ内にVID/、DOC/、JPG/という3つのフォルダを作成し、次のコマンドを使用してファイルをそれぞれのフォルダに振り分けた。

find /var/recovery/ -name "*.avi" | xargs -i mv {} /var/recovery/VID/

find /var/recovery/ -name "*.mpg" | xargs -i mv {} /var/recovery/VID/

find /var/recovery/ -name "*.jpg" | xargs -i mv {} /var/recovery/JPG/

これで各ファイルが種類別のフォルダに振り分けられたが、これで一件落着したわけではない。今回の事件が発生する前の私のハードディスクには10,000個以上の画像が格納されていて、サイズにして2MBほどあった。PhotoRecは、復元プロセスの際に見つかった画像をすべて復元するので、その中には、たとえばWebブラウザキャッシュ内の画像ファイルなども含まれている。つまり、不要なファイルも山ほど復元されているわけだ。こうした雑多なソースからの画像ファイルを取り除くために、私は1MB未満のファイルをSMALLというフォルダに移動させた(このフォルダは、念のためその中に必要なファイルがないと確信が持てるまで残しておいた)。これらのファイルをSMALLフォルダに移動させるには、次のコマンドを使用した。

find /var/recovery/JPG/ -name "*.jpg" -size -1024k | xargs -i mv {} /var/recovery/SMALL/

PhotoRecはファイルの名前を復元しないが、ラッキーなことに、私の復元した写真ファイルには撮影日時や撮影情報などのEXIFメタデータが含まれていた。そこで、Jheadコマンドラインユーティリティを使用してこのメタデータを抽出した。具体的には、JPGフォルダで次のコマンドを実行した。

jhead -n%Y%m%d-%H%M%S *.jpg


このコマンドでは、jpgという拡張子を持つすべてのファイルの名前を、タイムスタンプを含んだ「YYYYMMDD-HHMMSS.jpg」という形式に変更している。タイムスタンプが同一のファイルには、「YYYYMMDD-HHMMSSx.jpg」という名前が付けられる(xの部分には、a、b、c...という英字が入る)。これらの写真がすべて同じデジカメで撮影したものならば、同じタイムスタンプを持つファイルはまったく同じ写真のはずである。そこで、次のコマンドを使用して重複ファイルをDUPSフォルダに移動した。

find /var/recovery/JPG/ -name "*a.jpg" | xargs -i mv {} /var/recovery/JPG/DUPS/

各ファイルにタイムスタンプでラベルを付けることができれば、これらのファイルを撮影した年や月に応じてフォルダに分類できる。

もし私が写真ファイルにキーワードやコメントを追加していたら、libextractorを使ってJPEGファイルからキーワードを抽出し、キーワードに基づいてファイルをフォルダに振り分けることも可能だったはずだ。しかし残念ながらそうはしていなかったので、復元した写真を何時間もかけて手動でフォルダに振り分けなければならなかった。しかしAVIファイルについては、libextractorを使ってそれぞれのビデオのコーデック、フレームレート、解像度の情報を判別することができた。

復元を防ぐ方法

私としてはファイルをこれほど「簡単に」復元できて助かったのだが、これは逆に言えば、自分の古いコンピュータやハードディスクを廃棄した場合に、重要なデータがたやすく復元されてしまうということでもある。しかし、特別なやり方をすれば、ハードディスクのデータを復元不可能な方法で消去することができる。Whitedust Securityは、安全なデータ消去の方法として次の例を挙げている。

  1. 既存のデータを価値のないデータで上書きする
  2. ハードディスクを酸液槽に漬ける
  3. ハードディスクを消磁装置で消磁する
  4. ディスクを火で熱する

ハードディスクを使用不能にしたくない場合は、既存のデータを上書きするか、ハードディスクを消磁するのがよい。消磁装置を利用できないときは、Wipeのようなプログラムを使用して、データを復元不可能にするパターンで上書きする。心配な場合は、気が済むまでデータを何回か繰り返し消去するとよいだろう。22回繰り返すよう勧める人もいれば、絶対安全にするなら99回繰り返す必要があると言う人もいる。PhotoRecのようなツールだけを使った復元への対策ならば、3回か4回繰り返せば十分だと思われる。

NewsForge.com 原文