2008年10月15日水曜日

テキストデータの復元

 午前中、自力出版に関する打合せに都心に出かけた。
 ある文芸団体の記念誌が本の内容だが、メンバーはプロの書き手なので、記念誌といえど、きちんとした本の体裁を求めている。しかし、予算は極度に少ないので、個人レベルでほどほどの仕事が可能な私に白羽の矢が立ったという次第だ。

 渡された資料は事前に打合せた内容にそったものだったが、持ち帰った原稿のデータのうち、フロッピーに入ったうちの1枚がエラーでどうしても読み込めない。「このフロッピーはひょっとすると読めないかもしれない」と言われていたが、不安は当たった。

 すでに壊れて廃棄してしまった古いワープロで打った原稿だそうで、以前にも印刷会社に納めたフロッピーで、同じことがあったとか。悲しいことに、バックアップは存在しない。唯一あるのが、そのワープロで印刷したという原稿一式だった。
「もし読めなかった場合は、この原稿を元に何とか復元させます」と請け負ったが、まさにその通りの事態になった。用紙が感熱紙で、ところどころ文字が消えかけて心もとないが、何もないよりはマシ。
_かなり前だが、スキャナーを買った際にバンドル(付録)されてきたソフトに、「原稿をスキャナーで読み取り、それをテキストデータに変換する」という便利なものがあった。いわゆる「OCRソフト」というもので、数回使ったことはあるが、私には必要ないので眠ったままだった。
 古いCDケースをひっくり返し、ようやくそのソフトを見つけた。マック版とWin版の両方があるが、マック版は古いOS9専用。本の編集はマックでやっているが、OS-X対応に換えたばかり。起動をその都度変更するのも面倒なので、今回はWin版をインストールすることにした。

 さっそく試してみたら、文字認識変換率が軽く90%を超える。非常に優秀なソフトだ。データの欠損していた原稿はすべて復元できた。あとはこのデータをマックに転送し、体裁を整えたあと、元原稿と再度の読み合わせをやればいい。
 今日打合せた相手は、お二人とも「先生」と呼ばれる立場の方だが、私より一回り近くも年上なので、パソコンやネットには疎い。私があれこれ説明すると、「そんなことも出来るの?!」と、たいそう驚かれていた。