コンテンツへスキップ

PDFをエクセルに変換するソフト

翻訳の仕事を始めてから、私もだいぶコンピュータに詳しくなりました。

今回はPDFをワードやエクセルに変換する方法をいろいろと調べました。翻訳会社から送られて来る原稿がPDFで納品をワードまたはエクセルでということがよくあるためです。納期まで余裕がないことが多く、後から上書きできるファイルが送られて来てもすでに翻訳し始めているのでやはり自分でできれば納期も守ることができるかと思いました。

まず、オンラインで使用できるNitro PDF http://gigazine.net/news/20091207_pdf_convert/です。以前に原稿をいただいた時にはここを利用してPDFをワードに変換しました。難点は時間がかかることですが、私の場合、時差の関係で夕方にフィアルを受け取ることが多く、その時にアップロードしておけば翌朝には変換されてメールに添付されたものが受信できるので特に問題はありませんでした。あ、info@bested.co.nzではダメで個人のメールアドレスにしたらOKでした。

ところが、その後にいただいたPDFファイルはワードに変換されたものの画像として貼り付けられただけでしたので上書き翻訳することができないのです。それで、ワードで作られた文書をPDFで保存したものと、スキャンイメージなどから作られたPDFがあり、後者はOCRというものが関係しているというのが分かりました。

でも、OCRにはフリーソフトはなく、調べているうちに、今持っているPaperPortのスキャンソフトにあるのではないかと思い、チェックしたらあったのですが、エラーメッセージが出て来てエクセルやワードに変換することはできませんでした。その時、ペイントでそのファイルを開けてJPGで保存したものをワードやエクセルに貼り付ければ上記のNitro PDFの無料サービスと同じ状態のものが作れることが分かりました。(そのPDFファイルはしかも全部の文書が横になっていて、方向を変えて見ることはできてもそれを保存することができなかったのですが、PaperPortに取り込んで方向を変えればそのまま保存できることも分かりました。これで縦の文書にすることができました。)

「お金を出すしかないか~」とあきらめ、まずはニュージーランドの電気屋でも売っているNitro PDF($199)。高いな~とは思ったのですが、試用してみることにしました。でも、フリーのものと違うのは手元でPDFをワードやエクセルに変換できるというスピードのみで画像貼り付けのファイルになるというのは変わりませんでした。

で、『速攻!PDF to Data 2』(¥2980)の試用版をダウンロードしました。オドロキです!まぁ、文字認識ができていない部分もあり、修正しないと使えませんが、少なくともそこから英語にする方が自分で枠まで作るより楽そうです。ダウンロードはコチラ:http://shop.vector.co.jp/service/catalogue/sokkoupdf/data2/

でも、他にもいろいろあるんですね。値段もいろいろで、『速攻!PDF to Data 2』だけでも他に種類があります。いろいろな人に聞いてみましたが、どうもいい返答が得られなかったので自分でやるしかない!とがんばってみました。

『速攻!PDF to Data 2 Pro』(¥3980)との違いは、Pro版の方が文字はきれいでしたが枠がずれていたりして、Pro版でないものの方が安いですし、どうせ日本語の部分を使うわけではなく英語にしていくのですからそれでいいかと思いました。

お値段も高めの『読み取り革命』(¥12800)は日本語版のOSでないと表記がすべて???になるんですね。何をしているのかさっぱり分からなかったのとPDFをエクセルやワードに変換したいだけの私には複雑過ぎました。文字の認識などは特に『速攻!PDF to Data 2』と差異はありませんでした。

『いきなりPDF』と『やさしくPDF OCR』についてはコチラを参考にし、http://blog.livedoor.jp/pumpkin1205/archives/50073717.html 『やさしくPDF OCR』は値段も高いし複雑そうなので『いきなりPDF』だけを試してみることにしました。試用版のダウンロードはhttps://www.sourcenext.com/faq/cgi-bin/iki_p_trial.cgiから申し込みます。

これはNitro PDFと同じで画像を貼り付けただけのエクセルにしか変換できませんでした。ダウンロードにも変換にもかなり時間がかかりました。これもアンインストールしました。

よって、今のところ、『速攻!PDF to Data 2』かなと思ってます。完璧に文字を認識できるソフトはないようで、ある程度の作業は仕方ないようですが、値段的にも買っておいて損はないかなというところです。