「XORなんて…」と思うなら

XORはPDF差異検出ツール、あるいはPDF比較ツールと呼ばれる類いのアプリです。

この分野はそこそこ歴史も長く、多くはないけど既存製品がいくつかありますAdobe Acrobat Pro DCProof Checker PROといった定番アプリの他にもフリーで使えるものも存在しています。

よってXORを知ったところで「無名の有料アプリなんか要らない」と思われる方は多いでしょう。そこで実例をもってXORの有用性をアピールしたいと思います。

例えばこちらの二つのPDF。

NTTの光回線の機械に付属する取扱説明書の新旧バージョンです。特に許可は得ていないものの、公開されているので使わせていただきました。

これをAcrobatで比較するとこんな感じ(クリックで拡大表示)。

Compare result by Acrobat
ハイライトの箇所をクリックすると「画像が置換されました」といった変更内容が表示されます

少なくとも私にとってはこれが見やすい、解りやすい比較結果には思えないのですよね。私の注意が散漫なのかもしれないけど、せっかく差異を見つけてくれても見落としそうになるので。昔のAcrobatでは引出し線付きで図解してくれていて便利だったけど、そのモードは今では無くなったみたいですね。

これに対してXORにおける比較結果はこの通り。

Compare-result-by-Acrobat
青や赤がにじんでいるところはすべて差異です

私にとってはXORの方が既存のどのPDF比較アプリよりも差異の箇所を探しやすいと思うのでですが、いかがでしょう?

というわけで、ぜひ他のお気に入りアプリでも試してみてください。XORよりも良いアプリが見つかるかもしれないけど、XORの方がいいと感じる方もおられるかと思うので。

なお、XORには決定的な弱点があることも把握しています。よって次のバージョンではその点を克服した機能を搭載する予定です。

AcrobatのPDF比較で痛い目にあった話

まず最初にAdobe Acrobatは素晴らしいアプリであることを断言しておきます。印刷業を含む商用ドキュメンテーションを生業にしている人は誰しも恩恵を受けていることでしょう。もちろん私も愛用しています。

Adobe Acrobat のアイコン

そのAcrobatシリーズの内、Acrobat PRO DCにはPDF比較機能があります。これ、便利だけど残念ながら完璧ではないのですよね。

例えば、以前私がとある冊子ものの取扱説明書を改版したときにこの機能を使ったところ、最終ページに存在した差異を報告してくれないことがありました。

その差異は無用な変更で、改版日の「2017」が「2016」になっているといった類の単純ミス。しかも運悪くダブルチェックをお願いした相手も見過ごしてしまったため、自信を持って提出したら、クライアントから指摘される失態を演じてしまいました。

見過ごした原因は修正原稿に赤字が入っていない箇所だったため。よもや赤字以外の箇所が変更されているとは思いもよらなかったわけです。

加えて、私もAcorobatのPDF比較機能が完璧でないことは承知していたものの、「単純なテキストの差異はすべて見つけてくれたはず」という先入観が働いていたのだと思います。

でも、途中のページまではしっかり差異を検出してくれていたので、何かの拍子にアルゴリズムが最終ページに到達する前に終了してしまったのでしょう。PDFのデータ構造は複雑なので、解析方式による比較ではどうしても相性の良し悪しが出てきます。

ひょっとしたら将来のAcrobatではビッグデータの利用やAI技術などを盛り込んで完璧に近い比較ができるようになるかもしれません。大きく修正された場合でも要素の正確なペアリングを推測するような。でもそれは未来の話。

よって現時点ではXORのようなPDFページをビジュアル的に比較するアプリを併用した方がいいと思います。

XORは「どう変わったか?」は無理だけど「どこが変わったか?」なら100%見つけ出します。

xor concept animation

XORをAcrobatと併用すれば完璧に

XORは二つのPDFをビジュアル的に比較して、差異を100%見つけ出すアプリです。

商用ドキュメントの制作過程で「意図や指示が正しく反映されているか?」はもちろん「余計な変更がなされていないか?」を確かめるために新旧PDFの比較は必要不可欠なので、工数削減のためにもいいアプリを活用したいところです。

XORの理想的な使い方はAdobe Acrobat DCとの併用でしょう。

Adobe Acrobat のアイコン

何度か書いている通り、PDFの品質確保で最も頼れる既存製品はProof Checker PROです。以前からPDF解析による比較精度の高さには定評があったものの、昨年発売されたバージョン5でビットマップ比較モードが追加され、より完璧なデジタル校正ソフトウェア(PDF比較)となりました。

とはいえ、1ライセンス100万円超のこのハイエンドソフトウェアを導入できるのは大きな組織のみ。その他の人たちにとってPDF比較の手段といえばAcrobatにの比較機能になるでしょう。

ただし、PDFを解析して比較するAcrobatではときおり差異の見過ごしが起こります。

そこでXORを併用して補わせるのがいいでしょう。PDFをヴィジュアル的に比較するXORはAcrobatのように「どのように変わったか?」は判断できない替わりに「どこが変わったか?」は確実に検出します。まったく変更されていないページを洗い出すのも簡単です。

各アプリを比較するとこの通り。

解析比較 ヴィジュアル比較
Proof Checker PRO
Acrobat
XOR

AcrobatにはPDFページを画像化して比較するモードがなく、XORにはPDFのデータ構造を解析して比較するモードがありません。

よってこの両者を併用することで、なんとかProof Checker PROに近いところまでキャッチアップできるのではないかと

30日の使用期間があるので、まずはお試しください。

App icon of the XOR

XOR

リアルタイムPDF比較ビューワ

2,000円(税込)/月
(サブスクリプション)

  • Download_on_the_Mac_App_Store_Badge_ja

Windows版は追ってリリース予定です。

PDF比較で「どのように変わったか」は本当に要る?

Adobe Acrobat DCのPDF比較機能を使うと、修正された新旧PDFの間で「どこがどのように変わったか?」をリポートしてくれます。解析精度が完璧ではない点はひとまず脇に置いて、ここでは問題提起をしましょう。

  • 「どこが」はともかく「どのように変わったか」は本当に要るの?

例えば下図のようなDTP原稿があったとします(画像のクリックで拡大表示)。

DTP原稿の例

これに対してDTP担当者から下図のような修正結果が上がってきました。

DTPによる修正結果
残念ながら「太字の」という指示が反映されていません

よって新旧をAcrobatのPDF比較にかけるとこういう結果になります。

AcrobatによるPDF比較の結果例

「イザリウオ」が「カエルアンコウ」に変更された点は検出したけど、DTP原稿の「太字の」が反映されていないことには気づいてくれません。そう、Acrobatが見つけるのは「どう変わったか」であって「指示通りに変更されたか?」ではないのですよね。

だったらどうせ人間が確認しなければならないのだから「どこが変わったか」だけで十分ではないでしょうか?

XORは「どこが変わったか」だけを検出するアプリです。