XORが目指すところ

XORはPDF比較ツールと呼ばれる分野のアプリです。修正前と後のPDFの差異を見つけます。

PDFの新旧比較は普遍的ニーズなので、この分野には既存製品がたくさんあります。中でも以下の二つが有名です。

  • Adobe Acrobat DC PRO
  • Proof Checker PRO

他にもあるようだけど私は導入事例を知りません。何しろ私が昨年まで勤めていた都内の制作会社でも、その前に勤めていた横浜の制作会社でもProof Checker PROを導入していたこともあり、他のツールを導入しようという動きがなかったもので。

とはいえProof Checker PROは中小規模の制作会社ではおいそれと導入できないハイエンドツール。ましてやフリーランスの個人ともなるとまったく手が届かないので市場に開拓余地は残されているはずです。

よってXORはそれらに次ぐ「第三のツール」のポジションを狙っています。Mac版しかない現状ではアピールが難しいけど、Windows版をリリースできたらいよいよ本格的にレースに参入です。

Acrobatの難点

Adobe Acrobat DC PROはドキュメンテーション業界では必須ツールです。大変重宝しています。

Adobe Acrobat のアイコン

ただし手放しでありがたがっているわけではありません。というのも動作が重いのですよね…。

例えばmacOSにバンドルされているプレビュー.appはAcrobatよりもキビキビと動作します。でも、プレビュー.appの方は注釈機能の使い勝手などがAcrobatほど使い勝手がよくありません。テキストを選択したらコンテキストメニューから注釈化を選べればいいのですが。

PDFの閲覧だけならプレビュー.appだけど、それ以外の用途では重たいAcrobatに頼らざるを得ない状況が続いています。

PDF解析比較の致命的な弱点

Adobe Acrobat DC PROのPDF比較機能は解析比較方式です。二つのPDFのデータ構造を解析して付き合わせて比較します。

この方式の弱点は二つ。

  1. 時々比較もれが起きる
  2. 動作が重たい

1 の説明は『AcrobatのPDF比較で痛い目にあった話』を参照してください。

2 は時としてもっと厄介です。例えば100ページを超える二つのPDFを比較しようとすると、前処理に長い時間がかかった挙句、比較中にアプリが異常終了して時間が無駄になることも多いので。散々待たされた上に途中までの比較結果さえ提示してくれないという。

もちろん50ページずつに切り分けて別々に比較することはできるけど、面倒ですよね。場合によってはもっと細かく分けなければならないかもしれないし。

ちなみにXORなら100ページかそこらならへっちゃらだし、PDFを読み込んだら前処理もなくすぐに比較を始められます。

顧客サービスにもXORを

私が昨年春まで勤めていた都内のドキュメント制作会社の部署では、あるクライアントの取説を改版する際にAcrobatを使ってPDF上の変更箇所をコメント機能の四角形で囲んで提出していました。

これってそこそこ面倒な作業だし、それなりに人件費もかかっていたものの制作費としては請求できず、顧客サービスの一環で始めたものが慣習化してやめるにやめられなくなったそうで。

でも、一通り修正が完了したことを確かめてから、コメントの四角形を付けるのは二度手間ですよね。

さしあたXORを使えば、この工程は付加的な作業ではなく通常の確認作業の作業として済ませられます。

XORの導入後は、変更箇所に一通り四角形をつけてから確認作業に入るという順番になるので、確認結果がOKだと判断できたときには、すべての変更箇所に四角形が付加されています。

Result of comparison by xor
XORで変更箇所に囲みを付けてPDFに書き出した時のイメージ

PDFの不思議な仕様

以前、PDFのデータ形式を覗いてみたことがあります。きっかけは、ほんのわずかなテキスト修正だったのに、Adobe Acrobat DCのPDF比較機能が差異を見つけてくれなかったから。

そこで修正前と後のPDFをテキストエディタで開いてみて驚いたのが、描画要素の並びがかなり違っていたこと。HTMLなら基本的に上から下に要素を記述していくけど、PDFでは違うようです。「どこに描画されるべきか」という情報を持った要素が順不同で格納されていたかと。Acrobatの読み上げ機能でページを読ませても上から順に読み上げてくれないのもそのせいなのでしょう。

それってAmazonの倉庫のような感じかと。Amazonの倉庫では入荷した商品を整頓して格納するのではなく、無造作に格納する代わりにどこに何があるかを厳格に管理しているそうですね。これにより格納場所の選定や整列に迷うことがなくなり業務効率が上がります。

PDFの仕様がそのような思想で策定されたのかは知らないけど、それが正確なPDF比較を難しくしている要因の一つなのかも。もちろん各ツールは表示上の順番を把握した上で比較していくのだろうけど、それでもその仕様のおかげで要素のペアリングが難しいケースも出てくるのではないかと。