Acrobat DC – ページ 2 – XOR for Mac & Windows:リアルタイムPDF比較ビューワ

PDFの不思議な仕様

以前、PDFのデータ形式を覗いてみたことがあります。きっかけは、ほんのわずかなテキスト修正だったのに、Adobe Acrobat DCのPDF比較機能が差異を見つけてくれなかったから。

そこで修正前と後のPDFをテキストエディタで開いてみて驚いたのが、描画要素の並びがかなり違っていたこと。HTMLなら基本的に上から下に要素を記述していくけど、PDFでは違うようです。「どこに描画されるべきか」という情報を持った要素が順不同で格納されていたかと。Acrobatの読み上げ機能でページを読ませても上から順に読み上げてくれないのもそのせいなのでしょう。

それってAmazonの倉庫のような感じかと。Amazonの倉庫では入荷した商品を整頓して格納するのではなく、無造作に格納する代わりにどこに何があるかを厳格に管理しているそうですね。これにより格納場所の選定や整列に迷うことがなくなり業務効率が上がります。

PDFの仕様がそのような思想で策定されたのかは知らないけど、それが正確なPDF比較を難しくしている要因の一つなのかも。もちろん各アプリは表示上の順番を把握した上で比較していくのだろうけど、それでもその仕様のおかげで要素のペアリングが難しいケースも出てくるのではないかと。

XORでコストカットしませんか?

30日の無料試用期間後もXORをお使いいただく場合、月額2,000円のサブスクリプション契約が必要なので、導入するならそれに見合った納得感が要りますよね。

そこでこんな使い方はどうでしょう?

修正されていないページを洗い出して確認対象から除外する

XORは二つのPDFを画像化して差異をあぶり出すため、対になるページの変更点を100%検出します。人間が違いを見逃さない限り、すべての変更箇所を把握できるわけです。

どこが変更されたかを把握できるならその逆も然り。まったく変わっていないページも容易に見つけられます。

例えば、取扱説明書は製品のマイナーチェンジに伴い何度も改版される傾向があります。ページ数の多い案件ともなると修正前後のPDFを自力で比較するのは大変な作業です。DTP原稿の赤字箇所の確認だけならともかく、「予期せぬ差異がどこかに潜り込んでいるかもしれない」という観点で数十ページ、数百ページ規模の取説を1ページずつ見ていこうものなら、かなりの時間を要します。ものによっては何時間もかかったり、複数人で手分けする必要が出てくるでしょう。しかも徒労感が募れば次第に集中力も落ち兼ねません。

でも、XORを使って最初に「まったく変更がないページ」を洗い出せば、確認対象をそれ以外のページだけに絞り込めます。

日本の平均的なサラリーマンの給与を時給換算で約2,500円と仮定すると、1ヶ月に1時間分の時短ができればXORの2,000円というサブスクリプション費用は軽く相殺されるでしょう。もちろんXORに利用回数の制限はないので他の案件でさらに1時間削減できれば計5,000円相当の時間的余裕が生まれます。残業せずに帰るもよし、空いた時間で他の案件を担当して業績を上げるもよし。時短が10時間に登ろうものならXOR1年分のサブスクリプション費用相当のコストカットが実現できてしまいます。だとしたら月額2,000円も実は安いとは考えれれないでしょうか?

なお、ドキュメンテーション業界のほとんどの人がすでに使っているAdobe Acrobat PRO DCの比較機能でも同じことができそうに思うかもしれないけど、PDFの内容を解析して比較する方式のため、データ構造次第では差異の検出もれが発生します

タダより高いものはない

「タダより高いものはない」とはよく言ったもので、わずかな手間や出費を惜しんだばかりにかえって痛い目にあうことってありますよね。

私も制作の現場で何度も経験しました。不思議なことにちょっと手の込んだ修正箇所の不具合には気づくのに、単純なミスに限って見逃しがちだったりします。簡単だからこそ注意力が薄れるのでしょう。誤字脱字などは脳内で正しく変換されがちだし。

そうして制作側で気づくべき不具合を残したままクライアントに提出してしまい、先方から指摘されようものなら恥ずかしい思いをするし、校了が出て印刷が進んだ後で不具合が発覚すれば責任問題になったり、刷り直しの追加コスト負担を求められることも。

いや、そもそもクライアント側が校了を宣言したならそれでOKのお墨付きが出た意味合いのはずだけど、実際には仕事を依頼する側と受ける側の力関係によって、こちらが泣くことになりがちです。

そうして痛い目に遭ったときに思います。「あのときもう少し丁寧に修正内容を確認していれば、こんなことにならなかったはずだよな…」と。

とはいえ反省や気合いではスキルは上がらないし、むしろ疑心暗鬼になって確認作業に余計な時間をかけるようにもなりかねません。「あつものに懲りてなますを吹く」という状態ですね。

よって確認クオリティの向上に最も有効な手段は「新たなアプリを導入すること」です。すでに何かを使っているなら違う特徴を備えたアプリを併用すると良いでしょう。

例えばAdobe Acrobat PRO DCは解析比較なのでデータとの相性次第では検出もれが起こります。

Proof Checker PROには解析比較だけでなくビットマップ比較があるものの、締め切りが重なればドングルの順番待ちが発生します。アプリ自体は素晴らしいのに、「大丈夫だろうとタカを括って検証を省いたら拙い不具合が混入していた」なんてことが起きかねないわけです。

そこでXORの導入をご検討いただけると幸いです。月額2,000円は安くはないかもしれないけど、1日100円(x20日)で致命的なミスを防げるかもしれないし、事が起こってしまえばもっと厳しい出費を強いられかねないので。

XOR Subscription dialog

PDF比較、みんなどうしてます?

ドキュメント制作においてPDFの新旧比較は必須行程です。

もちろんちょっとした修正しかされていないと解っていれば、画面なり校正紙の目視確認で構わないでしょう。でも、そこそこ修正量があるなら何らかのツールを使って見比べたいところです。

あるいはポカが多いDTPオペレータに修正を依頼した場合などでも予期せぬ修正がなされていないかを念入りに確かめたいかと。そう、どこかを修正すると、別のところに良からぬ影響が出ることもあるから。

大きな組織ならProof Checker PROを導入しているだろうから、それを使いますよね。

Proof Checker Pro 5 LITEの画像
Proof Checker PROは最強ツールだけど100万円を超えるので大きな組織じゃないと導入できませんよね…

中小の制作会社や個人の製作者であればAdobe Acrobat PRO DCかな。

これらの他のツールを使っている人って、どれぐらいおられるのでしょうか?

よかったら普段どんなツールを使っているか、コメント欄やFacebook、Twitterで教えてください。事例が集まってきたら統計として発表したいと思います。

「XORなんて…」と思うなら

XORはPDF差異検出ツール、あるいはPDF比較ツールと呼ばれる類いのアプリです。

この分野はそこそこ歴史も長く、多くはないけど既存製品がいくつかありますAdobe Acrobat Pro DCProof Checker PROといった定番アプリの他にもフリーで使えるものも存在しています。

よってXORを知ったところで「無名の有料アプリなんか要らない」と思われる方は多いでしょう。そこで実例をもってXORの有用性をアピールしたいと思います。

例えばこちらの二つのPDF。

NTTの光回線の機械に付属する取扱説明書の新旧バージョンです。特に許可は得ていないものの、公開されているので使わせていただきました。

これをAcrobatで比較するとこんな感じ(クリックで拡大表示)。

Compare result by Acrobat
ハイライトの箇所をクリックすると「画像が置換されました」といった変更内容が表示されます

少なくとも私にとってはこれが見やすい、解りやすい比較結果には思えないのですよね。私の注意が散漫なのかもしれないけど、せっかく差異を見つけてくれても見落としそうになるので。昔のAcrobatでは引出し線付きで図解してくれていて便利だったけど、そのモードは今では無くなったみたいですね。

これに対してXORにおける比較結果はこの通り。

Compare-result-by-Acrobat
青や赤がにじんでいるところはすべて差異です

私にとってはXORの方が既存のどのPDF比較アプリよりも差異の箇所を探しやすいと思うのでですが、いかがでしょう?

というわけで、ぜひ他のお気に入りアプリでも試してみてください。XORよりも良いアプリが見つかるかもしれないけど、XORの方がいいと感じる方もおられるかと思うので。

なお、XORには決定的な弱点があることも把握しています。よって次のバージョンではその点を克服した機能を搭載する予定です。

AcrobatのPDF比較で痛い目にあった話

まず最初にAdobe Acrobatは素晴らしいアプリであることを断言しておきます。印刷業を含む商用ドキュメンテーションを生業にしている人は誰しも恩恵を受けていることでしょう。もちろん私も愛用しています。

Adobe Acrobat のアイコン

そのAcrobatシリーズの内、Acrobat PRO DCにはPDF比較機能があります。これ、便利だけど残念ながら完璧ではないのですよね。

例えば、以前私がとある冊子ものの取扱説明書を改版したときにこの機能を使ったところ、最終ページに存在した差異を報告してくれないことがありました。

その差異は無用な変更で、改版日の「2017」が「2016」になっているといった類の単純ミス。しかも運悪くダブルチェックをお願いした相手も見過ごしてしまったため、自信を持って提出したら、クライアントから指摘される失態を演じてしまいました。

見過ごした原因は修正原稿に赤字が入っていない箇所だったため。よもや赤字以外の箇所が変更されているとは思いもよらなかったわけです。

加えて、私もAcorobatのPDF比較機能が完璧でないことは承知していたものの、「単純なテキストの差異はすべて見つけてくれたはず」という先入観が働いていたのだと思います。

でも、途中のページまではしっかり差異を検出してくれていたので、何かの拍子にアルゴリズムが最終ページに到達する前に終了してしまったのでしょう。PDFのデータ構造は複雑なので、解析方式による比較ではどうしても相性の良し悪しが出てきます。

ひょっとしたら将来のAcrobatではビッグデータの利用やAI技術などを盛り込んで完璧に近い比較ができるようになるかもしれません。大きく修正された場合でも要素の正確なペアリングを推測するような。でもそれは未来の話。

よって現時点ではXORのようなPDFページをビジュアル的に比較するアプリを併用した方がいいと思います。

XORは「どう変わったか?」は無理だけど「どこが変わったか?」なら100%見つけ出します。

xor concept animation

XORをAcrobatと併用すれば完璧に

XORは二つのPDFをビジュアル的に比較して、差異を100%見つけ出すアプリです。

商用ドキュメントの制作過程で「意図や指示が正しく反映されているか?」はもちろん「余計な変更がなされていないか?」を確かめるために新旧PDFの比較は必要不可欠なので、工数削減のためにもいいアプリを活用したいところです。

XORの理想的な使い方はAdobe Acrobat DCとの併用でしょう。

Adobe Acrobat のアイコン

何度か書いている通り、PDFの品質確保で最も頼れる既存製品はProof Checker PROです。以前からPDF解析による比較精度の高さには定評があったものの、昨年発売されたバージョン5でビットマップ比較モードが追加され、より完璧なデジタル校正ソフトウェア(PDF比較)となりました。

とはいえ、1ライセンス100万円超のこのハイエンドソフトウェアを導入できるのは大きな組織のみ。その他の人たちにとってPDF比較の手段といえばAcrobatにの比較機能になるでしょう。

ただし、PDFを解析して比較するAcrobatではときおり差異の見過ごしが起こります。

そこでXORを併用して補わせるのがいいでしょう。PDFをヴィジュアル的に比較するXORはAcrobatのように「どのように変わったか?」は判断できない替わりに「どこが変わったか?」は確実に検出します。まったく変更されていないページを洗い出すのも簡単です。

各アプリを比較するとこの通り。

解析比較 ヴィジュアル比較
Proof Checker PRO
Acrobat
XOR

AcrobatにはPDFページを画像化して比較するモードがなく、XORにはPDFのデータ構造を解析して比較するモードがありません。

よってこの両者を併用することで、なんとかProof Checker PROに近いところまでキャッチアップできるのではないかと

30日の使用期間があるので、まずはお試しください。

Windows版は追ってリリース予定です。

PDF比較で「どのように変わったか」は本当に要る?

Adobe Acrobat DCのPDF比較機能を使うと、修正された新旧PDFの間で「どこがどのように変わったか?」をリポートしてくれます。解析精度が完璧ではない点はひとまず脇に置いて、ここでは問題提起をしましょう。

  • 「どこが」はともかく「どのように変わったか」は本当に要るの?

例えば下図のようなDTP原稿があったとします(画像のクリックで拡大表示)。

DTP原稿の例

これに対してDTP担当者から下図のような修正結果が上がってきました。

DTPによる修正結果
残念ながら「太字の」という指示が反映されていません

よって新旧をAcrobatのPDF比較にかけるとこういう結果になります。

AcrobatによるPDF比較の結果例

「イザリウオ」が「カエルアンコウ」に変更された点は検出したけど、DTP原稿の「太字の」が反映されていないことには気づいてくれません。そう、Acrobatが見つけるのは「どう変わったか」であって「指示通りに変更されたか?」ではないのですよね。

だったらどうせ人間が確認しなければならないのだから「どこが変わったか」だけで十分ではないでしょうか?

XORは「どこが変わったか」だけを検出するアプリです。

Proof Checker PROには敵わないけど…

PDFの新旧比較をする製品として業界内で絶大な信頼を勝ち得ているのがProof Checker PRO。PDFの品質確保に特化しているので、万能アプリのAcrobatよりも精度の高い比較結果を返してくれます。加えてプリフライトの機能も優れているので、制作受注コンペの際に「Proof Checker PRO導入済み」は殺し文句のような効力を発揮します。

Proof Checker Pro 5 LITEの画像

そのProof Checker PROもバージョン4まではAcrobatと同じくPDFのデータを解析するタイプの比較が主力機能だったけど、昨年発売のバージョン5では「ビットマップ比較モード」が加わり、より完成度の高い校正ソフトウェアとなりました。

解析方式による比較だとPDFのデータ構造や修正内容によっては要素のペアリングがうまくいかず、どうしても不正確な結果が出かねないけど、ビットマップ化してビジュアル的に比較すればそれを補えるわけです。

ただし、Proof Checker PROは高機能、高性能なプロ用のソフトウェアで1ライセンスが100万円を超えています。LE版という期間限定のライセンスプラン(3ヶ月版/12ヶ月版)も用意されていて繁忙期だけ導入するような使い方ができるものの、それでも月額4.2万円からといった価格なので、やはり中小零細な制作会社や個人での導入は難しいでしょう。

よって、Proof Checker PROを乗り物に例えるなら「ラグジュアリーな高級車」。至れり尽くせりで誰もが憧れるものの、なかなか手が届かないような。

対してXORは「電動アシスト付き自転車」かな。補助はあっても動力すら人力だし、快適さでは大きく見劣りするけど必要最小限の目的は果たせます。そして何よりも導入費用と維持費が安いという。

また、Proof Checker PROはドングル方式なので複数人で使う場合はアプリをインストールした1台のPC、もしくはドングルの方を譲り合うことになります。そのため運悪く締め切りが重なれば順番待ちが発生するわけです。

でもXORは各人が自身のMac(近い将来はWindows PCでも)で独占的に使う前提です。しかも、Apple IDが同じなら職場でも自宅でも1つのライセンスだけで利用できます。

XORは機能面ではProof Checker PROには到底敵いません。Proof Checker PROが持つ様々な便利機能の内、ビットマップ比較モードだけを違う方式で実現した感じなので。

でも、導入・維持のコスト面に限ればXORの方がお手頃です。

Acrobatに勝っているところもあります

商用ドキュメンテーション業界の人なら制作物の新旧PDFを比較する重要性は痛いほどよく解っていることでしょう。些細なミスの見逃しが大きなダメージになることもあるので、より良いアプリを使いたいところです。選択肢はあまりないのだけど。

この用途で最も有名なアプリは何と言ってもAcrobat DC。Adobe純正の万能PDF操作アプリなので私も愛用しています。Adobe Creative Cloudのサブスクリプションを契約していれば追加費用なしに使えるのもいいですよね。

PDF-Compare-on-the-Acrobat-DC
Adoebe Acrobat DCによるPDF比較の画面

ただし、AcrobatによるPDF比較はうまくいくときもあれば、いかないときもあります。例えばこちらのテストデータ(アイコンのクリックでダウンロードされます)を比較した場合。

PDF icon
サンプルPDF(zip)

結果は下図の通り(画像のクリックで拡大表示されます)。

Acrobat DCによる比較結果
Adoebe Acrobat DCによるPDF比較結果の画面

「Yogata」が「YOGATA」に変化した点は検出しているものの、「TROPICAL PACIFIC」という白文字のフォントが変わった点は見過ごしています。つまり、文字比較は得意でもフォントの違いは比較アルゴリズムに含まれていないのでしょう。

いや、試しに比較の設定で「スキャンした文書、図面、イラスト」を選んでおけばフォントの変化も検出してくれるものの、このテストデータは私がInDesignから書き出したPDF。スキャンはしていません。よって、似たような制作物を作った際ににわざわざこのオプションを選ぼうと思うかは怪しいかと。忙しい最中、何通りものオプションを試すわけにもいかないし。

Acrobat DCの比較設定ダイアログ
この設定を選んだ時だけはフォントの違いを検出するけど…

でも、XORで比較すればこの通り。

XORによる比較結果
変更された箇所は青や赤で表示されています

XORでは二つのPDFをビジュアル的に比較するので解析漏れによる見落としは起こり得ません。もちろん人が見落せばどうにもならないのだけど。

Acrobatはドキュメント制作者にとって必要不可欠で、とても重宝するアプリですが、比較結果がPDFのデータ構造に左右されない点においてはXORの方が有利です。