Quality improvement – ページ 13 – XOR for Mac & Windows:リアルタイムPDF比較ビューワ

Adobeが旧バージョンを切り捨てたなら

Adobe Creative Cloudは定額使い放題というだけでなく、各アプリの過去バージョンも使えるという触れ込みだったけど、ここにきてAdobeは過去バージョンの使用をできなくしたとのこと。理由はわからないものの、まあ無理もないかな。各アプリの発売後にリリースされたOS上でも動作するようにメンテし続けるのは大変だろうから。

でも、この処置の余波としてInDesignのデータの再現性の低さが懸念されています。古いバージョンのInDesignで作ったデータを最新版で読んでも、だいたいはうまくいくと思うけど絶対とは言い切れません。不具合を一つ見つけようものなら、以後はずっと疑心暗鬼が付きまといますよね。とはいえ漠然と「どこかに紛れ込んでいるかも」という観点で不具合を探せば時間がかかってしまいます。

そこでXORの出番です。XORは二つのPDFをヴィジュアル的に比較して差異を100%検出します。よって古いInDesignで作ったデータを再利用したい場合、かつてのPDFと新しく作ったPDFをXORで比べて両者の差の有無を確認するといいでしょう。

DiffPDFを試してみました(3)

DiffPDFでFROGFISH WORLDの2ページ目を比較した結果です。

まずはAppearanceモード。

DiffPDF result : Appearance

大きく変わっているけど、全体が黄色く塗られています。やはりページの背景は白じゃないとダメなようです。

そしてCharactersモード。

DiffPDF result : Characters

こちらはうまく検出してくれています。青は挿入されたテキスト、ピンクは変更された文字です。

さらにWordsモード。

DiffPDF result : Words

P.6とP.10は「……」の箇所がピンクに着色されています。でも、仮にそこに差があったとしても、どうでもいいですよね

Adobe Acrobat PRO DCのPDF比較機能もそうなのだけど、複数モードを使い分けるタイプのツールは少々厄介。3つのモードで得意不得意が違うなら、複合的なコンテンツでは3通りの比較をしなければならないので。

XORもやっとキャラ立ちできました

XOR Version 1.1をMac App Storeでリリースしました。追加機能は「囲み」と「マスク」です。

そもそもXORのVersion 1.0にはいくつもの難点がありました。

  1. 知名度が低い
  2. 有償である
  3. Windows版がない
  4. 差を見つけてくれてもすべては覚えられない

1と2に関しては地道に啓蒙活動を重ねるしかありません。3にも今しばらく時間を要します。

よって喫緊の課題だったのが4。せっかく二つのPDFの差を100%検出してくれても箇所が多ければいちいち覚えられないですよね。

そこで比較結果上で見つけた変更箇所をマーキングしたり、もう確認が不要と判断した箇所を隠したりする機能を追加しました。

他にも搭載したい機能の案はたくさんあるのだけど、ひとまずこれで実用的な最低限のツールとして成立できたと思います。

新機能がつきました!

XOR Version 1.1をリリースしました。変更箇所は以下の通りです。

  • 囲みの機能を追加
  • マスクの機能を追加
  • 細かい不具合を調整

囲みは「見つけた変更箇所をマーキングする機能」です。

マスクは逆に「変更がなかった箇所を覆い隠す機能」です。

なお、囲みとマスクはPDFを並べて表示した状態に戻したり、書き出したPDFやプリントアウトにも反映されます。

と、テキストで説明されても想像できないかもしれないので、こちらの動画をご覧ください。

DiffPDFを試してみました(2)

DiffPDFを別のテストデータでも試してみました。このblogで度々登場するいつもの「FROGFISH WORLD」です。

まず、一番頼りになるAppearanceモードの比較結果はこちら。

DiffPDF result : Appearance
DIffPDF Appearanceモードの比較結果

なんと両方のページ全体が黄色く着色されてしまいました。これだと何も見つけてくれなかったのと同じです。推測するに、差異を探すアルゴリズムが「背景色は白」という前提で比較しているのではないかと。

そしてCharactersモードとWordsモード。

DiffPDF result : Characters
DIffPDF Charactersモードの比較結果
DiffPDF result : Words
DIffPDF Wordsモードの比較結果

ほぼ同じですね。Charactersモードは文字単位比較なので「Yogata」と「YOGATA」の先頭の「Y」の字が差異から除外されているだけで。

そして「TROPICAL PACIFIC」という白文字のフォントの違いはどちらのモードも見逃しています。

ちなみに「TROPICAL PACIFIC」はAdobe Acrobat PRO DCのPDF比較でも見逃されてしまう箇所です。

そう、PDFのデータを解析して比較する方式だと100%の比較結果が出ないのが以前から解っていたので、「その弱点を補うアプリには需要があるはず」と踏んでヴィジュアル比較方のXORを開発してリリースしました。

DiffPDFを試してみました(1)

DiffPDFというPDF比較アプリがあります。「PDF比較ツール」といった検索をかけるとAcrobatに次いで割と上位に表示されますよね。ライセンスは$160、20日の試用期間があります。

こちらがなかなかの評判なので試してみました。

下図はテストデータを読み込ませた直後の状態。両方とも1ページのみです。

DiffPDFの比較前

まず気づくのが「Mode」。三種類の比較モードが用意されています。

DiffPDFのモード

せっかくなので三つとも試すことにします。

Appearance

見た目の比較モード。いわゆるヴィジュアル比較方式です。

DiffPDF(Appearance)

薄い黄色は差異が含まれる箇所。すべての変更箇所を見つけてくれています。さすが。ヴィジュアル比較は頼もしいですよね。

Characters

文字比較かな。

DiffPDF(Characters)

画像関連の比較がまったくなされないのはしかたないにしても、写真下の「f11 1/125」と「f16 1/60」やタイトル下の「Mandarin fish」と「Mandarinfish」の違いを検出してくれていないのは残念です。どちらもテキスト情報なのに。

Words

文字比較かな。

なぜ「Characters」と別れているのかは不明ですが、明らかに比較結果の表示が違うので、アルゴリズムが違うのでしょう。文節重視の比較でしょうか?

DiffPDF(Words)

「Mandarin fish」と「Mandarinfish」の違いを検出してくれたけど、「f11 1/125」と「f16 1/60」はやはり見逃しています。

感想

このデータに限って言えば、頼りになるのは「Appearance」のモードだけでした。

そう、解析方式によるPDF比較ではどうしてもデータ構造との相性の良し悪しが出ます。うまく行くときもあればいかないときもあり、結果を鵜呑みにすると痛い目に遭いかねないという。

だからこそXORもヴィジュアル比較方式を採用しました。「どう変わったか?」は認識できないけど、そもそも変更箇所が正しい修正かどうかは人間が確かめる必要があるのだから、変更箇所だけ洗い出してくれれば十分だろうという判断です。

DiffPDFのライセンスは$160だから、XORを8ヶ月分契約するよりも便利だと思われるならお勧めです。

アオリってしんどくないですか?

ドキュメント制作の現場では昔から「アオリ」というテクニックが使われています。新旧のPDFをプリントアウトし、机上で同じページどうしをぴったり重ねて片方の手で上端を押さえ、もう片方で上の1枚をめくったり戻したりを繰り返して残像の違和感で差異のある箇所を見つける方法です。

以下の画像はアオリをイメージとして再現してみました。タップして拡大表示させてみてください。

アオリの再現イメージ.gif
アオリの再現イメージ.gif

確かに効果的だけど、いわば動画的に確認する方法なので、いくつか難点もありますよね。

  • 差異ががありそうな箇所に見当がついていないと見逃しがち
  • 差異が複数あってもすべての箇所を覚えられない
  • ページが複数あると作業が煩雑になる

そこでXORでは静止画的に確認できる方法を採用しています。

XORの比較イメージ
XORの比較イメージ

この画像では分かりにくいかもしれないので、ぜひアプリをダウンロードして30日間試用してみてください。拡大表示もできるので差異をもれなく発見できるはずです。

 

日本以外では厳しいかも

XORはMac App Storeでリリースしたので、対応言語は日本語と英語のみだけど世界中で展開しています。

とはいえ日本以外の市場で受け入れてもらうのは難しいかと。日本では制作物の些細なミスにも神経質な傾向があるけど、外国ではもっと鷹揚だろうから。

日本では多くの分野で過剰な品質が求められるし、それが各関係者の不利益につながることも少なくないと思うものの、だからこそXORが存在価値を発揮できる余地があるとも言えるのですよね。

XORでコストカットしませんか?

30日の無料試用期間後もXORをお使いいただく場合、月額2,000円のサブスクリプション契約が必要なので、導入するならそれに見合った納得感が要りますよね。

そこでこんな使い方はどうでしょう?

修正されていないページを洗い出して確認対象から除外する

XORは二つのPDFを画像化して差異をあぶり出すため、対になるページの変更点を100%検出します。人間が違いを見逃さない限り、すべての変更箇所を把握できるわけです。

どこが変更されたかを把握できるならその逆も然り。まったく変わっていないページも容易に見つけられます。

例えば、取扱説明書は製品のマイナーチェンジに伴い何度も改版される傾向があります。ページ数の多い案件ともなると修正前後のPDFを自力で比較するのは大変な作業です。DTP原稿の赤字箇所の確認だけならともかく、「予期せぬ差異がどこかに潜り込んでいるかもしれない」という観点で数十ページ、数百ページ規模の取説を1ページずつ見ていこうものなら、かなりの時間を要します。ものによっては何時間もかかったり、複数人で手分けする必要が出てくるでしょう。しかも徒労感が募れば次第に集中力も落ち兼ねません。

でも、XORを使って最初に「まったく変更がないページ」を洗い出せば、確認対象をそれ以外のページだけに絞り込めます。

日本の平均的なサラリーマンの給与を時給換算で約2,500円と仮定すると、1ヶ月に1時間分の時短ができればXORの2,000円というサブスクリプション費用は軽く相殺されるでしょう。もちろんXORに利用回数の制限はないので他の案件でさらに1時間削減できれば計5,000円相当の時間的余裕が生まれます。残業せずに帰るもよし、空いた時間で他の案件を担当して業績を上げるもよし。時短が10時間に登ろうものならXOR1年分のサブスクリプション費用相当のコストカットが実現できてしまいます。だとしたら月額2,000円も実は安いとは考えれれないでしょうか?

なお、ドキュメンテーション業界のほとんどの人がすでに使っているAdobe Acrobat PRO DCの比較機能でも同じことができそうに思うかもしれないけど、PDFの内容を解析して比較する方式のため、データ構造次第では差異の検出もれが発生します

XORは意外に便利じゃない?

XORはPDF差異検出ツール、あるいはPDF比較ツールと呼ばれる類のアプリです。対になるPDFを重ねて差異をあぶり出します。

でも、他にも意外に便利な使い方もあります。「二つのPDFを並べて表示する」です。スペースバーを押せば重ねて表示されるけど、あえて押さず各ページを左右に並べて見比べると。

キーボードやマウスでページめくり操作を行うと対になるページが並んだまま一緒にめくれていきます。

XORでPDFを並べて表示した状態

これ、既存の他のアプリではできないか、できても使い勝手がよくないのではないでしょうか?