Detection method – ページ 4 – XOR for Mac & Windows:リアルタイムPDF比較ビューワ

要るのは解ってるけど

XORにはまだ最小限の機能しかありません。これはひとえに予算的な理由です。開発費さえあれば搭載したい機能案がたくさんあります。

例えば以下の様なPDFがあったとします。

比較したいPDFペアの例
クリックで拡大表示

太字のリード文が1行から2行に増えていますよね。

その二つをXORで比較した際の表示はこちら。

XORによるPDF比較結果の例
クリックで拡大表示

リード文の二行目が赤くなるのは当然として、それ以降の全体も赤や青で表示されています。これでは1行追加されただけなのか、それともテキストにも何か変化が生じているのかの判別がつきません。

そこでこれらを的確に比較する機能を追加したいとは思っています。サブスクリプションの契約数がもっと伸びれば実現できるでしょう。

BitMatch Pro

XORはPDF比較アプリですが、この分野は「デジタル校正ツール」とも呼ばれます。デジタル校正がより広範囲で、その方式の一つがPDF比較ということになるでしょう。

そんなこともあり、改めて「DTP 校正」で検索してみたら、「BitMatch Pro」というアプリが見つかりました。私が過去に所属した2つの制作会社ではProof Checker PROとAdobe Acrobatしか使われておらず知らなかったけど、探せばあるものですね。

BitMatch Pro

よって、XORで一定の売り上げを上げるには解りやすい差別化が必要になります。BitMatch Proもヴィジュアル的な比較ができるので精度は100%、比較漏れは起きないし、XORより多機能です。しかもWindows版とMac版があり、この点でもXORは張り合えませんね。

ならば使い勝手か価格面での差を明確にする必要がありしょう。

XORの特徴は月額2,000円のサブスクリプションである点。BitMatch Proは¥59,000だから二年半以上使う前提ならXORよりも安価ですね。多くの人に「サブスクリプションの方がいい」と思っていただけたならXORが競争力を発揮しうるかもしれません。

その他でXORの特徴を挙げるなら「PDFの並列表示」かな。対になるページを画面上で並べて表示し、好きなタイミングで重ねて比較したり、元に戻したりできます。これは私の好み、こだわりからそうしました。気になる差分箇所が見つかったら、すぐさま並列表示に切り替えて、どう違うのかを見たいと思ったもので。

比較画面(初期状態)
ペアとなる各ページを見比べられるのもXORの特徴です

それと、ひょっとして差別化に有効かなと思うのが、BitMatch ProはUSBドングルをを採用している点。複数人でシェアするなら順番待ちが発生するし、在宅勤務の際は使えなくなるから。でも、バリバリ稼げてるフリーランスの方なら自身専用にBitMatch Proを買えるか。

あとは、会社に¥59,000の稟議を出しても承認されない状況なら月額2,000円の方が自腹で導入しやすいとも言えるかな。個人持ちのアプリを会社のPCでも使っていいなら。

まあ、あれこれ考えてみても各人の好みは把握しきれないないし、製品の特徴は概してトレードオフになりがちなので、何とか棲み分けられればいいと思っています。

それに、デジタル校正という手段の認知度や普及度はまだまだ低く、開拓余地がそれなりに残されていると思うので、競争相手はそこそこ多い方がいいかもしれません。

比較結果の再利用性

PDF比較アプリの比較には二つの方式があります。「解析比較」と「ヴィジュアル比較」です。前者はPDFのデータ構造を解析し、要素を突き合わせて比較します。後者はPDFを画像として認識して差異を探します。XORはヴィジュアル比較のPDF比較アプリです。

ヴィジュアル比較方式のPDF比較ツールの中にはバッチ処理で各ページの比較結果の画像ファイルを書き出してくれるアプリが存在しています。

ただし、このタイプのアプリには難点もあります。例えば以下。

  • 比較結果が画像ファイル

つまり、目視で確認する以外だとプリントアウトして赤ペンなどを入れるぐらいしか使い道がないかと。よって別の場所で作業しているDTP担当者に再修正指示を出す場合にはスキャンする必要があります。

でもXORでは比較結果をPDFに書き出すので、Adobe Acrobat Readerなどで修正指示を書いて再修正の原稿にでき、そのままメールに添付して送れます。

xor-exported-or-printed-image
XORで書き出した比較結果はPDFそのものなので、拡大しても文字やイラストの解像度が下がることはありません

スケーラブル

ヴィジュアル比較方式のPDF比較ツールの中にはバッチ処理で各ページの比較結果の画像ファイルを書き出してくれるアプリが存在しています。

ただし、このタイプのアプリには難点もあります。例えば以下。

  • 比較結果の画像の解像度が粗い
  • 解像度を上げると処理時間が長くなる

つまり解像度と処理速度はトレードオフの関係にあります。加えて比較結果も画像ファイルなので画面で拡大表示しても粗くなるだけです。

他方、XORで書き出される検証結果はPDFそのものです。対になる両PDFのページが並んだ状態で、拡大表示すれば細部まで確認できます。

xor-exported-or-printed-image
XORで書き出した比較結果はPDFそのものなので、拡大しても文字やイラストの解像度が下がることはありません

リアルタイム比較

ヴィジュアル比較方式のPDF比較ツールの中にはバッチ処理で各ページの比較結果の画像ファイルを書き出してくれるアプリが存在しています。

ただし、このタイプのアプリには難点もあります。例えば以下。

  • ページ数が多い場合には処理が終わるまで長く待たされる

つまり、比較作業を開始してから結果を検証するまでに待ち時間が発生します。よって忙しい時などはその待ち時間がもったいなく感じることもあるでしょう。

そこでXORはバッチ処理ではなくリアルタイム比較を採用しています。昔流行った表現で言えば「WYSIWYG(What You See Is What You Get)」、アプリの画面上で各ページを瞬時に比較可能です。対になる両ページを並べて見比べることも、重ねて差異を表示させることもできます。

xor concept animation

100%の比較精度

XORはPDF比較アプリです。修正の前と後のPDFの差を100%の精度で見つけます。

新旧のPDFを比較する方式は以下の二種類。

  • 解析比較方式
  • ヴィジュアル比較方式

前者はPDFのデータ内容を解析して対になる要素を比較する方式。「どこが変わったか」だけでなく「どのように変わったか」をリポートしてくれて便利な反面、変更内容によっては差異の誤検出や検出漏れが起こります。修正の過程で追加・削除・移動が発生すると、両方のPDF間での要素のペアリングが不正確になるためです。

他方、ヴィジュアル比較方式はPDFの各ページを画像として認識して各ピクセルを比べます。こちらは「どのように」はレポートしてくれないものの、「どこが」だけは100%の精度で見つけ出します。

XORもヴィジュアル比較方式を採用しているので比較精度は100%を誇ります。

Araxis Merge

Araxis Merge 2019のアイコン

Araxis Merge 2019というソフトウェアの存在を知りました。主な機能は以下の通りとのこと。

  • ファイルの比較とマージ
  • フォルダー比較と同期化
  • バイナリ ファイル比較
  • イメージ ファイル比較
  • レポート出力

どうやらPDFの比較もできるそうな。しかもWindows版だけではなくMac版もあるのですね。

そうなるとXORとも用途が重なる上に、XORよりも多機能です。しかもStandard Editionが27,000円と安価。これは強敵かも。

ということで早速評価版を申し込んで試してみました。もしPDFの比較機能がXORとそっくりだったらXORを勧めづらくなりかねないので。

でも、結果は取り越し苦労でした。XORとは目指すところが完全に違うようです。

Araxis Merge 2019に対する私の印象は「diffの技術を基に各種便利機能を実現したアプリ」です。とりわけテキストの比較に多大な効果を発揮してくれそうです。

PDFヴィジュアル比較へのこだわり

XORは二つのPDFをヴィジュアル的に比較します。解析比較ではどうしても比較漏れが起きたり、処理が重くなってアプリが異常終了しがちなので。

もちろんPDFのヴィジュアル的な比較は普遍的なニーズなので既存製品がいくつもあります。でも、それらは皆、二つのPDFを与えると、全ページ分の比較結果のビットマップファイルがバッチ処理で生成される感じです。ビットマップファイルは、例えばこんな感じの。

Proof Checker PROによるビットマップ比較結果
ビットマップ比較の結果。Proof Checker PROのサイトから拝借

でも、私がやりたかったのはこれではなかったのですよ。そう、私が理想とするヴィジュアル比較は「対になるページをいつでも比較できて、いつでも並べた状態に戻せる」というものでした。バッチ処理でファイルを吐き出すのではなくインタラクティブ(対話型)のアプリです。画像ファイルこの方が断然効率的かつ便利だと思うので。

というのも、バッチ処理でビットマップファイルを生成してくれても、元のPDFと見比べる工程が発生します。しかも新旧両方のPDFと見比べるのは結構大変です。つまるところ不効率です。

よって試行錯誤の末、現在のXORの仕様に落ち着きました。

インタラクティブアプリの使い勝手の良さは実際に試せば分かっていただけると思います。30日間の無料使用期間があるので手頃なMacをお持ちでしたら是非お試しください。

DiffPDFを試してみました(1)

DiffPDFというPDF比較アプリがあります。「PDF比較ツール」といった検索をかけるとAcrobatに次いで割と上位に表示されますよね。ライセンスは$160、20日の試用期間があります。

こちらがなかなかの評判なので試してみました。

下図はテストデータを読み込ませた直後の状態。両方とも1ページのみです。

DiffPDFの比較前

まず気づくのが「Mode」。三種類の比較モードが用意されています。

DiffPDFのモード

せっかくなので三つとも試すことにします。

Appearance

見た目の比較モード。いわゆるヴィジュアル比較方式です。

DiffPDF(Appearance)

薄い黄色は差異が含まれる箇所。すべての変更箇所を見つけてくれています。さすが。ヴィジュアル比較は頼もしいですよね。

Characters

文字比較かな。

DiffPDF(Characters)

画像関連の比較がまったくなされないのはしかたないにしても、写真下の「f11 1/125」と「f16 1/60」やタイトル下の「Mandarin fish」と「Mandarinfish」の違いを検出してくれていないのは残念です。どちらもテキスト情報なのに。

Words

文字比較かな。

なぜ「Characters」と別れているのかは不明ですが、明らかに比較結果の表示が違うので、アルゴリズムが違うのでしょう。文節重視の比較でしょうか?

DiffPDF(Words)

「Mandarin fish」と「Mandarinfish」の違いを検出してくれたけど、「f11 1/125」と「f16 1/60」はやはり見逃しています。

感想

このデータに限って言えば、頼りになるのは「Appearance」のモードだけでした。

そう、解析方式によるPDF比較ではどうしてもデータ構造との相性の良し悪しが出ます。うまく行くときもあればいかないときもあり、結果を鵜呑みにすると痛い目に遭いかねないという。

だからこそXORもヴィジュアル比較方式を採用しました。「どう変わったか?」は認識できないけど、そもそも変更箇所が正しい修正かどうかは人間が確かめる必要があるのだから、変更箇所だけ洗い出してくれれば十分だろうという判断です。

DiffPDFのライセンスは$160だから、XORを8ヶ月分契約するよりも便利だと思われるならお勧めです。