出遅れ感はあるけど私も最近ChatGPTを試しています。
先日受講した『初心者から始めるChatGPT徹底解説WEBセミナー』では、講師の七里氏が「ホワイトカラーの仕事はもうすぐAIに取って代わられてなくなる」などと言っておられました。
まあそれは大袈裟なポジショントークで、実際にはケースバイケース。上手く使えば便利でも、なかなか有効に使えない場面も多いでしょう。
差し当たり私の関心事は「ChatGPTに、修正の前と後のPDFの違いを洗い出せるのか?」です。AIがXORの代替になり得るなら私のビジネスはあがったりだなと。
そこで、いつもの魚類図鑑風サンプルPDF(下図。画像のクリックでダウンロード可)をChatGPTに読み込ませて「両方のPDFの違いを教えて」と入力してみました。
結果はこちら。
両方のPDF「FrogfishWorld-1_CMYK.pdf」と「FrogfishWorld-2_CMYK.pdf」の違いを比較したところ、以下のような主な差異が見つかりました:
1. 著者情報の詳細
1版(FrogfishWorld-1):
著者表記: 「ヨガタ ミチアキ」
コメント: 「原稿依頼中」とだけ記載。
2版(FrogfishWorld-2):
著者表記: 「よがた みちあき」
詳細なプロフィールが追加。
出身地、生年
経歴(Cカード取得年、フォトコン入賞歴)
好きな被写体・海
使用機材(Nikon D7000等)
2. 目次の違い
1版:
「ガマアンコウ」が「データ」セクションに含まれていない。
データの項目はページ23から。
2版:
「ガマアンコウ」がバリエーションに含まれページ23に登場。
「データ」項目はページ24から始まる。
新たに「INDEX(索引)」がページ31に追加されている。
3. 誤字修正
「金環食」 → 「金環蝕」に変更(ページ18)
2版ではDTP側による調整で変更された旨が欄外に注記あり。
4. 細かな文章の調整
一部のページで撮影地表記が変更:
例:ページ4「撮影地:レンべ」→「撮影地:アンボン」など。
句読点や文体の微調整も一部見られるが、全体構成や写真は基本的に同じ。
5. ファイル末尾のデータ表記
1版:
最後に「FREE」と記載。
2版:
「¥0」と記載されており、日本語環境に合わせた表記。
必要であれば、レイアウト・画像・フォントなどのデザイン面の違いも精査できます。ご希望ですか?
結論を先に言うと、これダメですね。最初にChatGPT自身が「主な差異が見つかりました」と言っている通り、抜粋されています。当然ながらすべての箇所を洗い出してくれないと変更箇所の確認にはなりません。
例えば、表紙には「TLOPICAL」→「TROPICAL」というスペルミスの修正があるけど、検出してくれていません。同じく著者名「Michiaki Yogata」→「YOGATA Michiaki」の表記変更も。
また「1. 著者情報の詳細」として検出してくれている違いはP.2のものだけど「P.2」とは書かれていません。内容も微妙に間違っていたり、不足があります。
それ以降のページでも、あれこれ見落としや不完全さがみられます。
最後に「必要であれば、レイアウト・画像・フォントなどのデザイン面の違いも精査できます。ご希望ですか?」とあるので「レイアウト・画像・フォントなどのデザイン面の違いも精査して」とオーダーしても、別の要約を出してきます。
せめて検出もれを防げないかと「両方のPDFの違いをすべて教えて」と入れても、ピックアップされる項目に変更はあれど、すべては洗い出してくれません。
よって現段階のChatGPTは画像とテキストがレイアウトされた文書PDFの差分検出には到底使えないようです。そう言えば、セミナー講師の七里氏も「AIは編集や校正が苦手」などと言っておられました。
そう、いえ新旧PDFの差分確認は編集・校正業務の作業の一部。まだまだAIで代替できる段階ではなく、XORの需要もすぐさま無くなることはないでしょう。とりあえず安心です。
でも、これが約款のようなテキストオンリーのPDFであればかなりの精度でチェックしてくれそう。とはいえ、それって昔ながらのdiffでもできたよな。