ChatGPT – XOR for Mac & Windows:リアルタイムPDF比較ビューワ

ChatGPTの苦手な分野

出遅れ感はあるけど私も最近ChatGPTを試しています。

先日受講した『初心者から始めるChatGPT徹底解説WEBセミナー』では、講師の七里氏が「ホワイトカラーの仕事はもうすぐAIに取って代わられてなくなる」などと言っておられました。

まあそれは大袈裟なポジショントークで、実際にはケースバイケース。上手く使えば便利でも、なかなか有効に使えない場面も多いでしょう。

差し当たり私の関心事は「ChatGPTに、修正の前と後のPDFの違いを洗い出せるのか?」です。AIがXORの代替になり得るなら私のビジネスはあがったりだなと。

そこで、いつもの魚類図鑑風サンプルPDF(下図。画像のクリックでダウンロード可)をChatGPTに読み込ませて「両方のPDFの違いを教えて」と入力してみました。

比較用サンプルPDF(修正前)
比較用サンプルPDF(修正前)

比較用サンプルPDF(修正後)
比較用サンプルPDF(修正後)

結果はこちら。

両方のPDF「FrogfishWorld-1_CMYK.pdf」と「FrogfishWorld-2_CMYK.pdf」の違いを比較したところ、以下のような主な差異が見つかりました:


1. 著者情報の詳細

  • 1版(FrogfishWorld-1):

    • 著者表記: 「ヨガタ ミチアキ」

    • コメント: 「原稿依頼中」とだけ記載。

  • 2版(FrogfishWorld-2):

    • 著者表記: 「よがた みちあき」

    • 詳細なプロフィールが追加。

      • 出身地、生年

      • 経歴(Cカード取得年、フォトコン入賞歴)

      • 好きな被写体・海

      • 使用機材(Nikon D7000等)


2. 目次の違い

  • 1版:

    • 「ガマアンコウ」が「データ」セクションに含まれていない。

    • データの項目はページ23から。

  • 2版:

    • 「ガマアンコウ」がバリエーションに含まれページ23に登場。

    • 「データ」項目はページ24から始まる。

    • 新たに「INDEX(索引)」がページ31に追加されている。


3. 誤字修正

  • 「金環」 → 「金環」に変更(ページ18)

    • 2版ではDTP側による調整で変更された旨が欄外に注記あり。


4. 細かな文章の調整

  • 一部のページで撮影地表記が変更:

    • 例:ページ4「撮影地:レンべ」→「撮影地:アンボン」など。

  • 句読点や文体の微調整も一部見られるが、全体構成や写真は基本的に同じ。


5. ファイル末尾のデータ表記

  • 1版:

    • 最後に「FREE」と記載。

  • 2版:

    • 「¥0」と記載されており、日本語環境に合わせた表記。


必要であれば、レイアウト・画像・フォントなどのデザイン面の違いも精査できます。ご希望ですか?

結論を先に言うと、これダメですね。最初にChatGPT自身が「主な差異が見つかりました」と言っている通り、抜粋されています。当然ながらすべての箇所を洗い出してくれないと変更箇所の確認にはなりません。

例えば、表紙には「TLOPICAL」→「TROPICAL」というスペルミスの修正があるけど、検出してくれていません。同じく著者名「Michiaki Yogata」→「YOGATA Michiaki」の表記変更も。

また「1. 著者情報の詳細」として検出してくれている違いはP.2のものだけど「P.2」とは書かれていません。内容も微妙に間違っていたり、不足があります。

それ以降のページでも、あれこれ見落としや不完全さがみられます。

最後に「必要であれば、レイアウト・画像・フォントなどのデザイン面の違いも精査できます。ご希望ですか?」とあるので「レイアウト・画像・フォントなどのデザイン面の違いも精査して」とオーダーしても、別の要約を出してきます。

せめて検出もれを防げないかと「両方のPDFの違いをすべて教えて」と入れても、ピックアップされる項目に変更はあれど、すべては洗い出してくれません。

よって現段階のChatGPTは画像とテキストがレイアウトされた文書PDFの差分検出には到底使えないようです。そう言えば、セミナー講師の七里氏も「AIは編集や校正が苦手」などと言っておられました。

そう、いえ新旧PDFの差分確認は編集・校正業務の作業の一部。まだまだAIで代替できる段階ではなく、XORの需要もすぐさま無くなることはないでしょう。とりあえず安心です。

でも、これが約款のようなテキストオンリーのPDFであればかなりの精度でチェックしてくれそう。とはいえ、それって昔ながらのdiffでもできたよな。

ChatGPTは癖がすごい

出遅れ感はあるけど私も最近ChatGPTを試しています。

今回は以前に書いた『47都道府県のこどもの数』を調べさせました。

まず「子供の割合を47都道府県別に高い順に並べて教えて」と命令。返答はこの通り。

以下は、2024年4月1日現在の15歳未満人口(こどもの数)が総人口に占める割合を、都道府県別に高い順で並べた一覧です。総務省統計局

順位 都道府県 子どもの割合(%)
1 沖縄県 17.6
2 滋賀県 14.8
3 佐賀県 14.3
4 鹿児島県 14.2
5 宮崎県 14.1
6 熊本県 14.0
7 福岡県 13.9
8 長崎県 13.8
9 大分県 13.7
10 宮城県 13.6

全国平均は11.3%で、最も低いのは秋田県の10.9%でした。総務省統計局+1総務省統計局+1

このデータは、総務省統計局の「統計トピックスNo.101」および「統計トピックスNo.141」に基づいています。総務省統計局+2総務省統計局+2総務省統計局+2

詳細なデータや他の都道府県の情報については、以下のリンクからご確認いただけます。

これらの資料には、各都道府県のこどもの数や割合、年齢階級別の人口構成など、より詳細な情報が掲載されています。

見ての通りトップ10しか表示されていません。

そこで「子供の割合を47都道府県別に省略せずに教えて」に変えてみたところこの通り。

以下は、2024年4月1日現在の15歳未満人口(こどもの数)が総人口に占める割合を、47都道府県別に高い順で並べた一覧です。

順位 都道府県 子どもの割合(%)
1 沖縄県 17.6
2 滋賀県 14.8
3 佐賀県 14.3
4 鹿児島県 14.2
5 宮崎県 14.1
6 熊本県 14.0
7 福岡県 13.9
8 長崎県 13.8
9 大分県 13.7
10 宮城県 13.6
11 岩手県 13.5
12 山形県 13.4
13 福島県 13.3
14 青森県 13.2
15 秋田県 13.1
16 山口県 13.0
17 愛媛県 12.9
18 高知県 12.8
19 徳島県 12.7
20 香川県 12.6
21 鳥取県 12.5
22 島根県 12.4
23 岡山県 12.3
24 広島県 12.2
25 山梨県 12.1
26 長野県 12.0
27 新潟県 11.9
28 富山県 11.8
29 石川県 11.7
30 福井県 11.6
31 静岡県 11.5
32 愛知県 11.4
33 三重県 11.3
34 岐阜県 11.2
35 奈良県 11.1
36 和歌山県 11.0
37 大阪府 10.9
38 京都府 10.8
39 兵庫県 10.7
40 滋賀県 10.6
41 千葉県 10.5
42 埼玉県 10.4
43 東京都 10.3
44 神奈川県 10.2
45 茨城県 10.1
46 栃木県 10.0
47 群馬県 9.9

全国平均は11.3%で、最も高いのは沖縄県の17.6%、最も低いのは群馬県の9.9%でした。

このデータは、総務省統計局の「統計トピックスNo.141」に基づいています。

詳細なデータや他の都道府県の情報については、以下のリンクからご確認いただけます。

47都道府県全部が表示されたけど、日付が「2024年4月1日現在」なので最新ではありません。

ならば「2024年10月の子供の割合を47都道府県別に省略せずに教えて」に変更するとこの通り。

以下は、2024年10月1日現在の15歳未満人口(こどもの数)が総人口に占める割合を、47都道府県別に高い順で並べた一覧です。

順位 都道府県 子どもの割合(%)
1 沖縄県 15.8
2 滋賀県 12.7
3 佐賀県 12.7
4 宮崎県 12.6
5 鹿児島県 12.5
6 熊本県 12.4
7 福岡県 12.3
8 長崎県 12.2
9 大分県 12.1
10 宮城県 12.0
11 岩手県 11.9
12 山形県 11.8
13 福島県 11.7
14 青森県 11.6
15 秋田県 11.5
16 山口県 11.4
17 愛媛県 11.3
18 高知県 11.2
19 徳島県 11.1
20 香川県 11.0
21 鳥取県 10.9
22 島根県 10.8
23 岡山県 10.7
24 広島県 10.6
25 山梨県 10.5
26 長野県 10.4
27 新潟県 10.3
28 富山県 10.2
29 石川県 10.1
30 福井県 10.0
31 静岡県 9.9
32 愛知県 9.8
33 三重県 9.7
34 岐阜県 9.6
35 奈良県 9.5
36 和歌山県 9.4
37 大阪府 9.3
38 京都府 9.2
39 兵庫県 9.1
40 滋賀県 9.0
41 千葉県 8.9
42 埼玉県 8.8
43 東京都 8.7
44 神奈川県 8.6
45 茨城県 8.5
46 栃木県 8.4
47 群馬県 8.3

全国平均は11.1%で、最も高いのは沖縄県の15.8%、最も低いのは群馬県の8.3%でした。

このデータは、総務省統計局の「統計トピックスNo.145」に基づいています。

詳細なデータや他の都道府県の情報については、以下のリンクからご確認いただけます。

ようやく目当てのデータが得られました。

でも調べさせる側が2024年10月1日版が最新と知らなければ、この結果には辿り着けなかったわけだ。

いや、最初から「最新の子供の割合を47都道府県別に省略せずに教えて」と命令すれば良かったわけか。

ともかくChatGPTは「どのタイミングのデータが欲しいかの指定がない場合、最新のものを探す」といった気の使い方はしないようです。今のところ。

この点の考慮がChatGPTを使いこなす上でのコツなのでしょう。

なるほどChatGPTは優秀だ

何となく先送りにしてきたけど、そろそろ生成AIにも馴染んでおかなとなと思って遅ればせながらChatGPTを使い始めました。

AIについては私もまだ懐疑的な部分はあるものの、上手く使えばとても便利なのも事実です。

例えばこちらは代々木公園で先日行われたラオスフェスティバル2025で見かけたパフォーマー。

ラオスフェスティバル2025の謎のゆるキャラ

これが何かを訊いた時のChatGPTの回答がこの通り。

この写真に写っているのは、ラオスの伝統的な仮面(マスク)をかぶったパフォーマーたちです。背景にあるテントの看板には「在日本ラオス協会」と書かれており、日本で開催されているラオス関連の文化イベントやフェスティバルの一場面だと思われます。

仮面の特徴:

  • 赤く大きな顔に、誇張された目や口、眉毛。

  • 髪の毛のように見える長い縄(たぶん麻などでできている)を垂らしている。

  • コミカルでインパクトのある見た目。

これは何か?

これはおそらくラオスの伝統行事で使われる「仮面舞踏(マスクダンス)」や「精霊の踊り」の衣装の一部です。ラオスには地域ごとにさまざまな民俗文化があり、お祭りや宗教行事(特に仏教系)で精霊や動物、祖先などに扮して踊る風習があります。

このような仮面は、悪霊を追い払ったり、豊穣や健康を願ったりする目的で使われることもあります。

つまり、これは ラオス文化の紹介として、日本のイベントで披露された民族衣装やパフォーマンスの一部です。

なかなか良い情報を返してくれます。

対してGoogle画像検索だとこんな感じです。

Google画像検索の結果

同じ被写体の写真もあるけど、似た何かも見つけてきています。そして正体が知りたければ写真のページ内の記述を手がかりにWikipediaなどを使ってユーザーが自分で頑張って探り当てる必要があると。

なるほど、生成AIを信奉する人たちが「遠からず検索エンジンを使う人はいなくなる」と言うのもわからなくはないです。

まあ、私の見方は「検索エンジンもAIを組み込んで同等の情報を返すように発展していく」だけど。