Learn

メタデータ

PDFメタデータのリスク

PDFに残る作成者、作成日時、注釈、埋め込み情報、黒塗り失敗のリスクを整理します。

PDFは、公開資料や提出資料としてよく使われます。

しかし、PDFは見た目だけで判断できません。本文に名前を書いていなくても、ファイル内部に作成者名、作成ソフト、作成日時、注釈、埋め込みファイル、フォーム情報が残ることがあります。

匿名性では、PDFの内容だけでなく、PDFを作った環境や編集履歴も手がかりになります。

この記事では、PDFに残りやすい情報と、公開前に確認する観点を整理します。

PDFに残る情報

PDFには、文書そのもの以外の情報が含まれることがあります。

情報何を示すか匿名性でのリスク
作成者OSや文書ソフトのユーザー名個人名や組織名が出る
作成日時いつ作ったか行動時間や資料作成時期と結びつく
作成ソフトWord、LibreOffice、スキャナなど作業環境の手がかりになる
タイトル元文書名や案件名内部名称が残る
注釈コメントや編集メモ関係者や判断過程が出る
埋め込みファイル元資料や添付データ不要な情報が混ざる

PDFは「完成版」に見えます。

しかし、内部には作成過程の情報が残ることがあります。

黒塗りの失敗

PDFで特に危険なのが、黒塗りの失敗です。

見た目には黒い四角で隠れていても、内部に文字情報が残っている場合があります。コピー、検索、レイヤーの解除で元の文字が取り出せることがあります。

やりがちな処理問題安全に近づける考え方
黒い図形を重ねる元文字が内部に残る専用の墨消し機能を使う
スクリーンショット化だけ画質や隠し情報に注意必要範囲を再確認する
注釈で隠す注釈を外せる場合がある出力後にコピー検索する
ページ削除埋め込みや履歴が残る場合別ファイルとして再生成する
手作業で一部削除見落としが起きるチェックリスト化する

高リスクな資料では、黒塗り処理を一人の目だけで判断しないほうが安全です。

法的・報道・内部告発の文脈では、専門家や信頼できる相談先の確認が必要になることがあります。

PDFは見た目と内部を分けて見る

PDFの確認では、見た目と内部情報を分けます。

見た目には、本文、画像、表、QRコード、ページ番号、背景、透かしがあります。内部には、、注釈、埋め込みファイル、フォーム、リンクがあります。

確認する場所見る情報理由
見た目本文、画像、表、背景直接的な個人情報を確認する
リンクURL、共有先、トラッキング個人IDや内部URLを避ける
メタデータ作成者、作成ソフト作業環境を出さない
注釈コメント、校閲内部会話を残さない
埋め込み添付ファイル、フォーム不要データを含めない

PDFは、印刷物のように見えます。

しかし、実際には内部構造を持つデジタルファイルです。

確認手順

PDFを公開する前には、元ファイルを直接公開しないことが基本です。

公開用コピーを作り、必要な情報だけを残します。

手順確認すること
1元ファイルではなく公開用コピーを作る
2ファイル名に本名、案件名、組織名がないか見る
3文書プロパティを確認する
4注釈、コメント、フォーム、埋め込みを確認する
5黒塗り部分をコピー検索できないか確認する
6別の環境で開き直して表示を確認する
7アップロード後に相手からどう見えるか確認する

ExifToolやqpdfのようなツールは確認に役立ちます。

ただし、ツールでメタデータを消しても、本文や画像に残る情報は別に確認します。

PDFを送る相手も確認する

PDFのリスクは、ファイル内部だけではありません。

どこへアップロードするか、誰に送るか、どのアカウントで共有するかも匿名性に関係します。個人クラウドから共有すれば、所有者名やメールアドレスが見えることがあります。メールで送れば、送信者や件名、時刻が残ります。

共有方法残る情報注意点
クラウドリンク所有者名、共有履歴実名アカウントから共有しない
メール添付送信者、件名、時刻連絡経路の相関を見る
投稿サイトアップロード時刻、アカウント投稿内容と結びつく
チャット送信相手の端末に残るスクリーンショットや転送に注意
匿名提出提出先ログ、確認時刻提出先の信頼性を見る

PDFを安全にするとは、PDF内部を整えるだけではありません。

共有経路、アカウント、送信時刻、相手側の保存も含めて考えます。

他の記事との切り分け

この記事では、PDFに残る情報のリスクを扱います。

PDFメタデータを実際に削除するときの流れは「PDFメタデータを削除するときの注意」で扱います。Office文書からPDFを作る場合は、元のOfficeファイル側の作成者情報や変更履歴も確認します。

つまり、PDFだけを見て終わらせないことが重要です。

見る対象主な確認
PDF本体作成者、注釈、埋め込み、黒塗り
元Office変更履歴、コメント、会社名
画像背景、反射、文字、
共有経路所有者名、URL、送信時刻
相談先証拠性と安全性の扱い

PDFは、多くの場面で「提出しやすい形式」です。

だからこそ、内部告発、学校や職場の相談、報道提供では安易にそのまま出しがちです。匿名性を重視するなら、PDFを作った人、編集した人、共有した人、開いた人の情報がどこに残るかを分けて確認します。

受け取ったPDFにも注意する

PDFのリスクは、自分で作ったファイルだけではありません。

誰かから受け取ったPDFにも、作成者、作成日時、作成ソフト、注釈、埋め込みファイルが残ることがあります。取材や相談で受け取ったPDFをそのまま公開すると、提供者へ戻る線を作ることがあります。

受け取ったPDFの情報リスク
作成者提供者や組織が分かる
作成日時資料作成時期が分かる
注釈内部メモが残る
埋め込み元資料が混ざる
ファイル名案件や個人名が見える

受け取ったPDFほど、提供者保護の視点で確認します。

スキャンPDFにも手がかりは残る

紙をスキャンしてPDFにすれば安全、とは言えません。

スキャンPDFには、スキャナ名、作成ソフト、作成日時が残ることがあります。さらに、紙面そのものに印影、受付番号、手書き文字、折り目、余白のメモ、コピー機の特徴が残ります。文字情報がない画像PDFでも、見た目から手がかりが出ます。

手がかり分かること注意点
スキャナ情報使用機器や環境メタデータを確認する
受付番号組織内の資料番号体系で絞られる
手書き文字書いた人知人には分かる
印影・署名個人や組織直接的な識別情報になる
余白や折り目扱われ方原本の経路が推測される

スキャンPDFは、デジタル文書と紙文書の両方のリスクを持ちます。

メタデータだけでなく、紙面の見た目を拡大して確認します。

まとめ

PDFは、見た目だけで安全とは判断できません。

作成者名、作成日時、作成ソフト、注釈、埋め込みファイル、フォーム情報が残ることがあります。

黒塗りも、見た目だけでは不十分です。元文字が内部に残る処理は危険です。

匿名性では、PDFの本文、見た目、内部情報、ファイル名、共有先を分けて確認します。

高リスクな資料では、一人で判断せず、信頼できる相談先や専門家を使うことも検討します。

関連ツール

Metadata inspection

ExifTool

ExifToolは、画像、動画、PDF、Office文書など幅広い形式のメタデータを確認・編集できる代表的なローカルツールです。

紹介する理由: 匿名性が必要なファイルをオンライン変換サイトへアップロードせず、手元の環境でメタデータを確認しやすいため紹介します。

URL : https://exiftool.org/

外部サイトを開く
Metadata removal

MAT2

MAT2は、画像、PDF、Office文書など複数形式のメタデータ削除を目的としたローカルツールです。

紹介する理由: ファイル公開前に、ブラウザ上の簡易チェックだけでは見えにくいメタデータをローカル環境で減らす候補になるため紹介します。

URL : https://0xacab.org/jvoisin/mat2

外部サイトを開く
PDF inspection

qpdf

qpdfは、PDFの構造確認、変換、再構成に使われるPDF処理ツールです。

紹介する理由: PDFは見た目だけでは内部構造やメタデータが分かりにくいため、公開前にローカルで確認する候補として紹介します。

URL : https://qpdf.readthedocs.io/

外部サイトを開く

関連記事