PDFメタデータのリスク
PDFに残る作成者、作成日時、注釈、埋め込み情報、黒塗り失敗のリスクを整理します。
PDFは、公開資料や提出資料としてよく使われます。
しかし、PDFは見た目だけで判断できません。本文に名前を書いていなくても、ファイル内部に作成者名、作成ソフト、作成日時、注釈、埋め込みファイル、フォーム情報が残ることがあります。
匿名性では、PDFの内容だけでなく、PDFを作った環境や編集履歴も手がかりになります。
この記事では、PDFに残りやすい情報と、公開前に確認する観点を整理します。
PDFに残る情報
PDFには、文書そのもの以外の情報が含まれることがあります。
| 情報 | 何を示すか | 匿名性でのリスク |
|---|---|---|
| 作成者 | OSや文書ソフトのユーザー名 | 個人名や組織名が出る |
| 作成日時 | いつ作ったか | 行動時間や資料作成時期と結びつく |
| 作成ソフト | Word、LibreOffice、スキャナなど | 作業環境の手がかりになる |
| タイトル | 元文書名や案件名 | 内部名称が残る |
| 注釈 | コメントや編集メモ | 関係者や判断過程が出る |
| 埋め込みファイル | 元資料や添付データ | 不要な情報が混ざる |
PDFは「完成版」に見えます。
しかし、内部には作成過程の情報が残ることがあります。
黒塗りの失敗
PDFで特に危険なのが、黒塗りの失敗です。
見た目には黒い四角で隠れていても、内部に文字情報が残っている場合があります。コピー、検索、レイヤーの解除で元の文字が取り出せることがあります。
| やりがちな処理 | 問題 | 安全に近づける考え方 |
|---|---|---|
| 黒い図形を重ねる | 元文字が内部に残る | 専用の墨消し機能を使う |
| スクリーンショット化だけ | 画質や隠し情報に注意 | 必要範囲を再確認する |
| 注釈で隠す | 注釈を外せる場合がある | 出力後にコピー検索する |
| ページ削除 | 埋め込みや履歴が残る場合 | 別ファイルとして再生成する |
| 手作業で一部削除 | 見落としが起きる | チェックリスト化する |
高リスクな資料では、黒塗り処理を一人の目だけで判断しないほうが安全です。
法的・報道・内部告発の文脈では、専門家や信頼できる相談先の確認が必要になることがあります。
PDFは見た目と内部を分けて見る
PDFの確認では、見た目と内部情報を分けます。
見た目には、本文、画像、表、QRコード、ページ番号、背景、透かしがあります。内部には、、注釈、埋め込みファイル、フォーム、リンクがあります。
| 確認する場所 | 見る情報 | 理由 |
|---|---|---|
| 見た目 | 本文、画像、表、背景 | 直接的な個人情報を確認する |
| リンク | URL、共有先、トラッキング | 個人IDや内部URLを避ける |
| メタデータ | 作成者、作成ソフト | 作業環境を出さない |
| 注釈 | コメント、校閲 | 内部会話を残さない |
| 埋め込み | 添付ファイル、フォーム | 不要データを含めない |
PDFは、印刷物のように見えます。
しかし、実際には内部構造を持つデジタルファイルです。
確認手順
PDFを公開する前には、元ファイルを直接公開しないことが基本です。
公開用コピーを作り、必要な情報だけを残します。
| 手順 | 確認すること |
|---|---|
| 1 | 元ファイルではなく公開用コピーを作る |
| 2 | ファイル名に本名、案件名、組織名がないか見る |
| 3 | 文書プロパティを確認する |
| 4 | 注釈、コメント、フォーム、埋め込みを確認する |
| 5 | 黒塗り部分をコピー検索できないか確認する |
| 6 | 別の環境で開き直して表示を確認する |
| 7 | アップロード後に相手からどう見えるか確認する |
ExifToolやqpdfのようなツールは確認に役立ちます。
ただし、ツールでメタデータを消しても、本文や画像に残る情報は別に確認します。
PDFを送る相手も確認する
PDFのリスクは、ファイル内部だけではありません。
どこへアップロードするか、誰に送るか、どのアカウントで共有するかも匿名性に関係します。個人クラウドから共有すれば、所有者名やメールアドレスが見えることがあります。メールで送れば、送信者や件名、時刻が残ります。
| 共有方法 | 残る情報 | 注意点 |
|---|---|---|
| クラウドリンク | 所有者名、共有履歴 | 実名アカウントから共有しない |
| メール添付 | 送信者、件名、時刻 | 連絡経路の相関を見る |
| 投稿サイト | アップロード時刻、アカウント | 投稿内容と結びつく |
| チャット送信 | 相手の端末に残る | スクリーンショットや転送に注意 |
| 匿名提出 | 提出先ログ、確認時刻 | 提出先の信頼性を見る |
PDFを安全にするとは、PDF内部を整えるだけではありません。
共有経路、アカウント、送信時刻、相手側の保存も含めて考えます。
他の記事との切り分け
この記事では、PDFに残る情報のリスクを扱います。
PDFメタデータを実際に削除するときの流れは「PDFメタデータを削除するときの注意」で扱います。Office文書からPDFを作る場合は、元のOfficeファイル側の作成者情報や変更履歴も確認します。
つまり、PDFだけを見て終わらせないことが重要です。
| 見る対象 | 主な確認 |
|---|---|
| PDF本体 | 作成者、注釈、埋め込み、黒塗り |
| 元Office | 変更履歴、コメント、会社名 |
| 画像 | 背景、反射、文字、 |
| 共有経路 | 所有者名、URL、送信時刻 |
| 相談先 | 証拠性と安全性の扱い |
PDFは、多くの場面で「提出しやすい形式」です。
だからこそ、内部告発、学校や職場の相談、報道提供では安易にそのまま出しがちです。匿名性を重視するなら、PDFを作った人、編集した人、共有した人、開いた人の情報がどこに残るかを分けて確認します。
受け取ったPDFにも注意する
PDFのリスクは、自分で作ったファイルだけではありません。
誰かから受け取ったPDFにも、作成者、作成日時、作成ソフト、注釈、埋め込みファイルが残ることがあります。取材や相談で受け取ったPDFをそのまま公開すると、提供者へ戻る線を作ることがあります。
| 受け取ったPDFの情報 | リスク |
|---|---|
| 作成者 | 提供者や組織が分かる |
| 作成日時 | 資料作成時期が分かる |
| 注釈 | 内部メモが残る |
| 埋め込み | 元資料が混ざる |
| ファイル名 | 案件や個人名が見える |
受け取ったPDFほど、提供者保護の視点で確認します。
スキャンPDFにも手がかりは残る
紙をスキャンしてPDFにすれば安全、とは言えません。
スキャンPDFには、スキャナ名、作成ソフト、作成日時が残ることがあります。さらに、紙面そのものに印影、受付番号、手書き文字、折り目、余白のメモ、コピー機の特徴が残ります。文字情報がない画像PDFでも、見た目から手がかりが出ます。
| 手がかり | 分かること | 注意点 |
|---|---|---|
| スキャナ情報 | 使用機器や環境 | メタデータを確認する |
| 受付番号 | 組織内の資料 | 番号体系で絞られる |
| 手書き文字 | 書いた人 | 知人には分かる |
| 印影・署名 | 個人や組織 | 直接的な識別情報になる |
| 余白や折り目 | 扱われ方 | 原本の経路が推測される |
スキャンPDFは、デジタル文書と紙文書の両方のリスクを持ちます。
メタデータだけでなく、紙面の見た目を拡大して確認します。
まとめ
PDFは、見た目だけで安全とは判断できません。
作成者名、作成日時、作成ソフト、注釈、埋め込みファイル、フォーム情報が残ることがあります。
黒塗りも、見た目だけでは不十分です。元文字が内部に残る処理は危険です。
匿名性では、PDFの本文、見た目、内部情報、ファイル名、共有先を分けて確認します。
高リスクな資料では、一人で判断せず、信頼できる相談先や専門家を使うことも検討します。
関連ツール
ExifTool
ExifToolは、画像、動画、PDF、Office文書など幅広い形式のメタデータを確認・編集できる代表的なローカルツールです。
紹介する理由: 匿名性が必要なファイルをオンライン変換サイトへアップロードせず、手元の環境でメタデータを確認しやすいため紹介します。
URL : https://exiftool.org/
MAT2
MAT2は、画像、PDF、Office文書など複数形式のメタデータ削除を目的としたローカルツールです。
紹介する理由: ファイル公開前に、ブラウザ上の簡易チェックだけでは見えにくいメタデータをローカル環境で減らす候補になるため紹介します。
qpdf
qpdfは、PDFの構造確認、変換、再構成に使われるPDF処理ツールです。
紹介する理由: PDFは見た目だけでは内部構造やメタデータが分かりにくいため、公開前にローカルで確認する候補として紹介します。