PDFメタデータ削除
PDFには作成者、アプリ名、更新履歴、埋め込みオブジェクトなどが残ることがあります。
PDFを削除するときの注意
PDFのメタデータを削除すれば安全、と考えるのは不十分です。
メタデータ削除は重要です。しかし、PDFにはメタデータ以外にも、本文、画像、注釈、リンク、黒塗り処理、埋め込みファイル、ファイル名、共有設定があります。メタデータだけを消しても、別の場所に本人や組織へ戻る情報が残ることがあります。
この記事では、PDFメタデータ削除の考え方と、削除後に確認すべき点を整理します。
削除の前にコピーを作る
最初に行うのは、元ファイルを直接触らないことです。
公開用コピーを作り、そのコピーに対して削除や変換を行います。元ファイルには、編集履歴や証拠性が必要な場合があります。特に相談、告発、法的手続きでは、元ファイルの扱いを慎重に考えます。
| 対象 | 扱い方 | 理由 |
|---|---|---|
| 元ファイル | 安全な場所に保管 | 証拠性や再確認のため |
| 公開用コピー | メタデータ削除や変換を行う | 公開用に整えるため |
| 作業フォルダ | 個人名や案件名を避ける | ファイルパスの漏れを減らす |
| 共有先 | 必要最小限にする | 不要な拡散を避ける |
| 記録 | 何を削除したか残す | 後で確認できるようにする |
メタデータ削除は、作業の一部です。
元ファイル管理、公開用コピー、共有先確認まで含めて考えます。
削除すべき情報
PDFから削除・確認すべき情報は複数あります。
| 情報 | リスク | 確認方法 |
|---|---|---|
| 作成者 | 個人名やOSユーザー名が出る | 文書プロパティを見る |
| 会社名 | 所属組織が見える | プロパティや元Officeを確認する |
| 作成日時 | 行動時間と結びつく | プロパティを見る |
| 注釈 | コメントや内部会話が出る | 注釈一覧を見る |
| 埋め込みファイル | 元資料が混ざる | 添付や構造を確認する |
| フォーム | 入力情報が残る | フォームフィールドを確認する |
Office文書からPDFを作った場合は、元のOffice側にも注意します。
PDFだけを見ても、元ファイルに作成者や変更履歴が残っていることがあります。
削除後に再確認する
削除ツールを使ったあとも、必ず再確認します。
メタデータを消したつもりでも、注釈、リンク、画像、本文、黒塗り部分に情報が残ることがあります。
| 確認すること | 理由 |
|---|---|
| 文書プロパティ | 作成者やタイトルが消えたか見る |
| 本文検索 | 隠した語が検索で出ないか見る |
| コピー操作 | 黒塗り文字がコピーできないか見る |
| 注釈一覧 | コメントが残っていないか見る |
| リンク | 個人IDや内部URLが残っていないか見る |
| ファイル名 | 本名や組織名が入っていないか見る |
削除しただけで安心しないことが重要です。
公開するファイルを、別の環境で開き直して確認します。
ツールは補助である
PDFの確認や変換には、qpdf、ExifTool、mat2などのツールが使われることがあります。
ExifToolは複数形式のメタデータ確認に使われる代表的なツールです。
URL : https://exiftool.org/
ただし、ツールは万能ではありません。
ツールは内部情報の確認や削除に役立ちますが、本文に書かれた情報、画像の背景、スクリーンショット内の通知、共有リンクの所有者名までは別に確認します。
| ツールでできること | ツールだけでは足りないこと |
|---|---|
| メタデータの確認 | 文章の固有情報 |
| 一部メタデータの削除 | 黒塗りの安全性 |
| ファイル構造の確認 | 画像内の背景や反射 |
| 形式変換 | 共有先のログや所有者表示 |
| 自動処理 | 高リスクな法的判断 |
高リスクな文書では、ツールの実行結果だけで公開判断をしないでください。
削除してはいけない情報もある
匿名性だけを見ると、すべての情報を消したくなります。
しかし、被害相談、内部告発、法的相談では、証拠として残すべき情報があります。元ファイルの作成日時、編集履歴、送信経路が、後で重要になる場合があります。
| 情報 | 公開用では | 相談・証拠では |
|---|---|---|
| 作成日時 | ぼかす、消すことを検討 | 必要な記録になる場合がある |
| 作成者 | 公開前に削除する | 原本では保持する場合がある |
| 変更履歴 | 公開用からは消す | 経緯説明に必要な場合がある |
| 注釈 | 公開用からは消す | 内部確認の記録になる場合がある |
| 元ファイル | 公開しない | 安全な場所で保管する |
公開用ファイルと保管用原本を分ける理由はここにあります。
匿名性を守るために必要な削除と、証拠を守るために必要な保存は、同時に考える必要があります。
削除後の名前と置き場所
メタデータを削除しても、ファイル名や置き場所で情報が出ることがあります。
たとえば、ファイル名に本名、会社名、案件名が入っている。クラウドの共有リンクに実名アカウントの所有者名が表示される。作業フォルダ名がスクリーンショットに写る。こうした情報は、メタデータ削除とは別に確認します。
| 確認するもの | 理由 |
|---|---|
| ファイル名 | 本名、組織名、案件名を避ける |
| フォルダ名 | 画面共有や圧縮時に出る |
| クラウド所有者 | 実名アカウントと結びつく |
| 共有URL | 個人IDやトラッキングが含まれる |
| 送信時刻 | 行動記録と照合される |
削除作業の最後には、第三者の目で見た状態を確認します。
自分の端末では安全に見えても、受け取る側では所有者名、プレビュー、リンクカード、ファイル名が表示されることがあります。可能であれば、別のブラウザや別環境で、公開される最終状態を確認します。
削除後の確認では、メタデータだけを見ないことが重要です。
本文内の固有名詞、画像の背景、リンク先、ファイル名、アップロード先の表示名も確認します。削除作業は、最終公開物全体の確認とセットです。
削除作業を記録する
高リスクな文書では、何を削除し、何を残したかを記録しておくと後で確認しやすくなります。
ただし、その記録自体にも注意が必要です。実名クラウドや職場端末に保存すると、削除対象の資料と自分が結びつく手がかりになります。
| 記録すること | 注意点 |
|---|---|
| 削除した項目 | 公開用ファイルに含めない |
| 残した項目 | なぜ残すか説明できるようにする |
| 元ファイルの保管場所 | 安全な場所に限定する |
| 公開用ファイル名 | 個人情報を入れない |
| 確認した日時 | 行動記録との相関に注意する |
削除作業は、公開判断の一部です。
削除後は別の方法で検証する
メタデータ削除は、実行しただけで終わりにしません。
削除に使ったツールとは別の方法で確認します。文書プロパティを見る、文字をコピーして検索する、別のPDFビューアで開く、別環境でダウンロードしてみる。複数の見方を使うと、削除漏れや表示の違いに気づきやすくなります。
| 検証方法 | 見つけやすい問題 |
|---|---|
| 文書プロパティを見る | 作成者、タイトル、作成ソフト |
| コピーして検索する | 黒塗り下の文字 |
| 別ビューアで開く | 注釈やフォームの残り |
| 別環境で確認する | 所有者名や共有表示 |
| 本文を読み直す | 固有名詞や文脈の漏れ |
削除作業では、ツールの成功表示よりも、公開される最終状態を重視します。
匿名性では「消したつもり」が最も危険です。消した後に、受け取る側の環境でどう見えるかを確認します。
まとめ
PDFメタデータ削除は重要ですが、それだけで安全になるわけではありません。
元ファイルを直接公開せず、公開用コピーを作り、作成者、会社名、作成日時、注釈、埋め込み、フォーム、リンクを確認します。
削除後は、文書プロパティ、検索、コピー、注釈、ファイル名を再確認します。
ツールは補助です。
本文、画像、黒塗り、共有先、法的リスクは別に確認します。
関連ツール
Wayback Machine
Wayback Machineは、Internet Archiveが提供するWebアーカイブで、過去のWebページが保存されているか確認できます。
紹介する理由: 元ページを削除しても、過去のプロフィール、画像、ページ内容がアーカイブに残ることがあります。過去情報の確認先として代表的なため紹介します。
URL : https://web.archive.org/
ExifTool
ExifToolは、画像、動画、PDF、Office文書など幅広い形式のメタデータを確認・編集できる代表的なローカルツールです。
紹介する理由: 匿名性が必要なファイルをオンライン変換サイトへアップロードせず、手元の環境でメタデータを確認しやすいため紹介します。
URL : https://exiftool.org/
MAT2
MAT2は、画像、PDF、Office文書など複数形式のメタデータ削除を目的としたローカルツールです。
紹介する理由: ファイル公開前に、ブラウザ上の簡易チェックだけでは見えにくいメタデータをローカル環境で減らす候補になるため紹介します。
qpdf
qpdfは、PDFの構造確認、変換、再構成に使われるPDF処理ツールです。
紹介する理由: PDFは見た目だけでは内部構造やメタデータが分かりにくいため、公開前にローカルで確認する候補として紹介します。