Learn

メタデータ

PDFメタデータ削除

PDFには作成者、アプリ名、更新履歴、埋め込みオブジェクトなどが残ることがあります。

PDFを削除するときの注意

PDFのメタデータを削除すれば安全、と考えるのは不十分です。

メタデータ削除は重要です。しかし、PDFにはメタデータ以外にも、本文、画像、注釈、リンク、黒塗り処理、埋め込みファイル、ファイル名、共有設定があります。メタデータだけを消しても、別の場所に本人や組織へ戻る情報が残ることがあります。

この記事では、PDFメタデータ削除の考え方と、削除後に確認すべき点を整理します。

削除の前にコピーを作る

最初に行うのは、元ファイルを直接触らないことです。

公開用コピーを作り、そのコピーに対して削除や変換を行います。元ファイルには、編集履歴や証拠性が必要な場合があります。特に相談、告発、法的手続きでは、元ファイルの扱いを慎重に考えます。

対象扱い方理由
元ファイル安全な場所に保管証拠性や再確認のため
公開用コピーメタデータ削除や変換を行う公開用に整えるため
作業フォルダ個人名や案件名を避けるファイルパスの漏れを減らす
共有先必要最小限にする不要な拡散を避ける
記録何を削除したか残す後で確認できるようにする

メタデータ削除は、作業の一部です。

元ファイル管理、公開用コピー、共有先確認まで含めて考えます。

削除すべき情報

PDFから削除・確認すべき情報は複数あります。

情報リスク確認方法
作成者個人名やOSユーザー名が出る文書プロパティを見る
会社名所属組織が見えるプロパティや元Officeを確認する
作成日時行動時間と結びつくプロパティを見る
注釈コメントや内部会話が出る注釈一覧を見る
埋め込みファイル元資料が混ざる添付や構造を確認する
フォーム入力情報が残るフォームフィールドを確認する

Office文書からPDFを作った場合は、元のOffice側にも注意します。

PDFだけを見ても、元ファイルに作成者や変更履歴が残っていることがあります。

削除後に再確認する

削除ツールを使ったあとも、必ず再確認します。

メタデータを消したつもりでも、注釈、リンク、画像、本文、黒塗り部分に情報が残ることがあります。

確認すること理由
文書プロパティ作成者やタイトルが消えたか見る
本文検索隠した語が検索で出ないか見る
コピー操作黒塗り文字がコピーできないか見る
注釈一覧コメントが残っていないか見る
リンク個人IDや内部URLが残っていないか見る
ファイル名本名や組織名が入っていないか見る

削除しただけで安心しないことが重要です。

公開するファイルを、別の環境で開き直して確認します。

ツールは補助である

PDFの確認や変換には、qpdf、ExifTool、mat2などのツールが使われることがあります。

ExifToolは複数形式のメタデータ確認に使われる代表的なツールです。

URL : https://exiftool.org/

ただし、ツールは万能ではありません。

ツールは内部情報の確認や削除に役立ちますが、本文に書かれた情報、画像の背景、スクリーンショット内の通知、共有リンクの所有者名までは別に確認します。

ツールでできることツールだけでは足りないこと
メタデータの確認文章の固有情報
一部メタデータの削除黒塗りの安全性
ファイル構造の確認画像内の背景や反射
形式変換共有先のログや所有者表示
自動処理高リスクな法的判断

高リスクな文書では、ツールの実行結果だけで公開判断をしないでください。

削除してはいけない情報もある

匿名性だけを見ると、すべての情報を消したくなります。

しかし、被害相談、内部告発、法的相談では、証拠として残すべき情報があります。元ファイルの作成日時、編集履歴、送信経路が、後で重要になる場合があります。

情報公開用では相談・証拠では
作成日時ぼかす、消すことを検討必要な記録になる場合がある
作成者公開前に削除する原本では保持する場合がある
変更履歴公開用からは消す経緯説明に必要な場合がある
注釈公開用からは消す内部確認の記録になる場合がある
元ファイル公開しない安全な場所で保管する

公開用ファイルと保管用原本を分ける理由はここにあります。

匿名性を守るために必要な削除と、証拠を守るために必要な保存は、同時に考える必要があります。

削除後の名前と置き場所

メタデータを削除しても、ファイル名や置き場所で情報が出ることがあります。

たとえば、ファイル名に本名、会社名、案件名が入っている。クラウドの共有リンクに実名アカウントの所有者名が表示される。作業フォルダ名がスクリーンショットに写る。こうした情報は、メタデータ削除とは別に確認します。

確認するもの理由
ファイル名本名、組織名、案件名を避ける
フォルダ名画面共有や圧縮時に出る
クラウド所有者実名アカウントと結びつく
共有URL個人IDやトラッキングが含まれる
送信時刻行動記録と照合される

削除作業の最後には、第三者の目で見た状態を確認します。

自分の端末では安全に見えても、受け取る側では所有者名、プレビュー、リンクカード、ファイル名が表示されることがあります。可能であれば、別のブラウザや別環境で、公開される最終状態を確認します。

削除後の確認では、メタデータだけを見ないことが重要です。

本文内の固有名詞、画像の背景、リンク先、ファイル名、アップロード先の表示名も確認します。削除作業は、最終公開物全体の確認とセットです。

削除作業を記録する

高リスクな文書では、何を削除し、何を残したかを記録しておくと後で確認しやすくなります。

ただし、その記録自体にも注意が必要です。実名クラウドや職場端末に保存すると、削除対象の資料と自分が結びつく手がかりになります。

記録すること注意点
削除した項目公開用ファイルに含めない
残した項目なぜ残すか説明できるようにする
元ファイルの保管場所安全な場所に限定する
公開用ファイル名個人情報を入れない
確認した日時行動記録との相関に注意する

削除作業は、公開判断の一部です。

削除後は別の方法で検証する

メタデータ削除は、実行しただけで終わりにしません。

削除に使ったツールとは別の方法で確認します。文書プロパティを見る、文字をコピーして検索する、別のPDFビューアで開く、別環境でダウンロードしてみる。複数の見方を使うと、削除漏れや表示の違いに気づきやすくなります。

検証方法見つけやすい問題
文書プロパティを見る作成者、タイトル、作成ソフト
コピーして検索する黒塗り下の文字
別ビューアで開く注釈やフォームの残り
別環境で確認する所有者名や共有表示
本文を読み直す固有名詞や文脈の漏れ

削除作業では、ツールの成功表示よりも、公開される最終状態を重視します。

匿名性では「消したつもり」が最も危険です。消した後に、受け取る側の環境でどう見えるかを確認します。

まとめ

PDFメタデータ削除は重要ですが、それだけで安全になるわけではありません。

元ファイルを直接公開せず、公開用コピーを作り、作成者、会社名、作成日時、注釈、埋め込み、フォーム、リンクを確認します。

削除後は、文書プロパティ、検索、コピー、注釈、ファイル名を再確認します。

ツールは補助です。

本文、画像、黒塗り、共有先、法的リスクは別に確認します。

関連ツール

Archive check

Wayback Machine

Wayback Machineは、Internet Archiveが提供するWebアーカイブで、過去のWebページが保存されているか確認できます。

紹介する理由: 元ページを削除しても、過去のプロフィール、画像、ページ内容がアーカイブに残ることがあります。過去情報の確認先として代表的なため紹介します。

URL : https://web.archive.org/

外部サイトを開く
Metadata inspection

ExifTool

ExifToolは、画像、動画、PDF、Office文書など幅広い形式のメタデータを確認・編集できる代表的なローカルツールです。

紹介する理由: 匿名性が必要なファイルをオンライン変換サイトへアップロードせず、手元の環境でメタデータを確認しやすいため紹介します。

URL : https://exiftool.org/

外部サイトを開く
Metadata removal

MAT2

MAT2は、画像、PDF、Office文書など複数形式のメタデータ削除を目的としたローカルツールです。

紹介する理由: ファイル公開前に、ブラウザ上の簡易チェックだけでは見えにくいメタデータをローカル環境で減らす候補になるため紹介します。

URL : https://0xacab.org/jvoisin/mat2

外部サイトを開く
PDF inspection

qpdf

qpdfは、PDFの構造確認、変換、再構成に使われるPDF処理ツールです。

紹介する理由: PDFは見た目だけでは内部構造やメタデータが分かりにくいため、公開前にローカルで確認する候補として紹介します。

URL : https://qpdf.readthedocs.io/

外部サイトを開く

関連記事