PDF・Office・動画・音声ファイルのメタデータ
PDF、Office、動画、音声に残りやすい作成者、編集履歴、タグ、アプリ情報をまとめて比較します。
画像の情報はよく知られています。 しかし、匿名性で注意すべきは画像だけではありません。
PDF、Office文書、動画、音声、圧縮ファイルにも、作成者名、編集履歴、使用ソフト、撮影日時、タグ情報、コメント、内部ファイル名などが残ることがあります。
見た目では消したつもりでも、ファイルの内部には別の情報が残っていることがあります。 また、メタデータを消しても、本文、背景、音声、画面内の文字、ファイル名から身元や所属が推測されることがあります。
この記事では、ファイル形式ごとに残りやすい情報と、公開前に確認すべき観点を整理します。
メタデータはファイルの周辺情報
メタデータとは、ファイル本体に付随する情報です。
文章本文や画像そのものとは別に、作成者、作成日時、編集ソフト、位置情報、変更履歴、コメントなどが含まれる場合があります。
匿名性では、メタデータは強い手がかりになります。 なぜなら、本文に名前を書いていなくても、ファイル内部に作成者名や組織名が残ることがあるからです。
| 形式 | 残りやすい情報 | 注意点 |
|---|---|---|
| 作成者、作成ソフト、注釈、埋め込みファイル | 黒塗りや注釈の扱いに注意する | |
| Office文書 | 作成者、会社名、変更履歴、コメント | 非表示シートや校閲情報が残る |
| 動画 | 撮影日時、端末情報、位置情報、編集ソフト | 音声や背景も手がかりになる |
| 音声 | ID3タグ、録音日時、アプリ情報 | 声や背景音も確認する |
| 圧縮ファイル | 内部ファイル名、フォルダ名、不要ファイル | 作業途中のデータが混ざる |
メタデータは、ファイル形式ごとに見え方が違います。 そのため、ひとつの確認方法ですべて安全と判断しないほうがよいです。
PDFで注意する情報
PDFは、文書を配布しやすい形式です。 しかし、匿名で資料を公開する場合は注意が必要です。
PDFには、作成者名、作成日時、作成ソフト、タイトル、注釈、埋め込みファイル、フォーム情報などが残る場合があります。
また、見た目上は黒塗りにしたつもりでも、内部に元の文字情報が残っている場合があります。 画像として黒い四角を重ねただけでは、コピーや検索で元の文字が取り出せることがあります。
| 確認するもの | 理由 |
|---|---|
| 文書プロパティ | 作成者名や作成ソフトが残る |
| 注釈 | コメントや編集メモが見える |
| 埋め込みファイル | 元資料や不要データが含まれる |
| 黒塗り処理 | 元文字が内部に残らないか確認する |
| ファイル名 | 案件名、組織名、本名が入ることがある |
PDFは公開用に見えますが、内部構造まで安全とは限りません。 高リスクな資料では、ローカルツールで確認し、必要なら安全な形で再生成します。
Office文書で注意する情報
Word、Excel、PowerPointなどのOffice文書は、作業履歴が残りやすい形式です。
作成者名、会社名、変更履歴、コメント、非表示シート、テンプレート、リンク、共同編集履歴などが含まれる場合があります。
内部告発や取材資料では、Office文書をそのまま渡すことは特に慎重に考える必要があります。 文書の内容だけでなく、誰が作ったか、どの組織環境で編集されたかが残ることがあるからです。
| 確認するもの | 見える情報 |
|---|---|
| 作成者 | 個人名やアカウント名 |
| 会社名 | 所属組織や端末設定 |
| 変更履歴 | 誰がどこを編集したか |
| コメント | 内部会話や判断の痕跡 |
| 非表示シート | 表示されていないデータ |
| リンク | 社内パスやクラウドURL |
Office文書は、見た目のページだけで判断しないことが重要です。 公開用にする場合は、不要な履歴を削除し、別形式で出力した後も再確認します。
動画で注意する情報
動画は、メタデータと中身の両方に注意が必要です。
ファイル内部には、撮影日時、端末情報、位置情報、編集ソフト、エンコード情報が残る場合があります。 さらに、映像そのものに顔、背景、看板、制服、車両、窓の反射、通知、画面内のアカウント名が写ることがあります。
動画は静止画より情報量が多いため、匿名性の確認も難しくなります。
| 確認するもの | 理由 |
|---|---|
| 撮影日時 | 行動時間や現地参加と結びつく |
| 位置情報 | 撮影場所が分かる |
| 端末情報 | 使用機種や編集環境が見える |
| 背景 | 建物、看板、風景から場所が分かる |
| 音声 | 声、環境音、会話が手がかりになる |
| 通知 | アカウント名や連絡先が写る |
動画では、メタデータを消しても中身の確認が残ります。 短い動画でも、数秒の背景や音から場所や人物が推測されることがあります。
音声で注意する情報
音声ファイルにもメタデータがあります。
MP3などには、タイトル、アーティスト、アルバム、作成ソフト、コメントなどのタグ情報が入る場合があります。 録音アプリや編集ソフトの情報が残ることもあります。
また、音声では中身そのものが強い手がかりです。 声、話し方、方言、背景音、通知音、駅のアナウンス、車の音、部屋の反響などから、人物や場所が推測される場合があります。
| 確認するもの | 理由 |
|---|---|
| ID3タグ | タイトルや作成者情報が残る |
| 録音日時 | 行動時刻と照合される |
| 作成アプリ | 使用環境の手がかりになる |
| 声 | 本人や関係者が分かる |
| 背景音 | 場所や状況が分かる |
音声を匿名で公開する場合は、メタデータ削除だけでは足りません。 声質、話し方、背景音まで確認します。
圧縮ファイルで注意する情報
ZIPなどの圧縮ファイルは、複数のファイルをまとめて渡すときに使われます。
圧縮ファイルでは、内部のファイル名、フォルダ名、不要ファイル、作業途中のデータに注意します。
たとえば、公開したいPDFだけを入れたつもりでも、同じフォルダに元のOffice文書、メモ、スクリーンショット、隠しファイルが混ざることがあります。 フォルダ名に本名、案件名、会社名が入っている場合もあります。
圧縮ファイルは、開いたときの中身を必ず確認します。
確認の基本手順
ファイル形式に関係なく、確認の流れは共通しています。
| 段階 | 確認すること |
|---|---|
| 1 | 元ファイルを直接公開しない |
| 2 | 公開用コピーを作る |
| 3 | ファイル名を確認する |
| 4 | メタデータを確認する |
| 5 | 本文、画像、音声、背景を確認する |
| 6 | 削除や変換後に再確認する |
| 7 | アップロード先で相手にどう見えるか確認する |
ExifToolのようなツールは、複数形式のメタデータ確認に使われます。
ExifToolは、画像、動画、文書など複数形式のメタデータを確認・編集できる代表的なローカルツールです。ファイル形式ごとの違いを学ぶときにも、実際にどの情報が入っているかを確認する入口になります。 URL : https://exiftool.org/
ただし、ツールの結果だけで終わらせないでください。 ツールは内部情報の確認に役立ちますが、画像の背景、文書の本文、音声の中身、アップロード先の所有者表示までは別に確認する必要があります。
まとめ
メタデータは画像だけの問題ではありません。
PDF、Office文書、動画、音声、圧縮ファイルにも、作成者、編集履歴、作成ソフト、タグ、位置情報、内部ファイル名などが残る場合があります。
匿名性では、ファイルの中身とメタデータを分けて確認します。 メタデータを消しても、本文、背景、音声、反射、ファイル名、共有設定から身元や所属が推測されることがあります。
公開前には、元ファイルを直接出さず、公開用コピーを作り、形式ごとに確認し、削除後に再確認します。 ファイルを渡す行為は、本文だけでなく作成環境や共有経路も渡す可能性があると考える必要があります。
関連ツール
Wayback Machine
Wayback Machineは、Internet Archiveが提供するWebアーカイブで、過去のWebページが保存されているか確認できます。
紹介する理由: 元ページを削除しても、過去のプロフィール、画像、ページ内容がアーカイブに残ることがあります。過去情報の確認先として代表的なため紹介します。
URL : https://web.archive.org/
ExifTool
ExifToolは、画像、動画、PDF、Office文書など幅広い形式のメタデータを確認・編集できる代表的なローカルツールです。
紹介する理由: 匿名性が必要なファイルをオンライン変換サイトへアップロードせず、手元の環境でメタデータを確認しやすいため紹介します。
URL : https://exiftool.org/
MAT2
MAT2は、画像、PDF、Office文書など複数形式のメタデータ削除を目的としたローカルツールです。
紹介する理由: ファイル公開前に、ブラウザ上の簡易チェックだけでは見えにくいメタデータをローカル環境で減らす候補になるため紹介します。
qpdf
qpdfは、PDFの構造確認、変換、再構成に使われるPDF処理ツールです。
紹介する理由: PDFは見た目だけでは内部構造やメタデータが分かりにくいため、公開前にローカルで確認する候補として紹介します。
FFmpeg
FFmpegは、動画・音声ファイルの変換、再エンコード、メタデータ確認に使われる代表的なローカルツールです。
紹介する理由: 動画や音声には撮影・作成・編集に関する情報が残ることがあるため、公開前にローカルで確認・再処理する候補として紹介します。
URL : https://ffmpeg.org/