Learn

ジャーナリスト

受け取ったファイルのメタデータ確認

取材源から受け取った画像、PDF、音声、動画のメタデータを公開前に確認します。

取材源から受け取ったファイルは、そのまま開いて、そのまま共有してはいけません。

画像、PDF、Office文書、動画、音声、圧縮ファイルには、本文以外の情報が残ることがあります。作成者名、組織名、撮影場所、撮影日時、編集履歴、コメント、内部ファイル名。こうした情報が、取材源を示す手がかりになります。

確認は、公開前だけでなく、編集部内で共有する前にも必要です。

メタデータとは何か

メタデータとは、ファイルの中身そのものではなく、ファイルに付随する情報です。

文書なら作成者や編集履歴、画像なら撮影日時やGPS、動画なら機器情報や音声、圧縮ファイルなら内部のフォルダ名が問題になります。

ファイル確認する情報
画像GPS、撮影日時、カメラ機種、サムネイル
PDF作成者、編集ソフト、埋め込み情報
Word・Excel作成者、組織名、変更履歴、コメント
動画撮影日時、機器情報、音声、背景
音声録音環境、話者、背景音、作成情報
圧縮ファイル内部ファイル名、フォルダ構成、作成日時

ファイルを見た目だけで判断すると、こうした情報を見落とします。

メタデータは、ファイルの説明書のような情報です。 作成者、日時、機器、編集履歴、位置情報、ソフトウェア、内部ファイル名が含まれます。 取材源は本文から名前を消していても、メタデータに実名や組織名が残っていることがあります。

また、メタデータだけが問題ではありません。 画像の背景、音声に入った声や地名、文書本文の内部用語、ファイル名、フォルダ構成も手がかりになります。 メタデータ確認は、ファイル確認全体の一部です。

取材源にどうつながるのか

メタデータは、取材源の名前を直接出すこともあります。

しかし、それだけではありません。組織名、端末名、部署名、撮影場所、撮影時刻が出るだけでも、候補が絞られます。

残る情報取材源へのつながり
作成者名実名や社内アカウントが出る
組織名勤務先や部署が分かる
撮影場所どこで資料を撮ったか分かる
撮影時刻勤務記録や入退室ログと照合される
コメント履歴共同編集者や内部のやり取りが見える

内部資料では、作成者ではなく閲覧者や編集者が疑われることもあります。

どの情報が誰につながるかを考えます。

たとえば、画像のGPSが撮影場所を示す。 Office文書の最終保存者が社内アカウント名を示す。 PDFの作成日時が資料閲覧の時刻と重なる。 圧縮ファイルの中に部署名のフォルダが残る。 これらは、取材源本人だけでなく、資料の配布先や関係部署を示します。

取材源保護では、「名前が出ていないから安全」と判断しません。 候補を絞る情報が残っていないかを見ます。

確認する順番

受け取ったファイルは、作業用の安全な環境で確認します。

普段のクラウドや個人端末にそのまま入れると、同期、プレビュー、履歴、バックアップが発生します。

順番作業
1受け取り経路と送信者の状況を記録する
2元ファイルを不用意に開かず、コピーを作って確認する
3ファイル名、拡張子、作成日時を確認する
4メタデータ、コメント、変更履歴を確認する
5公開用コピーから不要情報を削除する
6公開前に別の人が再確認する

元ファイルは証拠性のために保存が必要な場合があります。

その場合でも、公開用ファイルとは分けて扱います。

受け取ったファイルを普段の環境で開くと、プレビュー、同期、最近使ったファイル、ウイルススキャン、クラウドバックアップが動くことがあります。 その結果、取材源からのファイルが別の場所に残ります。 高リスクな資料は、確認用の環境と保存場所を分けます。

また、元ファイルをいきなり加工しないことも重要です。 証拠として保全すべき場合があります。 元ファイル、確認用コピー、公開用コピーを分け、公開用だけを加工します。

ツールだけに頼らない

メタデータ確認にはツールが役立ちます。

ExifToolは、多くのファイル形式のメタデータを手元で確認できる代表的なツールです。受け取ったファイルをよく分からないオンライン確認サイトへアップロードせず、ローカルで確認できる点が重要です。詳しい使い方は別の記事で扱います。

URL : https://exiftool.org/

ただし、ツールだけで安全になるわけではありません。

画像の背景、音声の内容、文書本文の固有表現、資料の種類そのものから取材源が推測されることがあります。

確認方法見落としやすいもの
メタデータ確認ツール画像の背景や本文の内容
目視確認ファイル内部の作成者情報
音声確認メタデータや録音機器情報
自動削除コメントや変更履歴の一部

ツール確認と人間の確認を組み合わせます。

ExifToolのようなツールは、見えない情報を確認する助けになります。 しかし、ツールが何も表示しないから安全とは限りません。 画像の背景に駅名が写っている、音声に名前が入っている、文書の言い回しで部署が分かる、といった情報は人間が確認する必要があります。

逆に、人間の目視だけでは、ファイル内部の作成者情報や埋め込みデータを見落とします。 取材源保護では、ツール確認と目視・聴取確認を組み合わせます。

編集部内で共有する前に確認する

メタデータ確認は、公開直前だけでは遅い場合があります。 編集部内の共有フォルダ、チャット、クラウドに元ファイルを置いた時点で、閲覧者や共有履歴が広がります。 取材源の情報が入ったファイルを、そのまま多数に共有しないようにします。

共有前に見ること理由
共有範囲必要な人以外に広げない
ファイル名取材源や組織名が出ていないか
メタデータ作成者、位置情報、編集履歴を確認する
保存場所実名クラウドや広い共有フォルダを避ける
公開用コピー元ファイルと分けて扱う

受け取ったファイルは、公開物になる前から取材源保護の対象です。

高リスクな資料では、確認や加工を一人で判断しないこともあります。 証拠性、法的リスク、取材源保護が同時に関係するため、必要に応じて編集責任者、弁護士、信頼できる専門家に相談します。 ただし、相談時にも元ファイルを不用意に広げないようにします。 受け取り直後は、まず隔離して扱う意識が必要です。普段のクラウドやチャットに流す前に、確認環境、保存場所、共有範囲を決めます。

まとめ

取材源から受け取ったファイルには、本文以外の情報が残ります。

作成者、組織名、撮影場所、撮影日時、編集履歴、コメント、内部ファイル名は、取材源を示す手がかりになります。

ファイルは、公開前だけでなく編集部内で共有する前にも確認します。

ExifToolのようなツールは有用ですが、背景、本文、音声、資料の種類からの逆算は別に見る必要があります。

メタデータ確認は、取材源保護の基本作業です。

関連ツール

Reverse image search

Google Lens

Google Lensは、画像から似た画像、写っている物、場所、文字などを検索できるGoogleの画像検索サービスです。

紹介する理由: 顔、背景、看板、服装、アイコンなどが画像検索の入口になることを確認する実用例として紹介します。

URL : https://lens.google/

外部サイトを開く
Metadata inspection

ExifTool

ExifToolは、画像、動画、PDF、Office文書など幅広い形式のメタデータを確認・編集できる代表的なローカルツールです。

紹介する理由: 匿名性が必要なファイルをオンライン変換サイトへアップロードせず、手元の環境でメタデータを確認しやすいため紹介します。

URL : https://exiftool.org/

外部サイトを開く
Metadata removal

MAT2

MAT2は、画像、PDF、Office文書など複数形式のメタデータ削除を目的としたローカルツールです。

紹介する理由: ファイル公開前に、ブラウザ上の簡易チェックだけでは見えにくいメタデータをローカル環境で減らす候補になるため紹介します。

URL : https://0xacab.org/jvoisin/mat2

外部サイトを開く
PDF inspection

qpdf

qpdfは、PDFの構造確認、変換、再構成に使われるPDF処理ツールです。

紹介する理由: PDFは見た目だけでは内部構造やメタデータが分かりにくいため、公開前にローカルで確認する候補として紹介します。

URL : https://qpdf.readthedocs.io/

外部サイトを開く
Audio and video

FFmpeg

FFmpegは、動画・音声ファイルの変換、再エンコード、メタデータ確認に使われる代表的なローカルツールです。

紹介する理由: 動画や音声には撮影・作成・編集に関する情報が残ることがあるため、公開前にローカルで確認・再処理する候補として紹介します。

URL : https://ffmpeg.org/

外部サイトを開く
Whistleblower submission

SecureDrop

SecureDropは、報道機関やNGOが匿名の情報提供を受け付けるために導入できるオープンソースの内部告発・情報提供システムです。

紹介する理由: 取材源保護や内部告発の文脈で、提出先、Tor Browser、ファイルメタデータ、運用前提を考える代表的な実用例として紹介します。

URL : https://securedrop.org/

外部サイトを開く
Whistleblower platform

GlobaLeaks

GlobaLeaksは、組織が通報・内部告発窓口を構築するための自由でオープンソースのソフトウェアです。

紹介する理由: 内部告発や相談窓口では、提出先の信頼性、運用者、ログ、ファイルメタデータを考える必要があります。その比較対象として紹介します。

URL : https://globaleaks.org/

外部サイトを開く

関連記事