公開前にドキュメントを検査する方法
匿名性の判断で見落としやすい手がかりを、実践前後の確認に使える形で整理します。
文書を公開する前には、本文だけでなく、ファイル内部、ファイル名、コメント、変更履歴、共有履歴、PDF化後の状態まで確認します。
匿名性で危険なのは、本文に本名が残ることだけではありません。
作成者名、組織名、コメント、変更履歴、非表示シート、注釈、ファイル名、クラウド共有リンクからも、本人や関係者に近づきます。
この記事では、公開前にドキュメントを検査するための流れを整理します。
検査する対象
ドキュメント検査では、文書の表面と内部を分けて確認します。
| 対象 | 確認すること |
|---|---|
| 本文 | 氏名、地名、所属、時系列、内部用語 |
| コメント | 関係者名、編集メモ、レビュー内容 |
| 変更履歴 | 削除前の情報、修正者、修正時刻 |
| 作成者、作成日時、アプリ名、会社名 | |
| ファイル名 | 本名、部署名、案件名、日付 |
| 共有方法 | クラウドリンク、権限、送信先、ログイン状態 |
文書は、見た目だけで判断できません。
公開前には、本文、内部情報、送信方法を分けて確認します。
検査の基本手順
公開前の検査は、順番を決めて行います。
| 順番 | 作業 | 理由 |
|---|---|---|
| 1 | 原本をコピーする | 原本と公開用を混ぜない |
| 2 | 本文を読む | 直接識別子や固有表現を確認する |
| 3 | コメントと変更履歴を見る | 編集過程の情報を確認する |
| 4 | メタデータを見る | 作成者やアプリ情報を確認する |
| 5 | ファイル名を変える | 外側の個人情報を減らす |
| 6 | 公開用形式に変換する | 必要に応じてPDF化や再生成を行う |
| 7 | 変換後に再確認する | 新しいファイルに情報が残っていないか見る |
この順番を守る理由は、途中で新しいファイルを作ると、別のメタデータが付く場合があるからです。
変換後の再確認までが検査です。
本文の検査
まず本文を確認します。
本文には、直接の個人情報だけでなく、候補者を絞る情報が含まれます。
| 種類 | 例 |
|---|---|
| 直接識別子 | 本名、メール、電話番号、住所 |
| 所属情報 | 会社名、学校名、部署、役職 |
| 時系列 | 日付、時刻、イベント直後の記述 |
| 内部用語 | 社内略語、プロジェクト名、固有の呼び方 |
| 関係者情報 | 家族、同僚、取材源、参加者 |
匿名化では、固有名詞を消すだけでは足りません。
情報を知っている人が少ない出来事や、特定部署だけが使う言い回しも手がかりになります。
ファイル名と保存場所の検査
ファイル名は、見落とされやすい個人情報です。
本文やメタデータをきれいにしても、ファイル名に本名、部署名、案件名、日付が残っていれば匿名性は弱くなります。
| 確認するもの | 例 |
|---|---|
| 本名 | yamada_report.pdf、田中_資料.pdf |
| 部署名 | sales_internal.pdf、hr_case.docx |
| 案件名 | project_x_final.pdf |
| 日付 | 2026-06-12_meeting.pdf |
| 保存パス | /Users/name/Company/ など |
保存場所にも注意します。
クラウド同期フォルダで作業すると、ファイル履歴や共有履歴が残ることがあります。
職場端末や学校端末で作業する場合、端末管理ログやウイルス対策ソフトのログが関係する場合もあります。
変換後に増える情報
文書をPDF化したり、画像化したり、別形式に変換したりすると、新しいメタデータが付くことがあります。
| 変換 | 増えることがある情報 |
|---|---|
| OfficeからPDF | 作成アプリ、作成日時、PDF生成者 |
| PDFから画像 | 画像作成日時、変換ソフト名 |
| 画像の再保存 | 編集ソフト名、更新日時 |
| 音声・動画の再エンコード | エンコーダ情報、作成アプリ |
| クラウドからダウンロード | ファイル名やダウンロード時刻 |
変換は、情報を減らすために行うことがあります。
しかし、変換後のファイルは新しい確認対象です。
変換したら、必ずもう一度確認します。
内部情報の検査
次に、文書内部の情報を確認します。
Office文書なら、コメント、変更履歴、作成者、非表示シートを見ます。
PDFなら、作成者、注釈、埋め込み、非表示テキストを見ます。
画像やスキャンを含む文書なら、画像内の文字や背景も確認します。
| 形式 | 確認すること |
|---|---|
| Office | コメント、変更履歴、作成者、会社名、非表示シート |
| 作成者、注釈、埋め込み、黒塗り、非表示テキスト | |
| 画像入り文書 | 、背景、反射、文字、ファイル名 |
| 共同編集文書 | 共有履歴、編集者、コメント、権限 |
文書をPDF化した場合も、PDFとして再確認します。
変換は確認の終わりではなく、新しい確認対象を作る作業です。
使えるツールと限界
メタデータ確認にはExifToolが使われることがあります。
URL : https://exiftool.org/
PDF構造の確認や変換ではqpdfが候補になります。
URL : https://qpdf.readthedocs.io/
メタデータ削除ではMAT2が候補になります。
URL : https://0xacab.org/jvoisin/mat2
これらは便利なツールですが、文書内容の安全性を判断してくれるわけではありません。
ツールでメタデータを削っても、本文中の内部用語、画像内の看板、ファイル名、送信経路は残ります。
公開前に止まる判断
検査中に不明な項目が残った場合、公開を急がないほうがよいです。
| 止まるサイン | 理由 |
|---|---|
| 作成者名が消えたか確認できない | 本人や組織に近づく可能性がある |
| 変更履歴が残っている | 削除前の情報が見える可能性がある |
| 黒塗りが正しくできたか不明 | 下の文字が残る可能性がある |
| クラウド共有リンクしかない | 所有者や権限情報が関係する |
| 高リスクな内容を含む | 専門家や信頼できる相談先が必要な場合がある |
匿名性では、判断がつかない項目を安全扱いしません。
確認する、公開を遅らせる、情報を削る、相談する、公開しない、のどれかを選びます。
検査後の共有方法
検査が終わっても、共有方法で匿名性が崩れることがあります。
メール、クラウド共有、SNSのDM、アップロードフォーム、匿名投稿ツールでは、残る記録が違います。
| 共有方法 | 注意点 |
|---|---|
| メール | 送信者、宛先、時刻、添付ファイル名が残る |
| クラウド共有 | 所有者、共有権限、アクセス履歴が残る |
| SNSのDM | アカウント、送信時刻、端末情報と結びつく |
| アップロードフォーム | IP、User-Agent、送信時刻が記録される場合がある |
| 匿名投稿ツール | ツールの信頼モデルとファイル内容を確認する |
ファイルを検査しても、実名アカウントから送れば匿名性は崩れます。
ドキュメント検査は、共有方法の確認とセットで考えます。
まとめ
公開前のドキュメント検査では、本文、コメント、変更履歴、メタデータ、ファイル名、共有方法を分けて確認します。
文書は見た目だけでは安全性を判断できません。
PDF化しても、作成者、注釈、埋め込み、非表示テキストが残ることがあります。
ExifTool、qpdf、MAT2のようなツールは役立ちますが、ツールだけで匿名性は完成しません。
公開前には、原本と公開用を分け、削除後に再確認し、本文と送信経路まで確認します。
関連ツール
ExifTool
ExifToolは、画像、動画、PDF、Office文書など幅広い形式のメタデータを確認・編集できる代表的なローカルツールです。
紹介する理由: 匿名性が必要なファイルをオンライン変換サイトへアップロードせず、手元の環境でメタデータを確認しやすいため紹介します。
URL : https://exiftool.org/
MAT2
MAT2は、画像、PDF、Office文書など複数形式のメタデータ削除を目的としたローカルツールです。
紹介する理由: ファイル公開前に、ブラウザ上の簡易チェックだけでは見えにくいメタデータをローカル環境で減らす候補になるため紹介します。