qpdf / MAT2 ガイド
匿名性の判断で見落としやすい手がかりを、実践前後の確認に使える形で整理します。
PDFや文書ファイルのを確認・削除するとき、qpdfやMAT2のようなローカルツールが候補になります。
ただし、ツール名だけを覚えても匿名性は守れません。
重要なのは、どのツールが何を扱い、何を扱わないのかを理解することです。
この記事では、qpdfとMAT2の役割、匿名性の文脈での使いどころ、使うときの限界を整理します。
qpdfとは
qpdfは、PDFファイルの構造確認や変換に使われるツールです。
PDFの内部構造を扱うため、PDFの検査や再生成の流れで登場します。
公式ドキュメントでは、機能や使い方を確認できます。
URL : https://qpdf.readthedocs.io/
匿名性の文脈では、qpdfはPDFを自動的に安全にする道具ではありません。
PDFの構造を扱うための道具です。
作成者、注釈、埋め込み、非表示テキストなどを確認する作業と組み合わせて使います。
MAT2とは
MAT2は、Metadata Anonymisation Toolkitとして開発されているメタデータ削除ツールです。
画像、文書、音声など、複数形式のメタデータ削除をまとめて扱う用途で使われます。
公式リポジトリでは、対応形式や使い方を確認できます。
URL : https://0xacab.org/jvoisin/mat2
MAT2は、複数の形式をまとめて扱える点が便利です。
ただし、MAT2を通したからといって、ファイルの内容や見た目の手がかりが消えるわけではありません。
qpdfとMAT2の違い
qpdfとMAT2は、同じ目的の道具ではありません。
| 項目 | qpdf | MAT2 |
|---|---|---|
| 主な対象 | 複数形式のメタデータ削除 | |
| 得意なこと | PDF構造の処理や変換 | メタデータ削除の自動化 |
| 匿名性での役割 | PDF内部を扱う確認・再生成の補助 | 公開用ファイルのメタデータ削除補助 |
| 注意点 | PDF内容の判断は別に必要 | 削除後の再確認が必要 |
どちらも、ツール単体で匿名性を保証するものではありません。
匿名性では、削除前の確認、処理、削除後の再確認、見た目の確認をセットで行います。
どちらを使うべきか
qpdfとMAT2は、目的から選びます。
| 目的 | 候補 | 理由 |
|---|---|---|
| PDFの構造を確認したい | qpdf | PDF内部の扱いに向いている |
| PDFを再生成したい | qpdf | 変換や線形化などPDF処理を扱える |
| 複数形式のメタデータを削除したい | MAT2 | 画像や文書などをまとめて扱える |
| 削除後に何が残るか確認したい | ExifToolなども併用 | 別の視点で確認するため |
| 高リスク文書を扱う | 複数手段で確認 | ひとつのツールを過信しないため |
初心者が最初に考えるべきなのは、ツール名ではありません。
そのファイルが何の形式で、どの情報を消したいのかです。
PDFの構造を見たいならqpdf、複数形式のメタデータ削除をしたいならMAT2というように、目的から選びます。
ツール紹介で重要な信頼モデル
ローカルツールを使う利点は、ファイルを外部Webサービスへ渡さずに処理できることです。
ただし、ローカルツールにも信頼モデルがあります。
| 信頼するもの | 注意点 |
|---|---|
| ツール本体 | 公式サイトや配布元を確認する |
| 実行する端末 | 職場端末、共有PC、管理端末ではログが残る場合がある |
| 保存場所 | クラウド同期フォルダだと履歴が残る |
| 処理結果 | 削除できたか再確認する必要がある |
| 作業記録 | スクリーンショットやメモ自体が痕跡になる |
外部サービスを避けても、自分の端末環境が安全とは限りません。
匿名性では、道具をどこで、どのファイルに、どの保存場所で使うかまで考えます。
使う前に考えること
ツールを使う前に、何を守りたいのかを決めます。
| 確認 | 理由 |
|---|---|
| ファイル形式は何か | PDF、画像、Office、音声で見る項目が違う |
| 何を消したいのか | 作成者、GPS、日時、注釈などを分ける |
| 原本を残すか | 公開用コピーと混ぜないため |
| どの端末で作業するか | 職場端末やクラウド同期を避けるため |
| 削除後に何で確認するか | 処理結果を確認するため |
いきなり削除ツールを実行すると、何が消えたのか分からなくなります。
まず確認し、次に処理し、最後に再確認します。
ツールで消せないもの
qpdfやMAT2を使っても、消えないものがあります。
| 残るもの | 例 |
|---|---|
| 本文の内容 | 固有名詞、時系列、内部用語 |
| 画像の見た目 | 背景、反射、看板、顔 |
| 音声や動画の内容 | 声、環境音、アナウンス |
| ファイル名 | 本名、部署名、案件名 |
| 送信経路 | アップロード時刻、IP、アカウント |
メタデータ削除ツールは、ファイル内部の一部の情報を減らすための道具です。
文書の内容や公開方法まで判断してくれるわけではありません。
処理後の再確認
qpdfやMAT2を使った後は、必ず再確認します。
再確認では、同じツールだけでなく、別の観点も使います。
| 確認 | 理由 |
|---|---|
| ExifToolで見る | メタデータが残っていないか確認する |
| ファイルを開いて見る | 表示崩れや残った文字を見る |
| 検索・コピーを試す | 黒塗りの下の文字が残っていないか見る |
| ファイル名を見る | 名前や案件名が残っていないか見る |
| 別環境で開く | 自分の環境だけで見えていないか確認する |
削除できたと思った瞬間が、一番見落としやすいタイミングです。
処理後の再確認までを、ひとつの作業として扱います。
ツールを増やしすぎない
匿名性が不安になると、たくさんのツールを次々に使いたくなります。
しかし、ツールを増やすほど、作業ミスやファイルの混在も増えます。
まずは、元ファイル、公開用コピー、処理後ファイルを分けることが重要です。
そのうえで、qpdf、MAT2、ExifToolのように役割の違うツールを必要な範囲で使います。
「どのツールを使ったか」より、「どのファイルを確認し、何が残っていなかったか」を説明できる状態にします。
高リスクな文書での注意
内部告発、取材資料、活動記録、個人情報を含む文書では、ツールの使い方だけでなく作業環境も重要です。
職場端末で処理すれば、端末ログやファイルアクセス履歴が残る可能性があります。
個人クラウド同期フォルダで作業すれば、同期履歴やアカウント情報が関係します。
確認結果をスクリーンショットで残すと、そのスクリーンショットにもファイルパスやユーザー名が写ることがあります。
ツールを使う前に、作業環境、保存場所、公開先、相談先を分けて考えます。
まとめ
qpdfはPDFの構造確認や変換に使われるツールです。
MAT2は複数形式のメタデータ削除を扱うツールです。
どちらも匿名性の確認に役立ちますが、単体で安全を保証するものではありません。
ツールを使う前に、何を消したいのかを決めます。
処理後は、ExifToolなど別の方法でも再確認し、さらに本文、背景、ファイル名、送信経路を確認します。
匿名性では、ツールを使うことより、確認、処理、再確認、公開判断の流れを守ることが重要です。
関連ツール
ExifTool
ExifToolは、画像、動画、PDF、Office文書など幅広い形式のメタデータを確認・編集できる代表的なローカルツールです。
紹介する理由: 匿名性が必要なファイルをオンライン変換サイトへアップロードせず、手元の環境でメタデータを確認しやすいため紹介します。
URL : https://exiftool.org/
MAT2
MAT2は、画像、PDF、Office文書など複数形式のメタデータ削除を目的としたローカルツールです。
紹介する理由: ファイル公開前に、ブラウザ上の簡易チェックだけでは見えにくいメタデータをローカル環境で減らす候補になるため紹介します。
qpdf
qpdfは、PDFの構造確認、変換、再構成に使われるPDF処理ツールです。
紹介する理由: PDFは見た目だけでは内部構造やメタデータが分かりにくいため、公開前にローカルで確認する候補として紹介します。