Learn

メタデータ

qpdf / MAT2 ガイド

匿名性の判断で見落としやすい手がかりを、実践前後の確認に使える形で整理します。

PDFや文書ファイルのを確認・削除するとき、qpdfやMAT2のようなローカルツールが候補になります。

ただし、ツール名だけを覚えても匿名性は守れません。

重要なのは、どのツールが何を扱い、何を扱わないのかを理解することです。

この記事では、qpdfとMAT2の役割、匿名性の文脈での使いどころ、使うときの限界を整理します。

qpdfとは

qpdfは、PDFファイルの構造確認や変換に使われるツールです。

PDFの内部構造を扱うため、PDFの検査や再生成の流れで登場します。

公式ドキュメントでは、機能や使い方を確認できます。

URL : https://qpdf.readthedocs.io/

匿名性の文脈では、qpdfはPDFを自動的に安全にする道具ではありません。

PDFの構造を扱うための道具です。

作成者、注釈、埋め込み、非表示テキストなどを確認する作業と組み合わせて使います。

MAT2とは

MAT2は、Metadata Anonymisation Toolkitとして開発されているメタデータ削除ツールです。

画像、文書、音声など、複数形式のメタデータ削除をまとめて扱う用途で使われます。

公式リポジトリでは、対応形式や使い方を確認できます。

URL : https://0xacab.org/jvoisin/mat2

MAT2は、複数の形式をまとめて扱える点が便利です。

ただし、MAT2を通したからといって、ファイルの内容や見た目の手がかりが消えるわけではありません。

qpdfとMAT2の違い

qpdfとMAT2は、同じ目的の道具ではありません。

項目qpdfMAT2
主な対象PDF複数形式のメタデータ削除
得意なことPDF構造の処理や変換メタデータ削除の自動化
匿名性での役割PDF内部を扱う確認・再生成の補助公開用ファイルのメタデータ削除補助
注意点PDF内容の判断は別に必要削除後の再確認が必要

どちらも、ツール単体で匿名性を保証するものではありません。

匿名性では、削除前の確認、処理、削除後の再確認、見た目の確認をセットで行います。

どちらを使うべきか

qpdfとMAT2は、目的から選びます。

目的候補理由
PDFの構造を確認したいqpdfPDF内部の扱いに向いている
PDFを再生成したいqpdf変換や線形化などPDF処理を扱える
複数形式のメタデータを削除したいMAT2画像や文書などをまとめて扱える
削除後に何が残るか確認したいExifToolなども併用別の視点で確認するため
高リスク文書を扱う複数手段で確認ひとつのツールを過信しないため

初心者が最初に考えるべきなのは、ツール名ではありません。

そのファイルが何の形式で、どの情報を消したいのかです。

PDFの構造を見たいならqpdf、複数形式のメタデータ削除をしたいならMAT2というように、目的から選びます。

ツール紹介で重要な信頼モデル

ローカルツールを使う利点は、ファイルを外部Webサービスへ渡さずに処理できることです。

ただし、ローカルツールにも信頼モデルがあります。

信頼するもの注意点
ツール本体公式サイトや配布元を確認する
実行する端末職場端末、共有PC、管理端末ではログが残る場合がある
保存場所クラウド同期フォルダだと履歴が残る
処理結果削除できたか再確認する必要がある
作業記録スクリーンショットやメモ自体が痕跡になる

外部サービスを避けても、自分の端末環境が安全とは限りません。

匿名性では、道具をどこで、どのファイルに、どの保存場所で使うかまで考えます。

使う前に考えること

ツールを使う前に、何を守りたいのかを決めます。

確認理由
ファイル形式は何かPDF、画像、Office、音声で見る項目が違う
何を消したいのか作成者、GPS、日時、注釈などを分ける
原本を残すか公開用コピーと混ぜないため
どの端末で作業するか職場端末やクラウド同期を避けるため
削除後に何で確認するか処理結果を確認するため

いきなり削除ツールを実行すると、何が消えたのか分からなくなります。

まず確認し、次に処理し、最後に再確認します。

ツールで消せないもの

qpdfやMAT2を使っても、消えないものがあります。

残るもの
本文の内容固有名詞、時系列、内部用語
画像の見た目背景、反射、看板、顔
音声や動画の内容声、環境音、アナウンス
ファイル名本名、部署名、案件名
送信経路アップロード時刻、IP、アカウント

メタデータ削除ツールは、ファイル内部の一部の情報を減らすための道具です。

文書の内容や公開方法まで判断してくれるわけではありません。

処理後の再確認

qpdfやMAT2を使った後は、必ず再確認します。

再確認では、同じツールだけでなく、別の観点も使います。

確認理由
ExifToolで見るメタデータが残っていないか確認する
ファイルを開いて見る表示崩れや残った文字を見る
検索・コピーを試す黒塗りの下の文字が残っていないか見る
ファイル名を見る名前や案件名が残っていないか見る
別環境で開く自分の環境だけで見えていないか確認する

削除できたと思った瞬間が、一番見落としやすいタイミングです。

処理後の再確認までを、ひとつの作業として扱います。

ツールを増やしすぎない

匿名性が不安になると、たくさんのツールを次々に使いたくなります。

しかし、ツールを増やすほど、作業ミスやファイルの混在も増えます。

まずは、元ファイル、公開用コピー、処理後ファイルを分けることが重要です。

そのうえで、qpdf、MAT2、ExifToolのように役割の違うツールを必要な範囲で使います。

「どのツールを使ったか」より、「どのファイルを確認し、何が残っていなかったか」を説明できる状態にします。

高リスクな文書での注意

内部告発、取材資料、活動記録、個人情報を含む文書では、ツールの使い方だけでなく作業環境も重要です。

職場端末で処理すれば、端末ログやファイルアクセス履歴が残る可能性があります。

個人クラウド同期フォルダで作業すれば、同期履歴やアカウント情報が関係します。

確認結果をスクリーンショットで残すと、そのスクリーンショットにもファイルパスやユーザー名が写ることがあります。

ツールを使う前に、作業環境、保存場所、公開先、相談先を分けて考えます。

まとめ

qpdfはPDFの構造確認や変換に使われるツールです。

MAT2は複数形式のメタデータ削除を扱うツールです。

どちらも匿名性の確認に役立ちますが、単体で安全を保証するものではありません。

ツールを使う前に、何を消したいのかを決めます。

処理後は、ExifToolなど別の方法でも再確認し、さらに本文、背景、ファイル名、送信経路を確認します。

匿名性では、ツールを使うことより、確認、処理、再確認、公開判断の流れを守ることが重要です。

関連ツール

Metadata inspection

ExifTool

ExifToolは、画像、動画、PDF、Office文書など幅広い形式のメタデータを確認・編集できる代表的なローカルツールです。

紹介する理由: 匿名性が必要なファイルをオンライン変換サイトへアップロードせず、手元の環境でメタデータを確認しやすいため紹介します。

URL : https://exiftool.org/

外部サイトを開く
Metadata removal

MAT2

MAT2は、画像、PDF、Office文書など複数形式のメタデータ削除を目的としたローカルツールです。

紹介する理由: ファイル公開前に、ブラウザ上の簡易チェックだけでは見えにくいメタデータをローカル環境で減らす候補になるため紹介します。

URL : https://0xacab.org/jvoisin/mat2

外部サイトを開く
PDF inspection

qpdf

qpdfは、PDFの構造確認、変換、再構成に使われるPDF処理ツールです。

紹介する理由: PDFは見た目だけでは内部構造やメタデータが分かりにくいため、公開前にローカルで確認する候補として紹介します。

URL : https://qpdf.readthedocs.io/

外部サイトを開く

関連記事