Learn

メタデータ

隠しテキストとXMLコメント

匿名性の判断で見落としやすい手がかりを、実践前後の確認に使える形で整理します。

公開するファイルでは、画面に見えている情報だけを確認しても不十分です。

SVGやHTML、XML系のファイルには、表示されないテキストやコメントが残ることがあります。

見た目には空白でも、ファイルの中には作業メモ、削除前の文章、名前、会社名、内部URL、案件名が残っていることがあります。

匿名性では、見える情報だけでなく、読もうと思えば読める情報も確認する必要があります。

この記事では、隠しテキストとXMLコメントがどのようにリスクになるのか、公開前に何を確認すべきかを整理します。

隠しテキストとは

隠しテキストとは、画面上では見えない、または気づきにくい形でファイル内に残る文字情報です。

透明にした文字、画面外へ移動した文字、非表示レイヤー、極端に小さい文字、CSSで隠した要素などがあります。

種類見た目中身
透明な文字見えない文字列として残る
画面外の文字表示範囲外座標付きで残る
非表示要素表示されないタグとして残る
小さすぎる文字読みにくい拡大や検索で見つかる
削除前の下書き見えない場合があるコメントや別要素として残る

隠しテキストは、悪意がなくても残ります。

作業中に置いたメモ、消したつもりの名前、古いタイトル、テンプレート内の会社名が、公開ファイルに残ることがあります。

XMLコメントとは

XMLコメントは、ファイル内に書けるメモです。

通常、ブラウザ表示では見えません。しかし、ファイルを開けば読めます。

<!-- comment --> のような形で書かれ、SVG、HTML、XMLなどで使われます。

コメントに残るもの匿名性での注意点
作業メモあとで〇〇社名を消す組織名が残る
担当者名checked by Tanaka個人名が出る
内部URLstaging.example開発環境が見える
案件名project-alpha関係者に分かる
削除予定の文元の説明文消したつもりの情報が残る

コメントは、開発や制作では便利です。

しかし、公開ファイルに残ると、表示されない情報が第三者に読まれます。

なぜ匿名性に関係するのか

隠しテキストやコメントは、本人や所属を直接示すことがあります。

さらに、単独では弱い情報でも、他の情報と組み合わさります。ファイル名、投稿者、公開時刻、画像の内容、URL、過去投稿と重なると、候補は絞られます。

残った情報結びつくもの起きること
会社名投稿内容、職種所属が推測される
作成者名アカウント、過去ファイル実名に近づく
内部URL組織やプロジェクト関係者が絞られる
下書き文元の体験談消した情報が復活する
日付投稿時刻、出来事時系列で照合される

見えない情報は、投稿者本人が見落としやすい情報です。

だからこそ、公開前チェックの対象に入れます。

確認する方法

確認の基本は、ファイルをテキストとして開くことです。

SVGやHTML、XMLは、テキストエディタで開けます。名前、会社名、学校名、メールアドレス、URL、コメント記号、古いタイトル、内部語を検索します。

確認方法見るもの注意点
テキストエディタで開くコメント、タグ、文字列表示だけで判断しない
ファイル内検索名前、組織名、URL複数の表記で検索する
ブラウザでソースを見るHTMLやSVGの構造レンダリング結果と違う
拡大して見る小さい文字、画面端見た目の漏れも確認する

検索する文字列は、自分の名前だけでは足りません。

会社名、部署名、学校名、プロジェクト名、旧ハンドル名、メール、地名、内部用語も確認します。

ツールで消しても手動確認する

最適化ツールや削除ツールを使うと、不要なコメントやを減らせる場合があります。

しかし、ツール任せにはできません。

ツールは設定によって動作が変わります。残すべき要素と消すべき要素の判断を、匿名性の観点で完全に代わりに行うわけではありません。

ツールで減らせるもの人間が見るもの理由
コメント画像内の文字見た目の情報は残る
不要属性固有名詞意味までは判断しない
メタデータ文脈関係者にだけ分かる情報がある
空要素ファイル名外側の情報は別に残る

匿名性が必要な公開では、ツール後にもう一度ファイルを開いて確認します。

コメントを消しても文脈は残る

XMLコメントを消しても、文脈上の手がかりが残ることがあります。

id名、class名、ファイル名、フォルダ名、URL、画像内の文字、本文の体験談は、コメントとは別の場所にあります。

消したもの残るもの確認すること
XMLコメントidやclass内部語が残っていないか
作業メモファイル名案件名や日付が残っていないか
下書き文表示文字画像内に見えていないか
内部URL参照先URL外部リンクや環境名を確認する

コメント削除は重要ですが、それだけで終わらせません。

匿名性では、どの情報がどこに移って残っているかを確認します。

共同作業ファイルでは特に注意する

複数人で作ったSVGやHTMLでは、コメントや隠しテキストが残りやすくなります。

担当者名、レビューコメント、修正依頼、社内用語、クライアント名が、作業の途中で入ることがあるからです。

共同作業で残る情報注意点
担当者名reviewed by A個人名が残る
修正メモここは〇〇社向け取引先や組織が見える
内部略語first-team-only内部者に分かる
古い案旧タイトル、旧ロゴ削除したつもりの情報が残る

共同作業のファイルを公開する場合は、自分が書いた部分だけでなく、ファイル全体を確認します。

「自分は入れていない」ではなく、「公開ファイルに残っているか」を見ることが大切です。

公開対象がzipやフォルダなら、その中に含まれるすべてのファイルを確認します。

ひとつのSVGだけきれいでも、同梱された古いHTMLやREADMEにコメントが残っていれば、そこから情報が漏れます。

まとめ

隠しテキストとXMLコメントは、画面上には見えなくてもファイル内に残る情報です。

SVG、HTML、XML系のファイルでは、作業メモ、名前、会社名、内部URL、下書き、プロジェクト名が残ることがあります。

公開前には、見た目だけでなく、テキストとして中身を確認します。

ツールで最適化しても、それだけで安全とは判断しないでください。

匿名性では、表示される情報と、ファイル内に残って読める情報の両方を確認することが重要です。

関連ツール

Metadata inspection

ExifTool

ExifToolは、画像、動画、PDF、Office文書など幅広い形式のメタデータを確認・編集できる代表的なローカルツールです。

紹介する理由: 匿名性が必要なファイルをオンライン変換サイトへアップロードせず、手元の環境でメタデータを確認しやすいため紹介します。

URL : https://exiftool.org/

外部サイトを開く
Metadata removal

MAT2

MAT2は、画像、PDF、Office文書など複数形式のメタデータ削除を目的としたローカルツールです。

紹介する理由: ファイル公開前に、ブラウザ上の簡易チェックだけでは見えにくいメタデータをローカル環境で減らす候補になるため紹介します。

URL : https://0xacab.org/jvoisin/mat2

外部サイトを開く

関連記事