Learn

URLトラッキング

未知のトラッキングパラメータ

匿名性の判断で見落としやすい手がかりを、実践前後の確認に使える形で整理します。

URLには、意味が分かりやすいパラメータだけが付くわけではありません。

utm_sourcegclid のように追跡目的が推測しやすいものもありますが、idtokencidsourcerefsession のように、見ただけでは判断しにくい値もあります。

未知のパラメータを見たときに、「知らないから消してよい」と考えるのも、「知らないからそのままでよい」と考えるのも危険です。

匿名性で大事なのは、その値がページ表示に必要なのか、利用者や経路を識別するためのものなのかを分けることです。

この記事では、未知のURLパラメータをどう読み、どう判断するかを整理します。

未知のパラメータとは

未知のパラメータとは、名前だけでは用途を判断しにくいURL内の値です。

たとえば、次のような文字列です。

sample.test/page?id=123&cid=abc&token=xyz

ここでの sample.test は説明用の文字列です。

id=123 は記事IDかもしれません。商品IDかもしれません。利用者ごとのIDかもしれません。

cid=abc はキャンペーンIDかもしれません。顧客IDかもしれません。

token=xyz は一時的なアクセス権やセッションに近い値かもしれません。

名前だけでは決められません。

だから、未知のパラメータは「意味を推測し、動作を確認し、必要なら共有しない」対象として扱います。

分類して考える

未知のパラメータは、いくつかの種類に分けて見ると判断しやすくなります。

種類扱い
表示に必要な値id、page、q、category削ると内容が変わる場合がある
追跡らしい値cid、campaign、source、ref共有に不要な場合がある
個別識別らしい値uid、user、visitor、client利用者や端末に近い手がかりになる
認証・一時リンクらしい値token、session、sid、key公開共有しない判断を優先する
意味不明な長い値ランダムな英数字個別発行の可能性があるため慎重に扱う

この分類は、完全な判定ではありません。

しかし、何も考えずに貼るより安全です。

とくに tokensessionsidkey のような値は慎重に扱います。共有用URLではなく、ログイン状態や一時アクセスに関係するURLである可能性があります。

消してよいかを確認する

未知のパラメータは、実際に削って確認します。

ただし、普段のログイン済みブラウザだけで確認すると判断を間違えます。

順番確認すること理由
1パラメータ名を見る追跡、表示、認証のどれに近いか推測する
21つずつ削るどの値がページ表示に必要か分ける
3別ブラウザで開くやログイン状態の影響を減らす
4ログアウト状態で開く他人にも見えるURLか確認する
5不明な長い値が残る場合は共有しない個別リンクの可能性を避ける

まとめて全部削ると、どの値が必要だったのか分からなくなります。

1つずつ削ると、表示に必要な値と不要な値を分けやすくなります。

未知の値が危険になる場面

未知のパラメータが問題になるのは、値そのものが読める個人情報である場合だけではありません。

ランダムに見える英数字でも、サービス内部では特定の利用者、配信、招待、クリック、セッションと結びついている場合があります。

場面何が起きるか
メールの個別リンク誰に送ったメールかを示す値が付くことがある
招待リンク招待者や招待先が記録されることがある
限定公開リンクURLを知っている人だけが見られる状態になる
購入・申込後ページ注文や申込に近い情報がURLに残ることがある
管理画面やプレビュー本来公開用ではない画面を共有することがある

こうしたURLを匿名アカウントで共有すると、ネットワークを隠していても、URL側で相関が生まれます。

は、URLの中に含まれる識別子を消してくれません。

共有してはいけないサイン

未知のパラメータの中には、削る以前に共有を避けるべきものがあります。

次のような場合は、無理に整形して共有するより、公開用ページや公式の共有ボタンから別URLを探すべきです。

サイン理由
token、session、sid が含まれる一時的な状態や認証に近い可能性がある
URLが極端に長い個別の状態や追跡情報が多く含まれる可能性がある
ログイン中だけ開ける他人には見えない個人用ページの可能性がある
管理、編集、プレビューを示す語がある公開用URLではない可能性がある
削ると内容が大きく変わる値がページ内容に強く関係している

匿名性では、分からないものを安全扱いしないことが重要です。

「よく分からないが、たぶん大丈夫」は危険な判断です。

よくある誤解

未知のパラメータについて、よくある誤解があります。

まず、「英数字のランダムな値なら意味がない」という誤解です。

実際には、ランダムに見える値ほど、内部では個別の識別子として使われている場合があります。

次に、「自分の名前が入っていなければ問題ない」という誤解です。

匿名性で問題になるのは名前だけではありません。個別に発行されたリンク、メール配信ID、招待ID、セッションIDは、サービス側のログと結びつきます。

最後に、「URLを短くすれば安全」という誤解です。

は見た目を短くするだけです。展開先に未知のパラメータが残っていれば、問題は消えていません。

実践的な判断

未知のパラメータを見たときは、次のように判断します。

  • 表示に必要そうな値か確認する
  • 追跡・紹介・キャンペーンらしい値は削除候補にする
  • token、session、sid、key などは共有しない判断を優先する
  • 削った後に別ブラウザで開き直す
  • 不明な値が残る場合は、公式の共有URLを探す

この判断は面倒に見えます。

しかし、匿名で共有するURLは、投稿本文の一部です。

本文を読み直すなら、URLも読み直す必要があります。

まとめ

未知のとは、名前だけでは用途を判断しにくいURL内の値です。

idcidreftokensession のような値は、ページ表示、追跡、個別識別、認証のどれに関係するかを確認する必要があります。

未知の値は、消してよいとも、そのままでよいとも即断しません。

1つずつ削り、別ブラウザやログアウト状態で確認し、共有に不要な値を減らします。

特に、token、session、sid、key のような値がある場合は、共有しない判断を優先します。

URLの中に残る小さな値は、サービス側のログやアクセス時刻と結びつくことがあります。

匿名性では、分からない値を放置しないことが大切です。

関連記事