Learn

284 статейКатегория: Все
Сеть

Что видно при доступе к Web-сайту

При доступе к Web-сайту мысль «если я не ввел имя, я анонимен» неточна.

Стороне Web-сайта могут передаваться разные сведения помимо имени. IP-адрес источника доступа, время доступа, URL, User-Agent, , состояние входа, Referer, особенности браузера и устройства.

По отдельности эти сведения не всегда прямо показывают имя человека. Но при сочетании нескольких сведений действия могут связываться как действия одного пользователя или использоваться для предположения среды.

Для анонимности важно не то, ввели ли вы настоящее имя, а какие сведения видны другой стороне и какие из них связываются.

Информация, которая может быть видна стороне Web-сайта

Для отображения сайта браузер отправляет серверу запрос. Сервер обрабатывает запрос и возвращает HTML, CSS, изображения, JavaScript, ответы API и другое.

В этот момент стороне сайта передается информация, нужная для связи и обработки. Здесь «сторона сайта» может включать не только сервер оператора сайта, но и CDN, reverse proxy, аналитику, рекламную доставку, систему аутентификации и другое.

ИнформацияЧто показываетСвязь с анонимностью
IP-адрес источника доступаСведения о сети подключенияМатериал для предположения линии, региона, организации, изменения источника
Время доступаКогда был доступОсь для поведения и сопоставления с другими журналами
URLКакая страница или API открытыМожет показать просмотр, поисковые условия, объект операции
User-AgentСтрока о браузере, OS, типе устройстваМатериал для предположения среды
CookieДанные, сохраненные в браузере и отправляемые при подходящих условияхИспользуются для повторного посещения тем же браузером, входа, настроек
Состояние входаАккаунт связан с сессиейДоступ может связываться с аккаунтом
RefererИнформация о странице, откуда пришел пользовательИногда показывает источник перехода и предыдущий контекст
Особенности браузера и устройстваРазмер экрана, язык, часовой пояс, функции и т.п.В сочетании с другим может стать признаком идентификации

Не все сайты записывают это одинаково. Видимая информация меняется из-за настроек браузера, проектирования сайта, политики безопасности, настроек Cookie и наличия JavaScript.

Но при размышлении об анонимности это нужно понимать как информацию, которая может быть видна.

IP-адрес источника доступа

При доступе к Web-сайту IP-адрес источника обычно виден назначению. IP-адрес нужен, чтобы связь работала в интернете.

IP-адрес не всегда раскрывает имя человека или точный адрес. Но по нему иногда можно предположить оператора связи, регион подключения, корпоративную, школьную или государственную сеть.

В домашних и мобильных линиях несколько человек могут делить один глобальный IP. Поэтому по одному IP-адресу не всегда можно уверенно определить одного пользователя.

С другой стороны, IP-адрес становится сильным материалом для идентификации и сопоставления, если сочетать его со временем доступа, Cookie, состоянием входа, User-Agent и другим. IP-адрес важен для анонимности, но смотреть только на него недостаточно.

Время доступа

Сторона сайта может записывать время доступа в журнал. Само время не показывает имя, но приобретает значение при сочетании с другими записями.

Например, запись доступа к конкретной странице в конкретное время, запись входа, платежная запись, обращение в поддержку, Cookie и IP-адрес могут вместе показывать связь действий.

Для анонимности важно не только, к чему был доступ, но и когда он был. Время часто становится осью сопоставления нескольких журналов.

URL

Стороне сайта видно, к какому URL был доступ. Особенно путь URL и query-параметры могут содержать информацию, связанную с просмотром или операцией.

Например, есть такой URL:

https[:]//example.com/search?q=privacy

В этом случае сторона сайта может понять, что был доступ к /search и что есть поисковое условие q=privacy.

Здесь example.com — домен для объяснений. Это не рекомендация конкретного реального сайта, а строка для объяснения структуры URL.

URL может содержать поисковые слова, ID статьи, ID товара, ID пользователя, ID кампании, параметры отслеживания и другое. Поэтому URL может быть не просто адресом страницы, а частью информации о содержании доступа.

Однако фрагмент после # обычно не отправляется серверу в обычном HTTP-запросе. Например, #section1 в https[:]//example.com/page#section1 в основном используется на стороне браузера.

Так важно разделять, какая часть URL доходит до сервера.

User-Agent

User-Agent — один из заголовков запроса, который браузер отправляет серверу. Он может содержать имя браузера, OS, тип устройства, движок отображения, версию и другое.

Сайт использует User-Agent, чтобы переключать показ для ПК и смартфона или учитывать старые браузеры.

Один User-Agent не обязательно позволяет определить человека. Но вместе с IP-адресом, Cookie, временем доступа, языком, размером экрана и состоянием входа он становится материалом для различения среды.

В последние годы есть движение к уменьшению объема сведений User-Agent ради приватности. Но это не означает, что User-Agent и похожие сведения браузера стали не связаны с анонимностью.

Cookie

Cookie — данные, которые Web-сайт сохраняет в браузере и которые повторно отправляются при подходящих запросах. Они используются для сохранения входа, корзины, настроек отображения, аналитики, управления сессией и другого.

Если есть Cookie, сайт может считать, что это, возможно, тот же браузер, что и раньше. Поэтому даже без ввода имени повторное посещение может рассматриваться как посещение тем же браузером.

Для анонимности особенно важно, что даже при смене IP-адреса оставшийся Cookie может связать доступ как доступ того же пользователя.

Например, если после доступа к сайту вы снова открыли его из другой сети, но отправился тот же Cookie, сайт может считать это повторным посещением того же браузера.

Cookie — не «имя». Но они могут использоваться для постоянной идентификации, поэтому очень важны для анонимности.

Состояние входа

Состояние входа — очень сильный идентифицирующий фактор для анонимности.

Если вы вошли на сайт, просмотры и операции могут связываться с аккаунтом. Даже без настоящего имени они могут связываться с ID аккаунта, email, номером телефона, платежной информацией, прошлой историей использования.

Состояние входа часто поддерживается через Cookie и сведения сессии. То есть Cookie и вход — разные понятия, но в реальном Web они тесно связаны.

При размышлении об анонимности недостаточно думать «я не ввел настоящее имя, значит все нормально». Если выполнен вход, действия могут обрабатываться на уровне аккаунта.

Referer

Referer — информация о странице, которую пользователь просматривал перед переходом. В HTTP она может отправляться как заголовок Referer.

Например, при переходе на другой сайт из результатов поиска, SNS, форума или статьи сайт назначения иногда может узнать источник.

Если Referer виден, сайт может предположить, откуда пришел пользователь. Иногда могут быть видны поисковое слово, имя страницы, кампания или предыдущий контекст просмотра.

Но Referer не всегда отправляется полностью. Он может не отправляться или отправляться частично в зависимости от спецификации браузера, Referrer-Policy, HTTPS, атрибутов ссылки и настроек сайта.

Поэтому Referer нужно понимать не как «всегда видимую информацию», а как информацию, которая может быть видна при определенных условиях.

Особенности браузера и устройства

Сайт может использовать особенности браузера и устройства, чтобы правильно отображать страницу. Могут участвовать размер экрана, язык, часовой пояс, доступные шрифты, API, способ ввода, производительность устройства и другое.

Если JavaScript включен, объем информации, доступной на стороне браузера, может увеличиваться. Эта информация используется для оптимизации отображения, анализа ошибок, защиты от злоупотреблений, аналитики и другого.

Важно, что даже если каждая отдельная информация кажется маленькой, вместе они могут сильно характеризовать среду.

Подробности браузерного fingerprint здесь не рассматриваются. Но как вход в понимание анонимности нужно знать, что особенности браузера и устройства тоже могут быть материалом для идентификации.

Даже при HTTPS запрос доходит до сайта

HTTPS шифрует связь между браузером и сервером назначения. Он помогает защищать содержимое от чтения и подмены третьими лицами на маршруте.

Но HTTPS не является механизмом, который делает так, что стороне Web-сайта ничего не видно.

Чтобы показать сайт, сервер должен принять запрос, обработать его и вернуть ответ. Поэтому даже при HTTPS сервер назначения обрабатывает содержимое запроса, Cookie, состояние входа, время доступа и другое.

Иными словами, HTTPS важен для защиты по пути. Но он не делает пользователя анонимным по отношению к сайту назначения.

Понимание «HTTPS значит анонимно» ошибочно. HTTPS важен как технология безопасности, но анонимность нужно рассматривать отдельно.

Информация в журналах сервера

Web-сервер может записывать журналы доступа. Содержание журнала зависит от серверного ПО и настроек, но обычно может включать источник доступа, время, запрос, статус-код, объем передачи и другое.

В зависимости от настроек могут записываться User-Agent и Referer.

Что может входить в журналСмыслВнимание
Источник доступаIP-адрес источника или сведения проксиПри CDN или reverse proxy видимость может меняться
ВремяДата и время обработки запросаЧасто становится осью сопоставления с другими журналами
Строка запросаHTTP-метод, путь, версия HTTP и т.п.Может включать путь URL и query
Статус-код200, 404, 500 и т.п.Используется для анализа успеха и ошибок
User-AgentСведения браузера и OSМатериал для предположения среды
RefererОткуда пришел пользовательМожет не отправляться или отправляться частично из-за политики

Журналы используются для эксплуатации сайта, расследования сбоев, мониторинга безопасности, противодействия злоупотреблениям, аналитики. С точки зрения анонимности важно понимать, в какой форме может записываться факт доступа к сайту.

Важна не одиночная информация, а сочетания

При размышлении об анонимности легко ошибиться, если смотреть только на один вид сведений.

Даже если скрыть IP-адрес, Cookie может позволить считать доступ тем же браузером. Если выполнен вход, доступ может связываться с аккаунтом. User-Agent и особенности браузера в сочетании с другим могут различать среду. Referer и URL могут показывать контекст и содержание доступа.

Сочетание сведенийКак выглядитВлияние на анонимность
IP-адрес + время доступаКогда и из какой сети был доступМожет сопоставляться с другими записями
Cookie + IP-адресДаже при смене IP может считаться тем же браузеромОдной смены сети может быть недостаточно
Состояние входа + URL просмотраЧто смотрел аккаунтДействия могут связываться с аккаунтом
User-Agent + особенности устройстваВидна характеристика средыВместе с другим становится материалом различения
Referer + URL назначенияОткуда пришел и что смотрелМожет показать контекст просмотра и интересы

В анонимности нужно думать не «эта информация одна безопасна», а как сведения связываются между собой.

Итоги

При доступе к Web-сайту даже без ввода имени стороне сайта могут быть видны разные сведения.

IP-адрес источника доступа, время доступа, URL, User-Agent, Cookie, состояние входа, Referer, особенности браузера и устройства важны для анонимности.

По отдельности они не всегда прямо показывают человека. Но вместе могут обрабатываться как действия одного пользователя или связываться с аккаунтом и браузером.

Особенно важно не думать, что достаточно скрыть только IP-адрес. Cookie, состояние входа, User-Agent, Referer, особенности браузера и устройства тоже могут быть материалом для идентификации и сопоставления.

Чтобы понимать анонимность, сначала нужно знать, что доходит до другой стороны при доступе к сайту. Затем важно смотреть не на одиночные сведения, а на то, как несколько сведений соединяются.

Связанные инструменты

Public IP Check

WhatIsMyIP

Внешний ресурс, связанный с этой статьей. Открывайте его только если он подходит вашей ситуации и модели угроз.

Почему указано здесь: Он может помочь с темой статьи, но находится вне Anonymity Sense, поэтому перед использованием его нужно проверить.

URL : https://www.whatismyip.com/

Открыть внешний сайт
WebRTC Leak Test

BrowserLeaks WebRTC

Внешний ресурс, связанный с этой статьей. Открывайте его только если он подходит вашей ситуации и модели угроз.

Почему указано здесь: Он может помочь с темой статьи, но находится вне Anonymity Sense, поэтому перед использованием его нужно проверить.

URL : https://browserleaks.com/webrtc

Открыть внешний сайт
Browser Fingerprint Check

BrowserLeaks Fingerprint

Внешний ресурс, связанный с этой статьей. Открывайте его только если он подходит вашей ситуации и модели угроз.

Почему указано здесь: Он может помочь с темой статьи, но находится вне Anonymity Sense, поэтому перед использованием его нужно проверить.

URL : https://browserleaks.com/canvas

Открыть внешний сайт
Browser Fingerprint Check

EFF Cover Your Tracks

Внешний ресурс, связанный с этой статьей. Открывайте его только если он подходит вашей ситуации и модели угроз.

Почему указано здесь: Он может помочь с темой статьи, но находится вне Anonymity Sense, поэтому перед использованием его нужно проверить.

URL : https://coveryourtracks.eff.org/

Открыть внешний сайт
Anonymous communication

Tor Project

Внешний ресурс, связанный с этой статьей. Открывайте его только если он подходит вашей ситуации и модели угроз.

Почему указано здесь: Он может помочь с темой статьи, но находится вне Anonymity Sense, поэтому перед использованием его нужно проверить.

URL : https://www.torproject.org/

Открыть внешний сайт

Связанные статьи