Informações que um site pode ver
O que fica visível ao acessar um site
Ao acessar um site, pensar que "se eu não digitar meu nome, estou anônimo" não é preciso.
Além do nome, várias informações podem chegar ao lado do site. Endereço IP de origem, horário de acesso, URL acessada, User-Agent, , estado de login, referenciador e características do navegador ou dispositivo são exemplos.
Isoladamente, essas informações podem não indicar diretamente um nome pessoal. No entanto, quando várias informações se combinam, elas podem ser vinculadas como ações do mesmo usuário ou usadas para inferir o ambiente de uso.
Ao pensar em anonimato, o ponto importante não é "se o nome real foi digitado", mas "quais informações ficam visíveis para a outra parte e quais informações se conectam".
Informações que podem ficar visíveis ao lado do site
Para exibir um site, o navegador envia uma requisição ao servidor. O servidor processa essa requisição e devolve HTML, CSS, imagens, JavaScript, respostas de API e dados semelhantes.
Nesse momento, chegam ao lado do site informações necessárias à comunicação e ao processamento. Aqui, "lado do site" pode envolver não só o servidor do operador do site, mas também CDN, proxy reverso, análise de acesso, distribuição de anúncios, infraestrutura de autenticação e outros elementos.
| Informação | O que indica | Relação com anonimato |
|---|---|---|
| Endereço IP de origem | Informação que indica a rede de conexão | na-se material para inferir linha, região, organização, mudança de origem de conexão etc. |
| Horário de acesso | Quando o acesso ocorreu | Torna-se material para padrões de comportamento e comparação com outros logs |
| URL | Qual página ou API foi acessada | Conteúdo visto, condições de busca e alvo de operação podem ficar visíveis |
| User-Agent | String que indica navegador, OS, tipo de dispositivo etc. | Torna-se material para inferir o ambiente de uso |
| Cookie | Dados salvos no navegador e enviados quando as condições correspondem | Usado para revisitas do mesmo navegador, estado de login e manutenção de configurações |
| Estado de login | Estado em que conta e sessão estão vinculadas | O conteúdo acessado pode ser associado à conta |
| Referenciador | Informação que indica de qual página veio | A origem de entrada ou o caminho de navegação imediatamente anterior pode ficar visível |
| Características do navegador ou dispositivo | Tamanho de tela, idioma, fuso horário, recursos compatíveis etc. | Combinadas com outras informações, podem virar pista de identificação |
Nem todos os sites registram essas informações da mesma forma. Além disso, as informações visíveis mudam conforme configurações do navegador, desenho do site, políticas de segurança, configurações de Cookie e presença ou ausência de JavaScript.
Ainda assim, ao pensar em anonimato, é necessário entendê-las como "informações que podem ficar visíveis".
Endereço IP de origem
Ao acessar um site, normalmente o endereço IP de origem fica visível para o destino da conexão. O endereço IP é uma informação necessária para estabelecer comunicação na Internet.
Um endereço IP nem sempre revela um nome pessoal ou um endereço exato. No entanto, pode permitir inferir a operadora usada, uma região de origem aproximada ou a possibilidade de ser uma rede de empresa, escola ou órgão público.
Além disso, em conexões domésticas ou de smartphone, várias pessoas podem compartilhar o mesmo endereço IP global. Por isso, só o endereço IP nem sempre permite concluir que se trata de um único usuário.
Por outro lado, quando combinado com horário de acesso, Cookie, estado de login, User-Agent e outros dados, o endereço IP se torna um material forte para identificação e comparação. Em anonimato, o endereço IP é importante, mas olhar apenas para o endereço IP não basta.
Horário de acesso
O lado do site pode registrar em logs o horário em que o acesso ocorreu. O horário de acesso, sozinho, não indica um nome pessoal, mas ganha significado quando combinado com outros registros.
Por exemplo, quando se combinam um registro de acesso a uma página específica em certo horário, registros de login, registros de pagamento, registros de contato, Cookie, endereço IP e outros dados, pode ser possível inferir ligações de comportamento.
Em anonimato, não importa apenas "a que se acessou"; "quando se acessou" também é importante. Isso porque informações de tempo tendem a se tornar eixo de comparação entre vários logs.
URL
O lado do site vê qual URL foi acessada. Em especial, o caminho da URL e os parâmetros de query podem conter informações relacionadas ao conteúdo visualizado ou à operação realizada.
Por exemplo, suponha a seguinte URL.
https[:]//example.com/search?q=privacy
Nesse caso, o lado do site pode saber que houve acesso a /search e que existe a condição de busca q=privacy.
Aqui, example.com é um nome de domínio muito usado para explicação. Ele não é a apresentação de um site específico real; é tratado como uma string para explicar a estrutura de URLs.
Uma URL pode conter termos de busca, IDs de artigo, IDs de produto, IDs de usuário, IDs de campanha, parâmetros de rastreamento e informações semelhantes. Por isso, uma URL pode se tornar não apenas o endereço de uma página, mas também informação que representa parte do conteúdo do acesso.
No entanto, o fragmento depois de # na URL normalmente não é enviado ao servidor em uma requisição HTTP comum. Por exemplo, em https[:]//example.com/page#section1, #section1 é uma parte usada principalmente no lado do navegador.
Assim, também é importante separar qual parte da URL chega ao servidor.
User-Agent
User-Agent é um tipo de cabeçalho de requisição enviado pelo navegador ao servidor. Ele pode conter nome do navegador, OS, tipo de dispositivo, mecanismo de renderização, informações de versão e outros dados.
Sites podem usar User-Agent para alternar entre exibição para PC e para smartphone, ou para decidir compatibilidade com navegadores antigos.
User-Agent sozinho nem sempre identifica uma pessoa. No entanto, quando combinado com endereço IP, Cookie, horário de acesso, configuração de idioma, tamanho de tela, estado de login e outros elementos, ele se torna material para distinguir o ambiente de uso.
Nos últimos anos, há movimentos para reduzir a quantidade de informação do User-Agent em favor da proteção de privacidade. Ainda assim, User-Agent e informações de navegador semelhantes não deixam de ter relação com anonimato.
Cookie
Cookie é um dado que o site salva no navegador e que é reenviado em requisições que atendem às condições. Ele é usado para manter estado de login, carrinho de compras, configurações de exibição, análise de acesso, gestão de sessão e outros fins.
Quando há Cookie, o lado do site pode julgar que "talvez seja o mesmo navegador que acessou antes". Por isso, mesmo sem digitar o nome, o acesso pode ser tratado como uma revisita do mesmo navegador.
Em anonimato, um ponto especialmente importante é que, mesmo mudando o endereço IP, se o Cookie permanecer, pode haver ligação como o mesmo usuário.
Por exemplo, depois de acessar um site, mesmo que você acesse novamente por outra rede, se o mesmo Cookie for enviado, o lado do site pode julgar que é uma revisita do mesmo navegador.
Cookie não é "nome". Mas, como pode ser usado para identificação contínua, é uma informação muito importante em anonimato.
Estado de login
Estado de login é um fator de identificação muito forte em anonimato.
Se você está logado em um site, o conteúdo acessado e as operações realizadas podem ser associados à conta. Mesmo sem digitar o nome real, essas ações podem se ligar a ID de conta, endereço de email, número de telefone, informações de pagamento, histórico de uso passado e outros dados.
Além disso, o estado de login muitas vezes é mantido por Cookie ou informações de sessão. Ou seja, Cookie e estado de login são conceitos diferentes, mas no uso real da Web estão intimamente relacionados.
Ao pensar em anonimato, "não digitei meu nome real, então está tudo bem" é insuficiente. A partir do momento em que há login, as ações podem ser tratadas no nível da conta.
Referenciador
Referenciador é a informação que indica a página que estava sendo vista antes de ir para outra página. Em HTTP, pode ser enviado como cabeçalho Referer.
Por exemplo, quando alguém vai de resultados de busca, rede social, fórum ou página de artigo para outro site, o site de destino pode conhecer o referenciador.
Quando o referenciador fica visível, o lado do site pode inferir "de onde veio o usuário". Em alguns casos, palavras de busca, nome de página, informações de campanha ou o contexto de navegação imediatamente anterior também podem ficar visíveis.
No entanto, o referenciador nem sempre é enviado por completo. Dependendo da especificação do navegador, Referrer-Policy, tratamento de HTTPS, atributos do link e configurações do site, ele pode não ser enviado ou apenas parte dele pode ser enviada.
Por isso, é mais preciso entender o referenciador não como "informação sempre visível", mas como "informação que pode ficar visível dependendo das condições".
Características do navegador ou dispositivo
Sites podem usar características do navegador ou dispositivo para exibir a página corretamente. Tamanho de tela, configuração de idioma, fuso horário, fontes compatíveis, APIs compatíveis, método de entrada, desempenho do dispositivo e outros elementos podem estar envolvidos.
Quando JavaScript está ativo, a quantidade de informação que pode ser obtida no lado do navegador pode aumentar. Essas informações podem ser usadas para otimização de exibição, análise de erros, combate a abuso, análise de acesso e outros fins.
O ponto importante aqui é que, mesmo que cada informação pareça pequena, quando combinadas elas podem destacar bastante as características do ambiente de uso.
Não entraremos profundamente nos detalhes de browser fingerprinting. No entanto, como entrada para pensar em anonimato, é preciso entender que "características do navegador e do dispositivo também podem se tornar material de identificação".
Mesmo com HTTPS, a requisição chega ao lado do site
HTTPS é um mecanismo que criptografa a comunicação entre o navegador e o servidor de destino. Ele tem o papel de dificultar espionagem e adulteração por terceiros no caminho da comunicação.
Mas HTTPS não é um mecanismo que faz "nada ficar visível ao lado do site".
Para exibir um site, o servidor precisa receber a requisição, processar seu conteúdo e devolver uma resposta. Por isso, mesmo com HTTPS, o lado do servidor de destino trata conteúdo da requisição, Cookie, estado de login, horário de acesso e informações semelhantes.
Ou seja, HTTPS tem forte significado para proteção durante o transporte. Por outro lado, não é um mecanismo para se tornar anônimo perante o site acessado.
A ideia de que "HTTPS significa anonimato" está errada. HTTPS é importante como tecnologia de segurança, mas precisa ser pensado separadamente de anonimato.
Informações registradas em logs de servidor
Um servidor Web pode registrar logs de acesso. O conteúdo dos logs varia conforme o software do servidor e a configuração, mas, em geral, origem do acesso, horário, requisição, status code, bytes transferidos e informações semelhantes podem ser registrados.
Dependendo das configurações, User-Agent e referenciador também são registrados.
| Informação que pode constar nos logs | Significado | Ponto de atenção |
|---|---|---|
| Origem do acesso | Endereço IP de origem e informações de proxy | A visibilidade pode mudar com configuração de CDN ou proxy reverso |
| Horário | Data e hora em que a requisição foi processada | Tende a se tornar eixo de comparação com outros logs |
| Linha de requisição | Método HTTP, caminho, versão HTTP e valores semelhantes | Caminho e query da URL podem estar incluídos |
| Status code | Resultado da resposta, como 200, 404 ou 500 | Usado para sucesso/falha de acesso e análise de erros |
| User-Agent | Informações como navegador e OS | Torna-se material para inferir o ambiente de uso |
| Referenciador | De qual página o usuário veio | Pode não ser enviado, ou apenas parte pode ser enviada, dependendo da política |
Logs são usados para operação do site, investigação de falhas, monitoramento de segurança, prevenção de abuso, análise de acesso e fins semelhantes. Do ponto de vista do anonimato, é importante entender "em que forma o fato de ter acessado um site pode ser registrado".
Combinações importam mais que informações isoladas
Ao pensar em anonimato, focar em apenas uma informação facilita um julgamento errado.
Mesmo que você esconda apenas o endereço IP, se um Cookie permanecer, pode ser tratado como o mesmo navegador. Se você estiver logado, o conteúdo acessado pode ser associado à conta. User-Agent e características do navegador se tornam material para identificar o ambiente de uso quando combinados com outras informações. Referenciador e URL podem indicar em que contexto e o que foi acessado.
| Combinação de informações | Como aparece | Impacto no anonimato |
|---|---|---|
| Endereço IP + horário de acesso | Quando e de qual rede o usuário veio | Pode ser comparado com outros registros |
| Cookie + endereço IP | Mesmo que o endereço IP mude, pode ser julgado como o mesmo navegador | Apenas mudar de rede pode não separar a atividade |
| Estado de login + URL de navegação | O que a conta visualizou | A atividade pode ser associada à conta |
| User-Agent + características do dispositivo | Características do ambiente de uso ficam visíveis | Torna-se material de distinção junto com outras informações |
| Referenciador + URL de destino | De onde o usuário veio e o que visualizou | Contexto de navegação e interesses podem ser inferidos |
Em anonimato, em vez de julgar uma informação isoladamente dizendo "isso sozinho está tudo bem", é preciso pensar em como as informações se conectam.
Resumo
Ao acessar um site, várias informações podem ficar visíveis ao lado do site mesmo que você não tenha digitado seu nome.
Endereço IP de origem, horário de acesso, URL, User-Agent, Cookies, estado de login, referenciador e características do navegador ou dispositivo são importantes ao pensar em anonimato.
Cada uma dessas informações pode não indicar diretamente um indivíduo por si só. No entanto, quando se combinam, podem ser tratadas como ações do mesmo usuário ou vinculadas a uma conta ou navegador.
O ponto especialmente importante é não pensar "só preciso esconder o endereço IP". Cookies, estado de login, User-Agent, referenciador, características do navegador e do dispositivo e informações semelhantes também podem se tornar material de identificação e comparação.
Para entender anonimato, primeiro é preciso saber o que chega à outra parte quando se acessa um site. Depois, é importante olhar não para informações isoladas, mas para como várias informações se combinam.
Ferramentas relacionadas
WhatIsMyIP
Recurso externo relacionado a este artigo. Abra apenas se fizer sentido para sua situação e seu modelo de ameaça.
Por que aparece aqui: Pode ajudar com o tema do artigo, mas fica fora do Anonymity Sense e deve ser avaliado antes do uso.
BrowserLeaks WebRTC
Recurso externo relacionado a este artigo. Abra apenas se fizer sentido para sua situação e seu modelo de ameaça.
Por que aparece aqui: Pode ajudar com o tema do artigo, mas fica fora do Anonymity Sense e deve ser avaliado antes do uso.
BrowserLeaks Fingerprint
Recurso externo relacionado a este artigo. Abra apenas se fizer sentido para sua situação e seu modelo de ameaça.
Por que aparece aqui: Pode ajudar com o tema do artigo, mas fica fora do Anonymity Sense e deve ser avaliado antes do uso.
EFF Cover Your Tracks
Recurso externo relacionado a este artigo. Abra apenas se fizer sentido para sua situação e seu modelo de ameaça.
Por que aparece aqui: Pode ajudar com o tema do artigo, mas fica fora do Anonymity Sense e deve ser avaliado antes do uso.
Tor Project
Recurso externo relacionado a este artigo. Abra apenas se fizer sentido para sua situação e seu modelo de ameaça.
Por que aparece aqui: Pode ajudar com o tema do artigo, mas fica fora do Anonymity Sense e deve ser avaliado antes do uso.