Learn

284 artículosCategoría: Todo
Red

Qué son los logs de comunicación

La comunicación en internet no necesariamente desaparece por completo en el momento.

Pueden quedar registros sobre la comunicación en sitios web, servidores, DNS, ISP, routers, firewalls y sistemas similares.

Estos registros de comunicación se llaman generalmente "logs de comunicación".

Los logs de comunicación pueden incluir no solo el contenido de una comunicación, sino también información circundante como hora de comunicación, dirección IP de origen, destino, URL accedida, información del navegador, cookies y consultas DNS.

Al pensar en anonimato, no basta con preguntar solo si el contenido está cifrado.

La razón es que, incluso cuando el contenido no puede leerse, los metadatos asociados con la comunicación pueden convertirse en una pista para seguimiento.

Dónde quedan logs de comunicación

Los logs de comunicación son registros sobre comunicación.

Por ejemplo, cuando accedes a un sitio web, el servidor web puede registrar "cuándo", "desde qué dirección IP", "a qué URL" y "con qué tipo de información de navegador" ocurrió el acceso.

Sin embargo, los logs de comunicación no quedan de la misma forma en todos los entornos. Qué información se registra cambia según ajustes del servidor, diseño de la aplicación, servicios en la nube usados, configuración de red y política de retención de logs.

El punto importante es que la comunicación en internet tiene varios puntos de observación. Pueden quedar distintos tipos de logs en distintos lugares, como el sitio web, DNS, ISP, routers, redes internas e infraestructura en la nube.

Dónde pueden quedar logsInformación que puede registrarseFinalidad principal
Servidor webHora de acceso, dirección IP, URL, User-Agent, referrer e información similarAnálisis de acceso, respuesta a incidentes, detección de ataques
AplicaciónHistorial de inicio de sesión, historial de operaciones, detalles de errores, ID de cuenta e información similarPrevención de abuso, operación del servicio
Resolver DNSNombre de dominio consultado, hora de consulta, información del solicitante e información similarResolución de nombres, gestión de red
ISP u operador de redHora de conexión, dirección IP asignada, volumen de tráfico, parte de la información de destino e información similarOperación de red, gestión de conexión
Router y firewallDestino, volumen de tráfico, comunicación bloqueada, información de dispositivos internos e información similarGestión de red, medidas de seguridad

Por qué quedan logs

Los logs no existen solo para vigilar a las personas usuarias. En muchos casos, los logs se registran para operar servicios y redes de forma estable.

Cuando ocurre un error en un sitio web, las personas administradoras revisan logs para investigar en qué URL, a qué hora y qué tipo de error ocurrió.

Los logs también se vuelven evidencia importante para investigar cuando ocurren eventos sospechosos, como inicio de sesión no autorizado, acceso masivo, escaneos de vulnerabilidades, infección por malware o sospecha de filtración de información.

FinalidadCómo se usan los logsEjemplo
Respuesta a incidentesInvestigar causas de errores o caídasComprobar si aumentan errores 500 en una URL específica
Medidas de seguridadDetectar accesos sospechososComprobar si hubo muchos intentos de inicio de sesión en poco tiempo
Prevención de abusoInvestigar pistas de violaciones de términos o ataquesComprobar solicitudes anómalas u orígenes de acceso no naturales
Mejora del servicioEntender el usoComprobar páginas vistas con frecuencia y franjas de alto acceso

Los logs son un mecanismo básico para proteger servicios. Al mismo tiempo, como pueden contener información sobre el comportamiento de personas usuarias, también pueden convertirse en un riesgo de privacidad según cómo se gestionen.

Logs que quedan en sitios web

Cuando accedes a un sitio web, pueden quedar logs de acceso en el servidor web.

Los logs de acceso típicos incluyen dirección IP de origen, hora de acceso, método HTTP, URL, código de estado, User-Agent, referrer e información similar.

Un ejemplo de URL es el siguiente.

Ejemplo de URL : https[:]//example.com/article/network-log

Aquí, example.com es un dominio de ejemplo usado a menudo para explicaciones.

En el sitio web, incluso cuando la comunicación usa HTTPS, el sitio recibe la ruta y consulta de la URL accedida, cookies e información de solicitud enviada. HTTPS es un mecanismo que dificulta leer el contenido en la ruta de comunicación; no impide que el propio sitio web de destino reciba información de solicitud.

Sin embargo, la información recibida por el servidor web y la información realmente almacenada como logs no son lo mismo. s, cuerpos de solicitud y datos similares pueden registrarse o no según la configuración del servidor y de la aplicación.

InformaciónContenidoPrecaución
Hora de accesoCuándo ocurrió el accesoPuede convertirse en una pista comparada con otros logs por tiempo
Dirección IP de origenQué dirección IP se conectóA través de una CDN o proxy, el origen directo puede ser un servidor intermediario
URLQué página o API se accedióLas cadenas de consulta pueden incluir identificadores
User-AgentNavegador, sistema operativo, tipo de aplicación e información similarPuede convertirse en material para inferir el entorno de uso
CookieInformación identificativa que el sitio guarda en el navegador y recibe de élPuede usarse para identificar visitas repetidas del mismo navegador o estado de inicio de sesión
ReferrerDesde qué página se movió la persona usuariaPuede no enviarse, o enviarse solo una parte, por Referrer-Policy y mecanismos similares
Código de estadoResultado de la solicitudEl resultado del procesamiento se ve por códigos como 200, 301, 403, 404, 500

Cuando un sitio web usa CDN, balanceador de carga o proxy inverso, la dirección IP de origen visible para el servidor web puede ser la dirección IP del servidor intermediario en lugar de la persona usuaria real. En este caso, la dirección IP original del cliente puede registrarse en encabezados como X-Forwarded-For o en logs del lado de la CDN.

Logs que quedan en aplicaciones y sistemas de autenticación

Los logs del lado del servidor no se limitan a logs de acceso del servidor web.

También pueden quedar registros sobre operaciones de personas usuarias y comportamiento del sistema en funciones de inicio de sesión, funciones de pago, pantallas de administración, API, bases de datos, herramientas de monitoreo de errores y sistemas similares.

Por ejemplo, un servicio con función de inicio de sesión puede registrar información como la siguiente.

  • Inicio de sesión exitoso
  • Inicio de sesión fallido
  • Cambio de contraseña
  • Intento de autenticación de dos factores
  • Emisión de sesión
  • Cambio de configuración de cuenta
  • Acceso a una pantalla de administración

Los servicios que proporcionan API pueden registrar qué endpoint de API recibió una solicitud, desde qué cuenta o dirección IP y a qué hora.

Estos logs se usan para detectar inicio de sesión no autorizado, toma de cuentas, abuso de permisos, uso anómalo de API y problemas similares.

Registros que pueden quedar en ISP y operadores de red

Al conectarse a internet, la comunicación de la persona usuaria suele pasar por la red de un ISP o proveedor de acceso.

Del lado del proveedor pueden quedar registros sobre conexiones, como cuándo estuvo conectada una línea contratada, qué dirección IP se asignó y cuánto tráfico ocurrió.

En líneas domésticas y móviles, la dirección IP asignada a una persona usuaria puede no ser fija y puede cambiar con el tiempo. Por eso, la información sobre "qué línea contratada usaba esta dirección IP en este momento" se relaciona con registros del lado del proveedor.

Además, en líneas móviles y algunas otras líneas puede usarse un sistema donde muchas personas usuarias comparten una dirección IP global. En este caso, no solo la dirección IP sino también información como hora y número de puerto puede relacionarse con identificar la conexión.

Sin embargo, que existan registros del proveedor y que cualquiera pueda ver libremente esa información son asuntos separados. Los logs de ISP y operadores de red normalmente no son algo que las personas usuarias ordinarias puedan inspeccionar libremente.

Registros relacionados con DNS

Al acceder a un sitio web, el navegador o sistema operativo necesita convertir el nombre de dominio en una dirección IP. Este mecanismo se llama DNS.

Por ejemplo, al acceder a la siguiente URL, el dispositivo busca la dirección IP correspondiente a example.com.

Ejemplo de URL : https[:]//example.com

Los registros de consultas DNS pueden conservar qué terminal o red hizo una consulta para qué nombre de dominio.

Los logs DNS no registran el texto del cuerpo de una página web en sí. Sin embargo, pueden mostrar información sobre "a qué dominio alguien intentó acceder".

Una precaución es que dónde se registran las consultas DNS cambia según el entorno. Si usas el DNS de tu ISP, la consulta puede llegar al resolver DNS del proveedor. En cambio, si el navegador o sistema operativo usa otro resolver DNS o DNS cifrado, cambia el destino de la consulta.

En otras palabras, al pensar en logs DNS, hay que mirar "a qué resolver DNS se consultó".

Logs de routers y firewalls

Los logs de comunicación no quedan solo en sitios web e ISP.

También pueden quedar registros sobre comunicación en routers domésticos, equipos de red de empresas o escuelas, firewalls en la nube, servidores proxy, gateways y sistemas similares.

En redes de organizaciones, pueden conservarse registros que muestran qué dispositivo se conectó a qué servidor externo y cuándo. Se usan para investigar infección por malware, acceso no autorizado, filtración de información, abuso interno y asuntos similares.

Del lado del servidor también pueden existir múltiples logs, como logs de autenticación del sistema operativo, logs de firewall, logs SSH, logs de aplicación y logs de auditoría en la nube.

Por ejemplo, los siguientes tipos de logs son importantes en la administración de servidores.

Tipo de logContenido que puede registrarseCómo se usa
Log de autenticaciónInicio de sesión exitoso, inicio de sesión fallido, dirección IP de origen e información similarComprobar inicio de sesión no autorizado y ataques de fuerza bruta
Log de firewallComunicación permitida y bloqueada, número de puerto, destino e información similarDetectar comunicación sospechosa y ataques
Log de proxyAcceso de dispositivos internos a sitios externosGestión e investigación de comunicación interna
Log de auditoría en la nubeOperación administrativa, ejecución de API, cambio de permisos e información similarRastrear cambios de configuración y abuso de permisos
Log de aplicaciónErrores, historial de operaciones, resultados de procesamiento e información similarRespuesta a incidentes e investigación de abuso

De este modo, los logs de comunicación no son solo "registros de acceso a un sitio web"; existen a través de redes y sistemas en conjunto.

Relación entre HTTPS y logs

HTTPS es un mecanismo importante para cifrar contenido en tránsito y confirmar que la contraparte de comunicación es la parte prevista.

Sin embargo, usar HTTPS no significa que nadie pueda conocer ninguna información de comunicación.

El objetivo principal protegido por HTTPS es contenido que, de otro modo, podría ser visible para terceros en la ruta de comunicación. Por ejemplo, entrada de formularios, cuerpo de página, muchos encabezados HTTP, rutas y consultas de URL y contenido similar normalmente se vuelven más difíciles de leer en la ruta de comunicación.

En cambio, el servidor web de destino descifra la comunicación y procesa la solicitud. Por lo tanto, el sitio web recibe la URL accedida, cookies, User-Agent, información de inicio de sesión, contenido de formularios enviados e información similar.

Además, incluso en la ruta de comunicación, pueden observarse hora de conexión, dirección IP de origen, dirección IP de destino, volumen de tráfico y parte de la información sobre la conexión TLS.

En otras palabras, HTTPS es muy importante, pero no es un mecanismo que borre todos los problemas de logs.

ObservadorInformación que puede ser visibleInformación más difícil de ver
Lado del sitio webURL, cookies, User-Agent, contenido enviado, operaciones de inicio de sesión e información similarContenido que no quieres mostrar a terceros en la ruta de comunicación
Tercero en la ruta de comunicaciónIP de origen, IP de destino, hora de comunicación, volumen de tráfico e información similarCuerpo de página, contenido de formularios, ruta y consulta de URL e información similar
Resolver DNSNombre de dominio consultado, hora de consulta e información similarCuerpo de página web y detalles de operaciones concretas
Router y firewallDestino, volumen de tráfico, resultado de permitir/bloquear e información similarTexto del cuerpo dentro de HTTPS y muchos encabezados HTTP

Los logs no son necesariamente malos

Los logs de comunicación son información que requiere atención desde la perspectiva del anonimato y la privacidad. Sin embargo, los logs en sí no son malos.

Sin logs, se vuelve difícil investigar causas de caídas de servidores, detectar acceso no autorizado, responder a toma de cuentas, investigar infección por malware y operar servicios de forma estable.

Lo que importa es por qué se almacenan los logs, qué alcance se registra, durante cuánto tiempo se almacenan y quién puede acceder a ellos.

La existencia de logs y que cualquiera pueda verlos libremente son asuntos separados. Los logs gestionados correctamente son información importante para proteger servicios, pero logs almacenados en exceso o mal gestionados se convierten en riesgos de privacidad.

Los logs se convierten en pistas para el anonimato

Al pensar en anonimato, es insuficiente mirar solo si el contenido está cifrado.

Aunque el contenido no pueda leerse, información como hora de comunicación, dirección IP de origen, destino, consultas DNS, cookies, User-Agent y referrer puede registrarse de otras formas.

Estas piezas de información pueden no identificar directamente a una persona por sí solas. Sin embargo, cuando se combinan varios registros, pueden convertirse en material para inferir si los registros parecen venir de la misma persona usuaria, la ruta de acceso, la línea temporal de comportamiento, la red de origen e información similar.

InformaciónQué puede sabersePrecaución para el anonimato
Hora de accesoCuándo ocurrió la comunicaciónPuede compararse con otros registros por tiempo
Dirección IPQué red se conectóPuede servir para inferir línea, región, organización y contexto similar
Consulta DNSA qué dominio alguien intentó accederSe vuelve una pista del destino aunque no se conozca el cuerpo de la página
CookieSi el acceso vino del mismo navegadorPuede usarse para identificar visitas repetidas o estado de inicio de sesión
User-AgentTipo de navegador o sistema operativoPuede tratarse como característica del entorno de uso
ReferrerDesde qué página vino la persona usuariaPuede conocerse parte de la ruta de movimiento
Consulta de URLPuede incluir términos de búsqueda, identificadores, información de sesión y datos similaresSi queda en logs del lado del servidor, se vuelve una pista del contenido de comportamiento

Para el anonimato, "el contenido no se lee" y "no quedan rastros de comunicación" no son lo mismo.

Aunque el contenido esté cifrado, puede permanecer información circundante sobre la comunicación. Por eso, pensar en anonimato requiere ordenar no solo el cifrado, sino también dónde y qué tipos de logs pueden quedar.

Resumen

Los logs de comunicación son registros sobre comunicación.

Pueden quedar varios tipos de información sobre comunicación en sitios web, aplicaciones, DNS, ISP, routers, firewalls, infraestructura en la nube y sistemas similares.

La información representativa incluye hora de acceso, dirección IP de origen, URL, User-Agent, cookie, referrer, consulta DNS, destino, volumen de tráfico, historial de autenticación e historial de operaciones.

Los logs se usan para respuesta a incidentes, medidas de seguridad, investigación de abuso, mejora del servicio y fines similares. Por eso, los logs en sí son un mecanismo importante para operar servicios de internet de forma segura.

Al mismo tiempo, desde la perspectiva del anonimato, los logs pueden convertirse en pistas de seguimiento. Esto se debe a que incluso cuando el contenido está cifrado, origen, destino, hora, consultas DNS, cookies, User-Agent e información similar pueden registrarse de otras formas.

Entender los conceptos básicos de logs de comunicación facilita ordenar qué puede registrarse en internet. Y al pensar en anonimato, permite considerar no solo si el contenido es visible, sino también dónde puede quedar información circundante sobre la comunicación.

Artículos relacionados