Qué es una CDN
Cuando abres un sitio web, los datos no siempre llegan solo desde el servidor de quien opera el sitio.
Imágenes, CSS, JavaScript, videos, fuentes, archivos de descarga y recursos similares pueden entregarse mediante un mecanismo llamado CDN.
CDN significa Content Delivery Network.
En términos simples, es un mecanismo que coloca datos de un sitio web en varios lugares y los entrega desde una ubicación cercana a la persona usuaria o desde un lugar menos congestionado.
Entender las CDN muestra que, incluso cuando decimos "acceder a un sitio web", en la práctica intervienen varios elementos, como el servidor de quien opera el sitio, la CDN, DNS, la terminación TLS, logs y caché.
Esto también es importante al pensar en el anonimato.
La razón es que una CDN puede recibir comunicación como parte del lado del sitio web y manejar la dirección IP de origen, la solicitud, cookies, User-Agent, hora de acceso e información similar.
Este artículo ordena los conceptos básicos de CDN, qué se acelera, dónde quedan logs y qué mirar para el anonimato.
Qué es una CDN
Una CDN es una red para entregar contenido web de forma eficiente.
El servidor que es la fuente de un sitio web se denomina a veces servidor de origen. En una configuración que usa CDN, el navegador puede recibir datos a través de servidores de la CDN en vez de acceder directamente al servidor de origen cada vez.
| Elemento | Rol | Explicación |
|---|---|---|
| Navegador de la persona usuaria | Envía solicitudes | Solicita páginas, imágenes, CSS, JavaScript y recursos similares |
| CDN | Intermedia la entrega | Devuelve datos desde una ubicación cercana a la persona usuaria |
| Servidor de origen | Conserva los datos originales | El servidor original del lado de quien opera el sitio web |
| Caché | Almacenamiento temporal | Guarda datos usados con frecuencia del lado de la CDN |
| DNS | Decide el destino de conexión | Puede dirigir el navegador hacia servidores del lado de la CDN |
Una CDN no es simplemente un "dispositivo que hace todo más rápido".
En la web moderna puede cumplir varios roles, como entrega, balanceo de carga, protección DDoS, terminación TLS, WAF, optimización de imágenes, protección contra bots y análisis de logs.
Por qué se usa una CDN
Las razones principales para usar CDN son velocidad, estabilidad, balanceo de carga y mitigación de ataques.
Si una persona usuaria está en Japón y el servidor de origen está en un país lejano, obtener los datos desde ese servidor lejano cada vez resulta lento. Las CDN colocan datos en varios puntos del mundo y los devuelven desde un punto cercano a la persona usuaria.
| Finalidad | Qué ocurre con una CDN | Efecto visible para las personas usuarias |
|---|---|---|
| Mejora de velocidad | Devuelve desde un punto cercano | Las páginas se muestran más rápido |
| Balanceo de carga | Procesa mediante muchos puntos | Resiste mejor accesos concentrados |
| Caché | Guarda las mismas imágenes y archivos | Reduce la carga del origen |
| Protección DDoS | Recibe tráfico de ataque del lado de la CDN | Es menos probable que el sitio caiga |
| Terminación TLS | Procesa conexiones HTTPS del lado de la CDN | La gestión de certificados y la entrega se vuelven más eficientes |
Las CDN se usan habitualmente en sitios grandes, sitios de noticias, sitios de video, comercio electrónico, SaaS y API de aplicaciones.
Desde la perspectiva de la persona usuaria, simplemente está accediendo a un sitio web con normalidad.
Pero detrás de escena puede estar respondiendo una ubicación de la CDN en lugar del servidor de origen.
CDN y caché
Uno de los mecanismos centrales de una CDN es la caché.
Una caché es un mecanismo que almacena temporalmente datos ya obtenidos y devuelve los datos almacenados a partir de la siguiente vez.
Por ejemplo, la misma imagen de logo, CSS, JavaScript, fuentes, imágenes públicas y recursos similares se devuelven con el mismo contenido a muchas personas usuarias. Este tipo de datos es fácil de almacenar del lado de la CDN.
| Datos | Facilidad de cacheo | Precaución |
|---|---|---|
| Imágenes | Alta | Las imágenes antiguas pueden permanecer un tiempo |
| CSS | Alta | Puede haber demora hasta que aparezcan las actualizaciones |
| JavaScript | Alta | La gestión de versiones se vuelve importante |
| Video | Alta | El efecto de la CDN es grande porque el volumen de entrega es alto |
| Páginas después de iniciar sesión | Baja | El contenido personalizado requiere manejo cuidadoso |
| Respuestas de API | Depende del diseño | Cuidado si contienen información de autenticación o información personal |
Desde la perspectiva del anonimato y la privacidad, la caché es cómoda, pero también tiene precauciones.
Imágenes o páginas antiguas pueden permanecer del lado de la CDN. Aunque se borren del lado del sitio, pueden seguir visibles hasta que se actualice la caché de la CDN.
Además, si el sitio está diseñado de forma incorrecta, existe el peligro de almacenar datos personalizados en la CDN cuando no deberían cachearse.
CDN y DNS
En sitios web que usan una CDN, los resultados DNS pueden apuntar al lado de la CDN.
Cuando una persona usuaria accede a un dominio, DNS puede devolver información que envía el navegador a un servidor edge de la CDN en vez de al servidor de origen.
Un servidor edge es un servidor del lado de la CDN que recibe solicitudes en una ubicación cercana a la persona usuaria.
| Etapa | Qué ocurre |
|---|---|
| 1 | La persona usuaria accede a un nombre de dominio |
| 2 | DNS devuelve el destino de conexión del lado de la CDN |
| 3 | El navegador se conecta al servidor edge de la CDN |
| 4 | La CDN comprueba la caché |
| 5 | Si hay acierto de caché, la CDN lo devuelve |
| 6 | Si no lo hay, la CDN va a buscarlo al servidor de origen |
Por eso, incluso para el mismo nombre de dominio, pueden devolverse direcciones IP distintas según la región o la red.
Esto no es anormal.
Con CDN y balanceo de carga, el destino de conexión cambia según la ubicación de la persona usuaria, la congestión y las condiciones de fallo.
CDN y terminación TLS
La comunicación HTTPS usa TLS.
En una configuración que usa CDN, el destino de la conexión HTTPS visto desde el navegador puede ser la CDN.
En ese punto, la comunicación cifrada con TLS se descifra una vez en la CDN, y la CDN procesa la solicitud. Después, la CDN la reenvía al servidor de origen mediante una comunicación separada.
| Tramo | Comunicación | Precaución |
|---|---|---|
| Navegador a CDN | Protegida por HTTPS | El destino de conexión visto por la persona usuaria está del lado de la CDN |
| Dentro de la CDN | Gestionada por el proveedor de CDN | El lado de la CDN procesa la solicitud |
| CDN a origen | HTTPS según la configuración | Importa la configuración de quien opera el sitio |
| Servidor de origen | Procesa los datos originales | Puede aparecer como una conexión desde la CDN |
Esto no significa que HTTPS no tenga sentido.
HTTPS protege la comunicación entre el navegador y el destino de conexión. Sin embargo, cuando la CDN es el punto de terminación TLS, la CDN está en una posición en la que procesa la comunicación.
Para el anonimato, la CDN también debe considerarse un "punto de observación incluido en el lado del sitio web".
Qué puede ver una CDN
Una CDN puede colocarse delante de un sitio web.
En ese caso, la CDN recibe solicitudes de las personas usuarias. En otras palabras, puede manejar direcciones IP de origen, horas de acceso, User-Agent, destinos solicitados, cookies, encabezados HTTP e información similar.
| Información | Puede ser manejada por la CDN | Significado para el anonimato |
|---|---|---|
| Dirección IP de origen | Sí | Se vuelve una pista de la red de origen |
| Hora de acceso | Sí | Se vuelve un eje para comparar con otros logs |
| Ruta de URL | Sí | Muestra qué página o API se solicitó |
| User-Agent | Sí | Se vuelve una pista del navegador o sistema operativo |
| s | Depende del diseño | Se relacionan con estado de sesión e identificadores |
| Volumen de tráfico | Sí | Muestra tendencias como transferencia de archivos o visualización de video |
Esto no significa que un proveedor de CDN siempre almacene todo durante mucho tiempo.
El alcance de retención de logs, el periodo de retención, los privilegios de acceso y los fines de uso varían según el proveedor de CDN y la configuración de quien opera el sitio.
El punto importante es que una CDN no es solo un paso invisible en la ruta de comunicación.
Una CDN es una entidad que recibe comunicación como infraestructura del lado del sitio web.
Cambia la IP visible para el servidor web
Cuando se usa una CDN, la dirección IP de origen visible para el servidor de origen puede cambiar.
Desde la perspectiva del servidor de origen, el origen directo de la conexión no es la persona usuaria sino la dirección IP de la CDN. Por eso, el lado del sitio puede manejar la IP original del cliente mediante encabezados como X-Forwarded-For o CF-Connecting-IP, o mediante logs del lado de la CDN.
| Lugar desde el que se mira | IP visible | Explicación |
|---|---|---|
| CDN | IP de origen de la persona usuaria | Recibe la solicitud directamente de la persona usuaria |
| Servidor de origen | IP de la CDN | El origen directo de la conexión es la CDN |
| Aplicación | Depende de la configuración | Puede manejar la IP original mediante encabezados |
| Logs de acceso | Depende del diseño | Pueden quedar tanto del lado de la CDN como del origen |
Al mirar logs, hay que comprobar "de qué ubicación son los logs".
Los logs del lado de la CDN, los logs del balanceador de carga, los logs del servidor de origen y los logs de aplicación muestran información distinta.
Una CDN no es tecnología de anonimización
Una CDN es un mecanismo para hacer que la entrega de sitios web sea más rápida, más estable y más fácil de defender.
No es un mecanismo para volver anónimas a las personas usuarias.
Desde la perspectiva de la persona usuaria, una CDN puede hacer que la dirección IP de destino de conexión sea la CDN y no el servidor de origen. Sin embargo, esto no garantiza el anonimato de la persona usuaria.
Una CDN es infraestructura del lado del sitio web.
Si se combinan el sitio de destino, la CDN, la aplicación, analíticas de acceso, etiquetas publicitarias e infraestructura de autenticación, el acceso de la persona usuaria se procesa en varios lugares.
| Malentendido | Realidad |
|---|---|
| Pasar por una CDN te vuelve anónimo | Una CDN es infraestructura de entrega del lado del sitio, no tecnología de anonimización |
| Es seguro porque la IP del origen no es visible | La información de la persona usuaria es manejada por la CDN y por el lado del sitio |
| Con HTTPS, ni siquiera la CDN puede verlo | Si la terminación TLS está en la CDN, la CDN procesa la solicitud |
| Si está cacheado, no hay logs | Pueden quedar logs de acceso del lado de la CDN |
Al pensar en anonimato, trata la CDN como "parte del lado de destino".
Leer información oficial sobre CDN
Al aprender sobre CDN, también son útiles las explicaciones oficiales de proveedores de CDN.
Cloudflare es un proveedor representativo que ofrece CDN, protección DDoS, WAF, DNS y servicios similares. Sus páginas oficiales de aprendizaje permiten comprobar qué tipo de mecanismo es una CDN.
URL : https://www.cloudflare.com/learning/cdn/what-is-a-cdn/
Sin embargo, esto no significa que usar un proveedor de CDN específico vuelva algo seguro.
Una CDN es infraestructura del lado de quien opera el sitio, no una herramienta que complete el anonimato de la persona usuaria. La información oficial es adecuada como referencia para entender el mecanismo.
Puntos de comprobación al pensar en anonimato
Al acceder a un sitio que usa CDN, las personas usuarias no pueden conocer por completo la configuración detallada de la CDN.
Sin embargo, los puntos que conviene considerar pueden ordenarse.
| Perspectiva | Qué comprobar |
|---|---|
| Destino de conexión | Puede intervenir una CDN, no solo el sitio web |
| Logs | Pensar por separado en logs del lado de la CDN, del origen y de la aplicación |
| Dirección IP | Aunque la IP de destino sea una CDN, no es anonimización |
| Cookies | Las cookies y el estado de inicio de sesión permanecen incluso a través de una CDN |
| TLS | Ser consciente de dónde se termina TLS |
| Eliminación | Los datos antiguos pueden permanecer en la caché de la CDN |
Una CDN es un mecanismo importante que sostiene la web moderna.
Al mismo tiempo, para el anonimato también es un punto de observación importante al pensar "dónde se procesa la comunicación".
Resumen
Una CDN es un mecanismo que coloca datos de sitios web en varios lugares y los entrega de forma eficiente desde una ubicación cercana a la persona usuaria.
Usar una CDN puede acelerar la visualización de páginas, aumentar la resistencia frente a accesos concentrados y ataques, y reducir la carga del servidor de origen.
Al mismo tiempo, una CDN recibe solicitudes como infraestructura del lado del sitio web.
Puede manejar la dirección IP de origen, hora de acceso, URL, User-Agent, cookies, volumen de tráfico e información similar.
Una CDN no es tecnología de anonimización.
Al pensar en anonimato, hay que entender una CDN como un "punto de retransmisión y procesamiento del lado del sitio web" y considerar por separado destinos de conexión, logs, terminación TLS, caché y cookies.
Herramientas relacionadas
BrowserLeaks WebRTC
Recurso externo relacionado con este artículo. Ábrelo solo si encaja con tu situación y tu modelo de amenaza.
Por qué aparece aquí: Puede ayudar con el tema del artículo, pero está fuera de Anonymity Sense y conviene revisarlo antes de usarlo.
Google Search removal tools
Recurso externo relacionado con este artículo. Ábrelo solo si encaja con tu situación y tu modelo de amenaza.
Por qué aparece aquí: Puede ayudar con el tema del artículo, pero está fuera de Anonymity Sense y conviene revisarlo antes de usarlo.