Wenn Sie eine Website öffnen, kommen die Daten nicht immer nur vom Server des Betreibers.
Bilder, CSS, JavaScript, Videos, Schriftarten und Download-Dateien können über einen Mechanismus namens CDN ausgeliefert werden.
CDN steht für Content Delivery Network.
Einfach gesagt ist es ein Mechanismus, der Daten einer Website an mehreren Orten platziert und sie von einem Ort ausliefert, der näher bei den Nutzenden liegt oder weniger überlastet ist.
Wenn man CDNs versteht, wird klar: "Eine Website aufrufen" betrifft in der Praxis nicht nur den Server des Seitenbetreibers, sondern auch CDN, DNS, TLS-Terminierung, Logs, Cache und andere Elemente.
Das ist auch für Anonymität wichtig.
Denn ein CDN kann als Teil der Website-Seite Kommunikation empfangen und dabei Zugriff auf Quell-IP-Adresse, Anfrage, , User-Agent, Zugriffszeit und ähnliche Informationen haben.
Dieser Artikel ordnet die Grundlagen von CDNs, was dadurch schneller wird, wo Logs bleiben können und worauf man bei Anonymität achten sollte.
Was ist ein CDN?
Ein CDN ist ein Netzwerk, um Webinhalte effizient auszuliefern.
Der ursprüngliche Server einer Website wird manchmal Origin-Server genannt. In einer CDN-Konfiguration greift der Browser nicht jedes Mal direkt auf den Origin-Server zu, sondern kann Daten über Server des CDN erhalten.
Element
Rolle
Erklärung
Browser der Nutzenden
Sendet Anfragen
Fordert Seiten, Bilder, CSS, JavaScript und Ähnliches an
CDN
Vermittelt die Auslieferung
Gibt Daten von einem Ort zurück, der nahe bei den Nutzenden liegt
Origin-Server
Hält die Originaldaten
Ursprünglicher Server auf Seiten des Website-Betreibers
Cache
Temporäre Speicherung
Speichert häufig verwendete Daten auf CDN-Seite
DNS
Bestimmt das Verbindungsziel
Kann auf Server des CDN verweisen
Ein CDN ist nicht nur ein "Gerät zum Beschleunigen".
Im modernen Web kann ein CDN mehrere Rollen haben, etwa Auslieferung, Lastverteilung, DDoS-Schutz, TLS-Terminierung, WAF, Bildoptimierung, Bot-Abwehr und Log-Analyse.
Warum werden CDNs verwendet?
CDNs werden vor allem für Geschwindigkeit, Stabilität, Lastverteilung und Angriffsschutz verwendet.
Wenn Nutzende in Japan sind und der Origin-Server in einem entfernten Land steht, wird es langsam, wenn jede Anfrage bis zu diesem entfernten Server gehen muss. Ein CDN platziert Daten an mehreren Standorten weltweit und antwortet von einem Standort nahe bei den Nutzenden.
Ziel
Was beim CDN passiert
Auswirkung aus Nutzersicht
Beschleunigung
Antwort von nahem Standort
Seiten laden schneller
Lastverteilung
Verarbeitung über viele Standorte
Besser bei Zugriffsspitzen
Cache
Gleiche Bilder und Dateien werden gespeichert
Last auf dem Origin sinkt
DDoS-Schutz
Angriffsdatenverkehr wird auf CDN-Seite aufgenommen
Website fällt schwerer aus
TLS-Terminierung
HTTPS-Verbindungen werden auf CDN-Seite verarbeitet
Zertifikatsverwaltung und Auslieferung werden effizienter
Bei großen Websites, Nachrichtenseiten, Videoseiten, Onlineshops, SaaS und App-APIs werden CDNs häufig verwendet.
Aus Sicht der Nutzenden wirkt es wie ein normaler Website-Aufruf.
Im Hintergrund kann jedoch nicht der Origin-Server, sondern ein CDN-Standort antworten.
CDN und Cache
Ein zentraler Mechanismus von CDNs ist der Cache.
Cache bedeutet, einmal abgerufene Daten vorübergehend zu speichern und beim nächsten Mal die gespeicherten Daten zurückzugeben.
Gleiche Logobilder, CSS, JavaScript, Schriftarten und öffentliche Bilder werden zum Beispiel vielen Nutzenden in identischer Form zurückgegeben. Solche Daten lassen sich leicht auf CDN-Seite speichern.
Daten
Cache-Eignung
Hinweis
Bilder
Hoch
Alte Bilder können eine Zeit lang bleiben
CSS
Hoch
Aktualisierungen können verzögert sichtbar werden
JavaScript
Hoch
Versionsverwaltung wird wichtig
Videos
Hoch
Wegen großer Datenmengen ist der CDN-Effekt groß
Seiten nach Login
Niedrig
Personenbezogene Inhalte müssen vorsichtig behandelt werden
API-Antworten
Abhängig vom Design
Vorsicht, wenn Authentifizierungsdaten oder personenbezogene Daten enthalten sind
Aus Sicht von Anonymität und Privatsphäre ist Cache nützlich, bringt aber auch Vorsichtspunkte mit.
Alte Bilder oder Seiten können auf CDN-Seite bleiben. Selbst wenn sie auf der Website-Seite gelöscht wurden, können sie sichtbar bleiben, bis der CDN-Cache aktualisiert ist.
Bei fehlerhaftem Seitendesign besteht außerdem die Gefahr, personenbezogene Daten im CDN zu speichern, die eigentlich nicht gecacht werden sollten.
CDN und DNS
Bei Websites mit CDN kann das DNS-Ergebnis auf die CDN-Seite zeigen.
Wenn Nutzende eine Domain aufrufen, kann DNS nicht den Origin-Server zurückgeben, sondern Informationen, die zum Edge-Server des CDN führen.
Ein Edge-Server ist ein CDN-Server, der nahe bei Nutzenden Anfragen empfängt.
Phase
Was passiert
1
Nutzende rufen einen Domainnamen auf
2
DNS gibt ein Ziel auf CDN-Seite zurück
3
Der Browser verbindet sich mit einem Edge-Server des CDN
4
Das CDN prüft den Cache
5
Bei Cache-Treffer antwortet das CDN
6
Ohne Cache-Treffer holt das CDN die Daten vom Origin-Server
Deshalb können für denselben Domainnamen je nach Region oder Netzwerk unterschiedliche IP-Adressen zurückgegeben werden.
Das ist kein Fehler.
Bei CDN und Lastverteilung ändert sich das Verbindungsziel abhängig von Nutzerstandort, Auslastung und Störungslage.
CDN und TLS-Terminierung
Bei HTTPS-Kommunikation wird TLS verwendet.
In einer CDN-Konfiguration kann das HTTPS-Verbindungsziel aus Browsersicht das CDN sein.
Dann wird die TLS-verschlüsselte Kommunikation beim CDN einmal entschlüsselt, und das CDN verarbeitet die Anfrage. Danach wird sie über eine andere Kommunikation vom CDN zum Origin-Server weitergeleitet.
Abschnitt
Kommunikation
Hinweis
Browser zu CDN
Durch HTTPS geschützt
Aus Nutzersicht liegt das Verbindungsziel auf CDN-Seite
CDN-intern
Verwaltungsbereich des CDN-Anbieters
Das CDN verarbeitet die Anfrage
CDN zu Origin
Je nach Konfiguration HTTPS
Die Einstellung des Website-Betreibers ist wichtig
Origin-Server
Verarbeitet die Originaldaten
Kann als Verbindung vom CDN erscheinen
Das bedeutet nicht, dass HTTPS sinnlos ist.
HTTPS schützt die Kommunikation zwischen Browser und Verbindungsziel. Wenn das CDN jedoch TLS terminiert, ist das CDN in einer Position, die Kommunikation zu verarbeiten.
Für Anonymität muss man das CDN daher als "Beobachtungspunkt auf der Website-Seite" betrachten.
Was kann ein CDN sehen?
Ein CDN kann vor eine Website geschaltet sein.
In diesem Fall empfängt das CDN Anfragen der Nutzenden. Es kann also Quell-IP-Adresse, Zugriffszeit, User-Agent, angefordertes Ziel, Cookies, HTTP-Header und ähnliche Informationen verarbeiten.
Information
Kann beim CDN verarbeitet werden
Bedeutung für Anonymität
Quell-IP-Adresse
Ja
Hinweis auf das Quellnetzwerk
Zugriffszeit
Ja
Achse für Abgleich mit anderen Logs
URL-Pfad
Ja
Zeigt, welche Seite oder API angefordert wurde
User-Agent
Ja
Hinweis auf Browser und OS
Cookie
Abhängig vom Design
Hängt mit Login-Zustand und Kennungen zusammen
Datenmenge
Ja
Zeigt Tendenzen bei Dateiübertragung oder Videonutzung
Das bedeutet nicht, dass CDN-Anbieter immer alles langfristig speichern.
Speicherumfang, Speicherfrist, Zugriffsrechte und Nutzungszweck von Logs hängen vom CDN-Anbieter und den Einstellungen des Website-Betreibers ab.
Wichtig ist, dass ein CDN keine bloß transparente Luft auf dem Kommunikationsweg ist.
Ein CDN empfängt als Website-Infrastruktur Kommunikation.
Die vom Webserver sichtbare IP ändert sich
Bei Nutzung eines CDN kann sich die Quell-IP-Adresse ändern, die der Origin-Server sieht.
Aus Sicht des Origin-Servers ist die direkte Quelle nicht die nutzende Person, sondern die IP-Adresse des CDN. Deshalb kann die Website-Seite Header wie X-Forwarded-For oder CF-Connecting-IP oder CDN-seitige Logs verwenden, um die ursprüngliche Client-IP zu verarbeiten.
Ort der Betrachtung
Sichtbare IP
Erklärung
CDN
Quell-IP der Nutzenden
Empfängt die Anfrage direkt von den Nutzenden
Origin-Server
IP des CDN
Direkte Quelle ist das CDN
Anwendung
Abhängig von der Einstellung
Kann die ursprüngliche IP über Header verarbeiten
Zugriffslogs
Abhängig vom Design
Können auf CDN- und Origin-Seite verbleiben
Beim Lesen von Logs muss geprüft werden, von welchem Ort diese Logs stammen.
CDN-Logs, Load-Balancer-Logs, Origin-Server-Logs und Anwendungslogs zeigen unterschiedliche Informationen.
CDN ist keine Anonymisierungstechnik
Ein CDN ist ein Mechanismus, um die Auslieferung einer Website schneller, stabiler und leichter schützbar zu machen.
Es ist kein Mechanismus, um Nutzende anonym zu machen.
Aus Sicht der Nutzenden kann durch ein CDN die IP-Adresse des Verbindungsziels nicht die des Origin-Servers, sondern die des CDN sein. Das garantiert jedoch keine Anonymität der Nutzenden.
Das CDN ist Infrastruktur auf der Website-Seite.
Wenn Zielseite, CDN, Anwendung, Zugriffsauswertung, Werbe-Tags und Authentifizierungsinfrastruktur zusammenwirken, wird der Zugriff der Nutzenden an verschiedenen Stellen verarbeitet.
Missverständnis
Tatsächlich
Wenn es über ein CDN läuft, wird man anonym
Ein CDN ist Auslieferungsinfrastruktur der Website-Seite und keine Anonymisierungstechnik
Weil die Origin-IP nicht sichtbar ist, ist es sicher
Informationen der Nutzenden werden beim CDN oder auf Website-Seite verarbeitet
Bei HTTPS sieht auch das CDN nichts
Wenn TLS beim CDN terminiert, verarbeitet das CDN die Anfrage
Bei Cache gibt es keine Logs
Auf CDN-Seite können Zugriffslogs verbleiben
Beim Nachdenken über Anonymität behandelt man ein CDN als Teil der Zielseite.
Offizielle Informationen zu CDNs ansehen
Beim Lernen über CDNs können auch offizielle Erklärungen von CDN-Anbietern helfen.
Cloudflare ist ein repräsentativer Anbieter von CDN, DDoS-Schutz, WAF und DNS. Auf der offiziellen Lernseite lässt sich prüfen, was ein CDN als Mechanismus tut.
Das bedeutet jedoch nicht, dass die Nutzung eines bestimmten CDN-Anbieters Sicherheit schafft.
Ein CDN ist Infrastruktur auf Seiten des Website-Betreibers und kein Werkzeug, das Anonymität der Nutzenden vollständig macht. Offizielle Informationen liest man sinnvollerweise als Referenz zum Verständnis des Mechanismus.
Prüfpunkte für Anonymität
Wenn man eine Website mit CDN aufruft, kann die nutzende Seite die genaue CDN-Konfiguration nicht vollständig kennen.
Die zu bedenkenden Perspektiven lassen sich jedoch ordnen.
Perspektive
Was prüfen
Verbindungsziel
Nicht nur die Website, auch ein CDN kann beteiligt sein
Logs
CDN-seitige, Origin-seitige und App-seitige Logs getrennt betrachten
IP-Adresse
Auch wenn die Ziel-IP zum CDN gehört, ist das keine Anonymisierung
Cookie
Cookies und Login-Zustand bleiben auch über CDN bestehen
TLS
Bewusst betrachten, wo TLS terminiert wird
Löschung
Alte Daten können im CDN-Cache bleiben
CDNs sind ein wichtiger Mechanismus des modernen Web.
Zugleich sind sie für Anonymität wichtige Beobachtungspunkte, wenn man fragt, wo Kommunikation verarbeitet wird.
Zusammenfassung
Ein CDN ist ein Mechanismus, der Daten einer Website an mehreren Orten platziert und effizient von einem Ort nahe bei den Nutzenden ausliefert.
Mit CDN können Seiten schneller angezeigt, Zugriffsspitzen und Angriffe besser abgefangen und die Last auf dem Origin-Server verringert werden.
Gleichzeitig empfängt ein CDN als Infrastruktur auf Website-Seite Anfragen.
Es kann Quell-IP-Adresse, Zugriffszeit, URL, User-Agent, Cookie, Datenmenge und ähnliche Informationen verarbeiten.
Ein CDN ist keine Anonymisierungstechnik.
Beim Nachdenken über Anonymität muss man ein CDN als "Vermittlungs- und Verarbeitungspunkt auf Website-Seite" verstehen und Verbindungsziel, Logs, TLS-Terminierung, Cache und Cookies getrennt betrachten.
Verwandte Werkzeuge
WebRTC Leak Test
BrowserLeaks WebRTC
Eine externe Ressource zu diesem Artikel. Öffne sie nur, wenn sie zu deiner Situation und deinem Bedrohungsmodell passt.
Warum es hier aufgeführt ist: Sie kann beim Thema des Artikels helfen, liegt aber außerhalb von Anonymity Sense und sollte vor der Nutzung geprüft werden.
Eine externe Ressource zu diesem Artikel. Öffne sie nur, wenn sie zu deiner Situation und deinem Bedrohungsmodell passt.
Warum es hier aufgeführt ist: Sie kann beim Thema des Artikels helfen, liegt aber außerhalb von Anonymity Sense und sollte vor der Nutzung geprüft werden.