AI-Bots überlasten Webseiten: So schützen Sie sich mit Cloudflare WAF gegen aggressive Crawler
Aggressive AI-Crawler bringen Webseiten an ihre Grenzen. Was aussieht wie ein DDoS-Angriff, ist oft automatisiertes Crawling durch KI-Unternehmen. Wir zeigen, wie Sie sich mit Cloudflare WAF wirksam schützen.
Wenn AI-Bots zur Bedrohung werden
Die Situation ist vielen Webseitenbetreibern bekannt: Der Server-Load steigt plötzlich an, der Traffic kommt in Wellen, die Webseite wird instabil oder ist im schlimmsten Fall gar nicht mehr erreichbar. Die grosse Frage: Was passiert hier?
In vielen Fällen ist die Antwort: AI-Crawler. Unternehmen, die das Internet systematisch kopieren, um ihre KI-Modelle zu trainieren. Was dabei auffällt:
- Residential Proxy Networks verschleiern den wahren Ursprung der Zugriffe
- Ausgeklügelte Rotationsstrategien treffen jede einzelne URL eines Verzeichnisses
- Traffic-Volumen, die von einem DDoS-Angriff nicht zu unterscheiden sind
Das Paradox: Alle verlieren
Hier liegt die Ironie, über die kaum jemand spricht: Es verlieren alle Beteiligten Geld. Die Bot-Betreiber zahlen für ihre Infrastruktur. Webseitenbetreiber zahlen für die zusätzliche Serverlast. Und dann zahlen sie nochmals, um die Bots zu blockieren. Die Datenqualität, die dabei herauskommt? Bestenfalls mittelmässig.
Dabei gäbe es eine einfache Lösung: die sitemap.xml lesen. Jede Webseite stellt damit eine kuratierte Liste ihrer wichtigsten und aktuellsten Inhalte bereit. Öffentlich zugänglich, maschinenlesbar, genau dafür gemacht. Aber statt diesen eleganten Weg zu nutzen, erleben wir ein Katz-und-Maus-Spiel, das jeden Webadministrator zum unfreiwilligen Security-Spezialisten macht.
Der erste Reflex: Mehr Performance
Die einfachste und auch ein bisschen naivste Idee ist, die Performance der Webseite zu erhöhen. Mehr Server-Ressourcen, besseres Caching, optimierte Datenbank. Das hilft kurzfristig, löst aber das eigentliche Problem nicht. Die Crawler skalieren mit, und am Ende bezahlen Sie einfach mehr für Infrastruktur, die Bot-Traffic bedient.
Cloudflare WAF: Ihr Schutzschild gegen aggressive Crawler
Cloudflare bietet verschiedene Funktionen, um Crawl-Attacken und DDoS-Angriffe einzuschränken. Hier sind die wichtigsten Werkzeuge, die wir bei NETNODE einsetzen:
Under-Attack-Modus: Das Schnellmittel
Wenn eine massive Crawling-Welle läuft, ist der Under-Attack-Modus von Cloudflare das schnellste Gegenmittel. Er aktiviert zusätzliche Sicherheitsprüfungen für jeden Besucher und filtert automatisierten Traffic sofort heraus.
Bei besonders aggressiven Attacken haben wir eine automatische Under-Attack-Funktion gebaut: Wenn der Server einen bestimmten Load übersteigt, aktiviert sich der Schutzmodus automatisch. Sobald sich die Lage beruhigt, wird er wieder deaktiviert. Eine sehr effektive Methode gegen heftige Angriffswellen.
Security Rules: Fein abgestimmter Schutz
Der Kern der Verteidigung liegt in den Security Rules der Web Application Firewall. Hier gibt es verschiedene Ansätze:
Regionale Einschränkungen: Zugriffe aus bestimmten Ländern können blockiert werden, wenn klar ist, dass von dort kein legitimer Traffic kommt.
Managed Challenges: Statt den Zugriff komplett zu blockieren, wird dem Besucher eine kleine Aufgabe angezeigt. Er muss beweisen, dass er ein Mensch ist. Der Vorteil: Auch bei einem False Positive, also wenn ein echter Besucher fälschlicherweise als Bot erkannt wird, kann er die Challenge lösen und die Webseite trotzdem nutzen.
Die Herausforderung mit Residential Proxies: Moderne Crawler sind clever. Sie nutzen IP-Adressen aus Residential Networks, zum Beispiel aus dem Swisscom- oder Sunrise-Netz. Diese sehen aus wie echte Benutzer von lokalen Anschlüssen. Möglich wird das durch Hintertüren in kostenlosen Apps oder über VPN-Netzwerke. Das macht einfache IP-basierte Regeln weniger wirksam und erfordert ausgeklügeltere Erkennungsmethoden.
Typischerweise konfigurieren wir 10 bis 20 fein abgestimmte Rules mit verschiedenen Ausprägungen. Das Ziel: Problematische Bots gezielt auf bestimmten Seiten einschränken, aber gleichzeitig erwünschte Bots wie den Google Bot durchlassen, damit die Webseite weiterhin korrekt indexiert wird.
Rate Limiting: Zugriffe dosieren
Rate Limit Rules erlauben den Zugriff grundsätzlich, begrenzen aber die Häufigkeit. Zum Beispiel: Maximal zehn Zugriffe pro IP-Adresse innerhalb einer Minute. Wer schneller zugreift, wird temporär blockiert. Eine effektive Massnahme gegen Crawler, die systematisch jede URL abarbeiten.
Ein fortlaufendes Katz-und-Maus-Spiel
Auch die Crawler-Betreiber entwickeln ihre Bots weiter. Es ist leider nötig, die Security Rules regelmässig zu überprüfen und an neue Angriffsmuster anzupassen.
Entscheidend dabei ist ein durchgängiges Monitoring auf mehreren Ebenen:
- Server Monitoring: CPU-Load, Memory und Response-Zeiten im Blick behalten, um ungewöhnliche Lastspitzen frühzeitig zu erkennen.
- Webapplikation Monitoring: Verfügbarkeit und Performance der Webseite kontinuierlich überwachen, damit Ausfälle sofort sichtbar werden.
- WAF Monitoring: Die Cloudflare-Firewall-Logs analysieren, um neue Bot-Patterns zu identifizieren und die Rules gezielt nachzuschärfen.
Nur wer alle drei Ebenen im Blick hat, kann schnell reagieren und die Schutzmassnahmen laufend verbessern.
Die gute Nachricht: Über die Zeit lassen sich Bot-Patterns immer genauer analysieren und entsprechende Regeln erstellen. Und wenn die Crawler merken, dass sie nicht mehr durchkommen, stoppen sie oft von selbst, weil auch jeder Bot-Run Kosten verursacht.
Was NETNODE für Sie tun kann
Wir haben durch die Arbeit mit verschiedenen Kundenprojekten umfangreiche Erfahrung im Bereich Cloudflare WAF und Bot-Management aufgebaut. Konkret bieten wir:
- Analyse und Konfiguration von Cloudflare Security Rules, massgeschneidert auf Ihre Webseite
- Echtzeit-Monitoring und Reporting, das transparent aufzeigt, wie sich der Load entwickelt und welche Massnahmen greifen
- Fortlaufende Optimierung der Regeln, wenn neue Angriffsmuster auftauchen
- Identifikation von Bottlenecks in der Webapplikation selbst, die durch Bot-Traffic besonders belastet werden
Lassen Sie uns darüber sprechen
Wird Ihre Webseite von aggressiven Bots belastet? Wir helfen Ihnen, die richtigen Schutzmassnahmen zu konfigurieren und Ihre Webseite stabil zu halten. Das erste Gespräch ist immer kostenlos.

Lukas Fischer
CEO/Gründer & Digital Consultant
Haben Sie Fragen zu diesem Thema?
Ich freue mich auf Ihre Kontaktaufnahme und berate Sie gerne persönlich.
Kontakt aufnehmen