Es gibt Crawler, Bots und tausend nervige Server-Anfragen von "Möchtegern-Diensten" die sich jeden Tag und fast jede Stunde durch das Netz bewegen. Nun wer brauch schon weneo.de oder BotOnParade? Fakt ist, dass jede Server-Anfrage einen gewissen Traffic verursacht und mit der Zeit wird das auch nicht weniger. Also drehen wir den Spieß um und machen eine Umleitung zur deren eigenen IP. Wie das geht? Ganz einfach mit htaccess und einer Umgebungsvariable ...
Zuerst suchen wir uns die nervigen Sünder raus, und tragen diese in htaccess ein:
# nicht vergessen, sonst geht nix :)
RewriteEngine on
# Suche nach UserAgent
SetEnvIfNoCase user-agent "libwww-perl" bad_bot=1
SetEnvIfNoCase user-agent "BotOnParade" bad_bot=1
SetEnvIfNoCase user-agent "landau" bad_bot=1
SetEnvIfNoCase user-agent "Nutch" bad_bot=1
# Suche nach IP-Bereich
SetEnvIfNoCase remote_addr "^77.41.*" bad_bot=1
SetEnvIfNoCase remote_addr "^77.88.*" bad_bot=1
SetEnvIfNoCase remote_addr "^78.26.*" bad_bot=1
SetEnvIfNoCase remote_addr "^83.149.*" bad_bot=1
SetEnvIfNoCase remote_addr "^142.166.*" bad_bot=1
SetEnvIfNoCase remote_addr "^204.124.*" bad_bot=1
SetEnvIfNoCase remote_addr "^212.235.*" bad_bot=1
# Suche nach Request
SetEnvIFNoCase Request_URI "w00tw00t" bad_bot=1
# Suche nach Referer
SetEnvIfNoCase referer "christhuntproductions" bad_bot=1RewriteCond %{ENV:bad_bot} 1
RewriteRule ^(.*)$ http://%{REMOTE_ADDR} [R=301,L]