Wer ein Forum, Blog oder sonstiges betreibt, bekommt nach einiger Zeit immer mehr nervige und unnötige Server-Anfragen von Bots, Spider oder Monitor-Diensten wie Landau Media Monitoring. In Sekundentakt wird der Server von unzähligen Diensten abgefragt, die natürlich alle nur das beste wollen. Mittels htaccess und SetEnvIfNoCase kann man etwas von diesem Müll fern halten. Ein kleiner Beitrag wie man mit htaccess Umgebungsvariablen und RewriteRule Bots und Spider un die irre führen kann.
Leider gibt es Unmengen an Müll der sich Tag für Tag durch das Netz bewegt, und es wird auch nicht kleiner werden. Leider gehen auch unzählige Server-Anfragen zu lasten von Traffic. Um bestimmte und nervige Bots und Spider oder sonstigen Müll fern zu halten, kann man etwas über htaccess tun.
Mittels SetEnvIfNoCase können bei bestimmten Anfragen sogenannte Umgebungsvariablen gesetzt werde, die sich sowohl in der htaccess als auch in PHP mit $_SERVER abfragen lassen.
Beispiel htaccess:
# Sperre nach Agent
SetEnvIfNoCase user-agent "BotOnParade" bad_bot=1
# Sperre nach IP
SetEnvIfNoCase remote_addr "^77.41.*" bad_bot=1
# Sperre nach Request
SetEnvIFNoCase Request_URI "w00tw00t" bad_bot=1RewriteEngine on
RewriteBase /
RewriteCond %{ENV:bad_bot} 1
RewriteRule ^(.*)$ http://www.yandex.ru [R=301,L]