Zum Hauptinhalt springen.

Webmaster gegen Gästebuch Spam Webmaster gegen Gästebuch Spam

Content Klau

Eingestellt am 13.05.2006

Das sich mit Google Adsense Anzeigen der ein oder andere Euro verdienen lässt, ist im Internet allgemein bekannt.
Doch wie erstellt man tausende Seiten mit themenrelevanten Inhalten? Da DMOZ und WiKi Clone nicht mehr so einfach funktionieren, bedient man sich schamlos an Webseiten ahnungsloser Webmaster.

Die Masche:
Man unterhält eine Adresse im Ausland um der deutschen Gerichtsbarkeit zu entgehen. Programmiert eine "Pseudo-" Suchmaschine und lässt mit einem Suchmaschinen-Bot Seiteninhalte einsammeln. Diese Seiteninhalte stellt der Betreiber als so genanntes "Snipset" auf seiner Seite dar, natürlich zugepflastert mit Adsense oder anderen Anzeigen. Suchmaschinen tauglich wird die Seite präsentiert und mit Links in die Ergebnislisten gepusht.
Dieses Vorgehen kann aber der eigenen Webpräsenz schaden zufügen.

Viele Webseiten sind mit dem gleichen Content, wie z.B. unter "http://www.google.de" und "http://google.de", oder "http://dmoz.org" und "http://dmoz.com" erreichbar. Google versucht nun die vermeintlich stärkste Domain zu Listen und die anderen auszublenden. Leider verfügen die Contentklauer oftmals über eine stärkere Domain und vertreiben somit die kleineren Hobbyseiten aus den Suchergebnissen und nehmen dessen Platz ein.
Das Filtern hat Google noch nicht 100% im Griff, weshalb es sich empfiehlt eigene Maßnahmen zu ergreifen:

1. Standard-Domain definieren (z.B. http://www.keinspam.de)

per Confixx oder einem anderen Konfigurationstool für Webserver weiterleiten:
Die Domain "http://keinspam.de" weiterleiten auf "http://www.keinspam.de"
und/oder die Sub-Domain "http://*.keinspam.de" anlegen und weiterleiten auf "http://www.keinspam.de" oder eine Fehlerseite.

per .htaccess:

RewriteEngine on
RewriteCond %{HTTP_HOST} !^www\.keinspam\.de$
RewriteRule ^(.*)$ http://www.keinspam.de/$1 [L,R=301]

2. Content Grabber aussperren

Ein Bot der nur dazu da ist, fremde Inhalte für eigene Zwecke zu missbrauchen, hält sich nicht an eine "robots.txt". Doch hinterlassen sie Spuren in den Server-Logfiles, wie den "User-agent" und die IP-Adresse. Damit können wir dem Bot den Zugriff auf unseren Server per .htaccess verwehren.

Der User-agent ist z.B. "Boeserbot"

RewriteEngine On
RewriteCond %{HTTP_USER_AGENT} ^Boeserbot
RewriteRule ^.*$ - [F]

Der Bot ist mit der IP-Adresse "112.222.235.100" unterwegs

oder allow,deny
deny from 112.222.235.100

Der Webserver muss "mod_rewrite" unterstützen.
Diese Weiterleitungen funktionieren auf dieser Seite:
http://keinspam.de --> http://www.keinspam.de/
http://keinspam.de/keinspam --> http://www.keinspam.de/keinspam
http://ww.keinspam.de --> Fehlerseite


Kommentare

Die Kommentare sind für diesen Eintrag geschlossen.