Na, das klingt doch spannend - oder? Nein? Doch! Immerhin hängen etliche Fragen
daran, die in Foren gerne gestellt werden: Kann meine Domain aus dem Index fliegen, wenn ein "Böser" einen
Link auf sie setzt? Oder umgekehrt: Kann es mir schaden, wenn ich einen Link auf eine zweifelhafte Site setze?
Darf ich meine Domains untereinander verlinken? Und noch viele andere...
Vorab eine kleine Klarstellung: Ein Netzwerk muss nicht a priori "böse" sein. Es obliegt Google, das zu beurteilen.
Das Netzwerk im Netzwerk finden
Viele stellen sich die Erkennung von Netzwerken ungefähr so vor: Der Google-Bot läuft durch das
Labyrinth und zieht eine mehr oder weniger lange Schnur hinter sich her. Kommt er bei einer Tür herein
und sieht bei einer anderen Tür das Ende der Schnur weglaufen - dann schnappt die Falle zu.
Das Problem dabei ist die Länge der Schnur: Ist sie zu kurz, würde Google nur die kleinen Webbastler-Vereine
erwischen, die großen Netzwerke blieben ungeschoren. Ist die Schnur zu lang, würde das halbe Internet
abgestraft werden.
Hier ein anderer Ansatz, der mehr Erfolg verspricht. Natürlich weiß ich nicht, wie Google das wirklich
macht, aber es ist davon auszugehen, dass es so ähnlich gemacht wird.
Als Datenbasis braucht man eine Liste in dieser Form:
| Block1 |
Linkstärkezu |
Block2 |
| Block1 |
Linkstärkezu |
Block5 |
| Block2 |
Linkstärkezu |
Block5 |
Ein Block wird meistens eine Domain sein, bei umfangreichen Domains kann aber zB ein Forum ein eigener Block
sein: Ein Block ist einfach etwas, was vermehrt Links von außen bekommt + alles unterhalb. Fraglicher
ist, was Linkstärke ("LinkPower") ist: Alle PageRanks aufaddiert wäre zu simpel, aber vielleicht
die N-te Wurzel daraus oder ähnlich; sicher aber eine logarithmische Größe.
Das Universum nach dem Urknall:
Ich habe hier eine 2-dimensionale Berechnung + Darstellung gewählt, weil man es schlichtweg besser verstehen und abbilden kann, eine dimensionslose Berechnung würde wesentlich schneller sein. Die Kreuze sind die Zentren von 2 verschiedenartigen Netzwerken.
Zunächst bekommt jeder Block eine zufällige Startposition. Dann lassen wir das Universum wieder kollabieren:
Die Linkstärke wirkt ähnlich der Gravitation auf die Blöcke; sie bewegen sich aufeinander zu.
Anders als in der Physik spielt die Entfernung aber keine Rolle, und sie wirkt nur auf den Link-gebende Block - schließlich
kann der empfangende Block nichts dafür, dass er einen Link bekommt.
Bezogen aud die Zahlen oben: Block1 bewegt sich auf Block 2
und auf Block 5 zu, während
sich Block 2 ebenso auf Block 5 zubewegt. Dieses kleine Netzwerk
würde sofort "verklumpen" - und zwar an Block 5.
Das Schöne an dieser Rechnung: Sie funktioniert auch, wenn das alles nicht offensichtlich ist, etwa wenn Links
über 20 Ecken gehen und Millionen von Domains mitspielen:
Ich habe es anhand von Testdaten (200 Domains, 2000 Links) mal durchgerechnet:
Blau und Gelb: Domains die eher zufällig untereinander
und zu allen anderen Links haben. Blau: wenig Links in/out, Gelb: viele Links in/out
Grün: Domains, die untereinander leicht verbunden sind, aber mehrere starke Zentren haben. Das könnten
zb Domains zum Thema Webdesign sein, die wenig Links untereinander, einige zu Kunden und Freunden, aber fast
immer Dr. Web, Zen-Garden und weitere übliche Verdächtige in den Linklisten haben.
Magenta: Ein böses Spam-Netzwerk:
Die Satelliten setzen nie Links reziprok, sondern immer über
mehrere Ecken, die Hauptdomain ist nur lose und unauffällig von den Satelliten verlinkt.
Wie ist das zu interpretieren:
In den unteren 2 Bildern sieht man deutlich, worum es geht: Das obere bildet
eine lockere Wolke. Google erkennt hier: Das sind Seiten, die thematisch
zusammengehören. Im unteren Bild sieht man keine Wolke, sondern
einen "Klumpen". Google muss gar nicht wissen, welche der Seite
die "eigentlich Böse" ist, es reicht, alle Links von diesen Seiten
nicht mehr zu werten. Unabhängig, welche Konstruktion genau dahinter
steckt: Damit ist das künstliche Netzwerk tot.
Interessant: Die
blauen = Seiten, die gar nicht dazugehören. Sie sind reingefallen,
weil sie kaum Links nach aussen haben und ein einziger "Ausrutscher"
bewirken kann, dass auch sie mitgerissen werden. Dass keine grünen
dabei sind: Auch klar: Unter vielen Links wirkt sich ein einziger
nicht so aus.
Und jetzt: Die Fragen zur Antwort
Kann meine Site abgestraft werden, wenn ich einen Link auf eine "böse" Site setze?
Ja. Umso mehr, je weniger Links du insgesamt hast. Ein falscher Link unter 100en hat keine spürbaren Auswirkungen,
ein Linktausch mit einem "Netzwerker" kann aber ausmachen, dass deine Site zu dessen Netzwerk gerechnet
wird - und eventuell mit rausfliegt.
Kann ich aus dem Index fliegen, wenn jemand auf meine Site linkt?
Jein. Normalerweise nicht. Wenn du aber auf jemanden linkst, der wieder auf jemanden linkt.. usw... kann sich
die Schlinge - mit dir drin - zuziehen. Ein zweiter Fall wäre, wenn du aus einem Netzwerk
einen sehr starken Link bekommst (kaufst), dieses Netzwerk aber selbst weitgehend "inzüchtig" ist.
Darf ich meine Domains untereinander verlinken?
Ja. Aber achte darauf, dass jede der Domains auch auf weitere - verschiedene
Domains - linkt.
Idealerweise auf ein paar der bekannten Sites, aber besonders auch auf kleinere und mittlere Sites, die wiederum
Links
zu anderen haben.
Fragen, die du gar nicht gestellt hast:
Warum gibt es so viele Web-Verzeichnisse?
Weil sich in der Masse der Links ein Spam-Netzwerk gut verstecken lässt.
Nicht dass jedes Verzeichnis solchen
Zwecken dient, aber manches hat ein solches Ausgedinge: Ein entsprechendes Verzeichnis kann jedes Spam-Projekt
stabilisieren.
Äh - und kann mir ein Link aus einem Web-Verzeichnis schaden?
Nein. Außer es gehört zu dir und du hast nur deine Seiten drin stehen.
Und umgekehrt - ein Link zu einem Verzeichnis, auch wenn es nicht ganz sauber ist?
Kaum, da müsstest du schon wirklich Pech (und keine anderen Links) haben.
Und wie ist das mit "reziproken Links" (A>B, B>A)?
Das ist eine interessante Frage - danke, dass du sie gestellt hast!
In obiger Rechnung wirkt die "Gravitation" nur
einseitig. Bei reziproken Links wirkt sie beidseitig. Es würden sich also leichter und schneller Cluster bilden. Es hängt aber stark davon ab, wie oft - und
vor allem wie intensiv - du so etwas machst. Ein Backlink zu einem Webverzeichnis wird sicher nicht schaden,
aber - falls du Webdesigner bist: Du (nur) zu allen deinen Kunden und deine Kunden gleich von der Startseite
wieder zurück: lass
es lieber.
Mögliche Missverständnisse:
Es geht hier darum zu zeigen, dass und wie Netzwerke erkannt werden können. Wenn deine Site zu einem Netzwerk gerechnet wird, muss das nicht unbedingt negative Folgen haben - es könnte sich bis zu
einem gewissen Grad auch positiv auswirken, zB wenn sich im selben Netzwerk auch Authoritys aufhalten. Es
könnte aber auch sein, dass ein gewichtiger Block gekickt wird (etwa nach einem Spamreport) und eine ganze
Masse kleinerer Blöcke mitreisst.
|