nofollow - noLinks, noComments, noTrackbacks, noPageRank?

21. Januar 2005 | | 18 Kommentare | 0 TrackBacks| del.icio.us | Print

nofollow - noLinks, noComments, noTrackbacks, noPageRank?

Google, Yahoo & MSN erklären, sie kämpfen seit Mittwoch gemeinsam mit Six Apart und anderen Weblog-Herstellern gegen Kommentar-Spam. Endlich, super, mögen viele zuerst meinen! PR-Gag, Aktion gegen die Kommentar-Spamer oder einfach nur heiße Luft?

Rückblick - Feierliche Verkündung

Mittwoch Morgen eilt eine Neuigkeit durch die Weblogs. Six-Apart bemüht sich eifrig, seine strategische Allianz mit Google, Yahoo, MSN und einigen anderen zum Kampf gegen Kommentar-Spam zu verkünden. Im gleichen Atemzug wird das neue MT-Plugin nofollow präsentiert, dass den MT-Nutzern die Anwendung des neuen Link-Attributes »rel=nofollow« erleichtern soll. Die Einführung in nofollow will mir gleichzeitig erläutern, auf welche Weise man diese Plugin fortan sinnvoll einsetzen kann.

So schaut der neue nofollow-Link dann im Quellcode aus:

statt:
<a href="http://domain.de">Link Text</a>

nun:
<a href="http://domain.de" rel="nofollow">Link Text</a>

Meine Wahrnehmung fährt Achterbahn

Ich traue meinen Augen nicht mehr, was da innerhalb weniger Stunden abgeht. Ein Artikel nach dem andere soll mir glauben machen, dass es sich bei DER Neuerung um das Allheilmittel im Kampf gegen Spam handelt. Es ist nur positives Echo ist zu vernehmen.

Keine kritischen Stimmen werden laut? Keine leisen Bedanken? Einigkeit und Friede, Freude, Eierkuchen, wohin ich sehe. Völlig ungewöhnlich in der Szene!

  • Gibt es noch jemand, der mitdenkt?
  • Plappern alle nur nach oder freuen sich nur über eine Neuigkeiten?
  • Welche Konsequenzen hat diese Veröffentlichung wirklich?

Unglaublich, aber wahr - Jetzt geht die Post ab!

Aber das ist erst der Anfang. Es wird noch viel besser. Einige Blogs (darunter einige alte Weblog-Hasen?!) haben die neue Funktion ja schon kräftig im Einsatz. Es kann ja immerhin nicht schaden, war meist der Tenor. Auch existiert bereits eine Firefox-Extension nofollow, die mir über ein User-Stylesheet erlaubt, nofollow-Links im Firefox-Browser sichtbar zu machen.

Woran ich im Konkreten war, wusste ich erst nach einiger Zeit. Eines war aber sicher. Es stank gewaltig zum Himmel. Das konnte man selbst mit verstopften Sinneskanälen merken. Wenn eines in mir Argwohn erregt, dann eine derart massive PR-Initiative. So sehr ich mich auch bemühte, positive Aspekte zu entdecken, es gelang mir nur schwer.

Ich bilde mir meine Meinung sehr gern selber. Für mich braucht niemand zu denken. Und schon gar nicht lasse ich mir vorschreiben, was ich denn zu tun hätte. Ein ehrliches und seriösen Arbeiten steht für mich über allem. Um so intensiver fühle ich mich verschaukelt, wenn mir knallharte Lügen aufgetischt werden. Aber dazu gleich mehr.

Erst Gehirn einschalten - dann denken

Der menschliche Geist gleicht einem Fallschirm;
er kann nur funktionieren, wenn er offen ist.
Franscis Picabia

Donnerstag Abend zu später Stunde kann ich dann endlich aufatmen. Zurückgekehrt von einer Beratung lese ich bei Martin Röll: dann endlich mal ein paar kritische Meinungen und Kommentare. Und die hören sich schon ganz anders an. Es existieren offensichtlich noch ein paar andere Gehirn-Besitzer, die auch noch dazu den Gehirn-Benutzern gehören. Ich bin etwas beruhigt!

Offenbar hat sich bei einigen die Aufregung, Verwunderung und erste Freude gelegt. So langsam scheinen die wirklichen Hintergründe transparenter, werden Folgen absehbar. Einige blicken fragend in die Zukunft.

nofollow - die Realität

Wer seine Links auf den Webseiten so lässt, für den ändert sich nichts. Da anderen Webseiten-Betreiber diese Maßnahme aber einsetzen, müssen wir aber ab sofort zwei Link-Klassen beachten:

  • Links mit nofollow-Attribut,
  • Links ohne nofollow-Attribut.

Nur die Suchmaschinen werden die Links funktionell unterscheiden. Für die Besucher bleibt die Funktionalität der Links erhalten. Doch was bedeutet es im Detail? Google & Co. werden nofollow-Links (SearchEngineWatch) wie folgt behandeln:

  • Suchmaschinen-Spider folgen diesen Links nicht
  • Suchmaschinen werten diese Links nicht bei der PageRank-Berechnung der Seiten
  • Suchmaschinen beachten den Alt-Text bei den auf die Seite zeigenden Links nicht

nofollow - Riesen Lüge verkauft alles

Was wir hier unter dem Deckmantel der Spam-Bekämpfung aufgetischt bekommen, mag sicher seine positiven Seiten haben. Spam bekämpft es allerdings nicht! Das ist eine klare Lüge. Aber auch hier scheint der Grundsatz zu gelten: Je lauter und wirksamer man eine Lüge verkauft, um so glaubhafter wird sie von den Menschen aufgenommen.

Spamers don’t read blogs; they just write to them.
Mark Pilgrim

Schon gar nicht ist es das Allheilmittel gegen diese Seuche, wie seiner Zeit schon Mark Pilgrim treffend bemerkte. Warum das so ist belegen die im Folgenden aufgelisteten sieben häufigsten nofollow-Spam-Irrtümer:

Irrtum 1: Es gibt dadurch weniger Spam.

Spamer werden durch nofollow-Links in keiner Weise gehindert, ihre automatischen Kommentare zu produzieren. Sofern keine bisher üblichen Spam-Vorkehrungen seitens der Betreiber existieren, wird es durch die nofollow-Links nicht eine Spam-Nachricht weniger geben.
Da die Suchmaschinen auch weiterhin Spam-Nachrichten als Bestandteil der Webseiten indizieren, finden wir diese Nachrichten nach wie vor auch bei Google, Yahoo, MSN & Co.

Irrtum 2: Weblog sind damit eindeutig zu identifizieren, nofollow ist ausschließlich für Weblogs bestimmt.

Das wird nur eine kurze Weile funktionieren. Die nofollow-Links sind in allen Webseiten einsetzbar. Man brauch dafür kein Weblog. Jeder, der die Funktion nutzen will, kann es tun. Nach einer Eingewöhnung kann man nicht mehr zwischen Weblog und normaler Website unterscheiden.

Irrtum 3: nofollow ist eine wirksame flächendeckende Maßnahme.

Damit die Neuerung überhaupt halbwegs greift, müssten alle Weblogs diese Funktion einsetzen. Selbst wenn dies wirklich passiert, ändert dies bei den Spamern wenig. Zudem ist nofollow keine zwingende Maßnahme. Jeder Weblog-Betreiber kann selbst entscheiden, ob und in welchem Umfang er diese Funktion einsetzen wird.

Irrtum 4: nofollow bietet Bloggern erstmalig die volle Herrschaft über die Spamer.

Bereits lange vor dem nofollow-Feature hatte jeder Betreiber eines Weblogs Möglichkeiten, Spar-Missbrauch sowie PR-Abfluss von seinen Seiten einzuschränken:

  • durch strikte Kommentar-/Trackback-Zuschaltung/-Deaktivierung
  • durch Kommentar-Moderierung
  • durch diverse Spam-Plugins
  • durch Redirect-Anweisungen
  • durch formatierte Ausgabe der Kommentare (Sperre für HTML-Befehle)
  • etc.

Was also ist bei der neuen Funktion so Bahnbrechendes, was wir bisher nicht auch schon hätten unternehmen können? Wer wollte, hatte schon immer die Wahl, Funktionen nach Belieben zu gestalten und zu verändern. Auch jetzt wird sich daran nichts ändern.

Irrtum 5: Für den Einsatz von nofollow brauch man unbedingt ein Plugin.

Das nofollow-Attribut kann ich in jeden Link, auf jede Website und in jedes Weblog-Template einbauen, sofern ich darauf als Betreiber zugreifen kann. Jeder Betreiber entscheidet damit über den Einsatz des Plugins nach freiem Ermessen ob er:

  • einen (normalen) Link
  • einen nofollow-Link

einsetzen möchte und schränkt dadurch die Wirksamkeit der Maßnahme ggf. auch persönlich erheblich ein.

Irrtum 6: nofollow wird Standarad-Funktion der Weblogs.

Nofollow soll nach bisherigen Informationen nicht zum Standard werden. Sofern ein Weblog-Tool dies tatsächlich macht, wird diese Funktion abschaltbar sein. Man hat also die freie Wahlmöglichkeit.

Irrtum 7: Besucher von Weblogs werden weniger Spam-Meldungen lesen.

Benutzer lesen auf den Webseiten nach wie vor eingetragene Spam-Nachrichten, das die Erläuterungen von Irrtum 1 hierfür sorgen werden. Diese Spam-Meldungen bleiben ebenso wirksam für die Besucher, da der Mensch diesen Links nach wie vor folgen kann.

Das tut weh!

Was richtig weh tut, ist die pure Naivität, mit der zum einen die Nachrichten publiziert bzw. welcher Unkenntnis solche Maßnahmen in gutem Vertrauen umgesetzt werden. Es scheit fast so, als hält sich ein kleines Kind die Augen zu und ruft seiner Mutti zu: »Du siehst mich nicht!«

Die Masse der Reaktionen hat mich da einfach betroffen gemacht.

Seit ich mich erinnern kann, haben die erbitternden Konkurrenten Google, Yahoo und MSN noch nie richtig zusammen gearbeitet.

  • Woher soll bitte auf einmal diese Kehrwendung kommen?
  • Welche Nutzen haben die Weblog-Tools dabei?
  • Ist dies ein riesen PR-Gag der Suchmaschinen?
  • Oder ist dies ein organisierter Schlag gegen die Suchmaschinenoptimierer?

Das Interesse der Suchmaschinen scheint mir jedenfalls weitaus größer als das der anderen Partner zu sein. Die Suchmaschinen bekommen durch den immensen PR-Aufbau von Weblogs offensichtlich immer mehr Probleme. Sie werden beeinflussbar. Nur, waren sie das nicht schon immer? Wenn der PR bei den Suchmaschinen DAS Bezugskriterium ist, dann ist das Problem logisch hausgemacht. Das wird man durch solchen Maßnahmen auch nur temporär, wenn überhaupt, in den Griff bekommen.

Aktio gleich Reaktio?

Schon immer hat eine Maßnahme von Google & Co. eine andere Reaktion herausgefordert. Immer hat es einige Zeitgenossen gegeben, die Missbrauch betrieben haben. Auch die neuerliche Maßnahme ruft wieder Gegenmaßnahmen auf den Plan.

Mir tun nur die leid, die ehrlich und mit ernsten Absicht Weblogs und Webseiten aufbauen und kommentieren und die plötzlich kollektiv abgestraft werden sollen. Wer heute einen Kommentar schreibt oder einen Trackback generiert, gilt offensichtlich schon als Spamer und gehört verfolgt.

Das Internet lebt jedoch von Links. Das ist allgemein bekannt. Und genau das hat Weblogs ja überhaupt so interessant für Suchmaschinen wie Google und Yahoo gemacht. Suchmaschinen lieben viel neuen frischen Content. Entsprechend regelmäßig besuchen Sie Link für Link die Webseiten. Ob das auch zukünftig so bleiben wird? Man darf gespannt sein.

  • Was aber, wenn Suchmaschinen diese Links plötzlich nicht mehr verfolgen?
  • Was, wenn niemand mehr PR bekommt, weil alle nofollow-Links setzen?
  • Schmoren dann die Seiten im eigenen Saft?

Wie werdet Ihr als Weblog-Betreiber darauf reagieren?

Eines steht jedenfalls fest. Jeder hat die Chance, seine persönliche Wahl zu treffen. Ab und an mag es auch notwendig sein, sich einen Gedanken mehr zu machen. Es kann aus meiner Sicht nur gut sein.

Wie auch immer die Reaktionen ausfallen mögen, die nächsten Wochen werden es zeigen. Konstruktive Schritte nach vorn darf man allerdings dabei nicht unbedingt erwarten. Der Wettkampf geht in die nächste Runde. So viel ist gewiss.

BTW.: Wer kümmert sich eigentlich um die Belange des Internet-Besuchers?

nofollow – noLinks, noComments, noTrackbacks, noPageRank?
Aber vielleicht schaffen Google & Co. ja auch bald den PageRank ganz ab?

Update: NO NOFOLLOW Initiative

Update2: Weitere Information

Links zum Thema:

TrackBack-URL: http://www.einfach-persoenlich.de/m3/mt-tbk.cgi/106

Kommentare

1 | Jeena Paradies schreibt am 21. Januar 2005, 19:42:

Ich werde das nicht einsetzen, da ich sowieso höchstwarscheinlich nie Kommentarspam bekommen werde.

Der Spam kostet die Spammer ja fast gar nichts, dennoch verdienen sie daran ganz gut. Warum sollten sie dann überhaupt damit aufhören, auch wenn es nur ein kleines Bischen funktioniert?

2 | Björn schreibt am 21. Januar 2005, 20:31:

Nofollow->No chance. Auch bei mir wird es nicht zum Einsatz kommen. Es hilft nur Google und dass es Weblogs gegen Spammer hilft ist das PR-Argument.

Gute Kommentare und Trackbacks haben ein Recht darauf verfolgt zu werden.

3 | Manuela schreibt am 21. Januar 2005, 21:59:

Auch ich bin momentan ein Nofollower. Über Kommentare auf meinen Seiten freue ich mich und ich wüsste nicht, warum Google diese nicht verfolgen sollte. Spam wird gelöscht und da wird es wohl ausgereiftere Methoden brauchen als nofollow.
Vielen Dank für die umfangreiche Zusammenstellung, Jörg!

4 | Moe schreibt am 21. Januar 2005, 22:23:

Falsch ist, daß jeder selbst entscheiden kann, ob er nofollow einsetzt oder nicht. Nucleus zB wird das ab dem nächsten Release von Haus aus unterstützen, und dann müsste man wahrscheinlich zumindest im Code rumhacken um es zu dektivieren. Dasselbe gilt glaube ich für Pivot?
Nicht anders sieht es bei zentralisierten Plattformen wie Blogger.com oder LiveJournal aus. Diese hosten die Kommentarfunktionen von zig Millionen Weblogs, und wenn die das einbauen werden ihre Systeme über Nacht für URL-Spammer komplett und ohne Ausnahme unbrauchbar.
Weiterhin habe ich das so verstanden, dass zumindest Google dem Link eh folgt, ihm aber lediglich keinen Pagerank vergibt.

5 | René schreibt am 21. Januar 2005, 22:29:

Bei Irrtum Nr. 6 wäre ich mir nicht so sicher. Wenn man sich das Changelog des WP-Codes so ansieht, scheint die Funktion dort fest eingebaut zu werden (http://comox.textdrive.com/pipermail/cvs/2005-January/000913.html).

7 | Simon Zirkunow schreibt am 21. Januar 2005, 22:58:

Was mir beim Lesen noch eingefallen ist:

  • Wie kommt man eigentlich auf die Idee, etwas so angenehmes wie Kommentare pauschal als Spam zu bezeichnen? (Echte Spamkommentare werden ja gelöscht und danach ist deren Pagerankverbesserung auch nicht möglich.)

Zu Gunsten von nofollow spricht allerdings, soweit ich es richtig interpretiert habe, dass der eigene Pagerank dadurch nicht sinkt. Denn je mehr Links von der eigenen Seite ausgehen, desto kleiner wird er. (Quelle: Agenturblog)

Im Moment werde ich nicht auf den Zug aufspringen. Wenn sich in Zukunft herausstellen sollte, dass es doch wichtige Vorteile mit sich bringt, werde ich es mir überlegen. Im Moment ist es noch zu umüberschaubar, welche Auswirkungen dieses System langfristig haben wird.

9 | manuel schreibt am 22. Januar 2005, 04:40:

Ich habe auch noch einige Anmerkungen zu deinen aufgeführten Punkten:

1. Recht hast du hier 100%. Was die Suchmaschinen immerhin nicht tun, ist die jeweiligen links mit Pagerank zu belohnen. Spamcomments werden jedoch wie du richtig meinst, dennoch bei den Suchmaschinen als „Inhalt“ indiziert.

2. Jein. Klar werden anfangs höchstens Weblogs nofollow benutzen. Jedoch ist der Punkt „Nach einer Eingewöhnung kann man nicht mehr zwischen Weblog und normaler Website unterscheiden.“ recht schwammig ausgedrückt. Wer kann dies nicht? Die Suchmaschinen! Ich bezweifle das ein Mensch nicht zwischen Weblog und „normaler“ Website unterscheiden kann nur weil ein Linkattribut gesetzt ist ;) Und der Suchmaschine sollte es in der Regel egal sein ob eine Seite ein Weblog oder eine statische Seite ist.

3. So ist es. Und das ist 100%ig der Punkt warum mit dieser Methode nichts erreicht wird. Entweder halten sich ALLE daran, oder die nofollow-Methode wird einfach komplett verworfen. Es bringt nichts. Wie ich schon in meinem Weblog geschrieben habe stört es dem Spammer wenig ob der Link jetzt "nofollow" ist oder nicht. Ebensowenig wird kontrolliert ob ein Kommentar überhaupt im Weblog erscheint. Dies ist bei mir nämlich bei Spamkommentaren nicht der Fall, da ich seit einiger Zeit die Kommentare nurnoch moderiert zulasse. Weniger Spamcomments habe ich dadurch trotzdem nicht. Dadurch bezweifle ich es das sich Spammer durch rel="nofollow" vom spammen abhalten lassen …
Im Endeffekt wäre der ehrliche Kommentarschreiber der gearschte, da er ebenfalls, wie ein Spamcomment ein rel="nofollow" bekommt, obwohl er es in keinster Weise verdient hat.

5. Bereits auch schon diskutiert ist es, bei registrierten Benutzern eines Weblogs ein rel="nofollow" zu unterbinden. Halte ich aber ebenfalls nicht viel von, weil ich der Meinung bin das man es ebenso einstellen kann das registrierte Benutzer ohne freischaltung kommentieren können, bei unregistrierten Benutzern die Spamkommentare spätestens beim freischalten gelöscht werden.
Ist vielleicht ein kleines bißchen mehr arbeit, das Ergebnis jedoch sauberer und effektiver

6. Dies wird nicht der Fall sein. Und wenn doch, dann werde ich zur Not selbst Hand anlegen müssen. Aber ich werde es nicht zulassen, das Leute die meinen Blog mit sinnvollen Kommentaren bereichern, nicht mit PR belohnt werden sollten.

7. Seh ich ebenso. Nach dem Pagerank ist das wichtigste Kriterium für einen Spammer das Menschen die angepriesene Seite besuchen. Gibt es halt keinen Pagerank, gibt es immerhin mehr Besucher. Also werden die Domains a lá www.iaohfhklwe.com vielleicht noch ein Werbepopup schalten anstatt das spammen zu unterlassen. Solange die Seite der Spammer besucht wird, ist zumindest eins deren Ziele erreicht.

Alles in allem mache ich mir weniger Gedanken darum das mein Blog als eben solcher identifiziert werden könnte, wie Moe schreibt. Das ist mir egal, eigentlich sogar ganz recht. Auch die Zwei-Klassen Einteilung die Sascha Carlin beschreibt bereitet mir nicht wirklich Kopfzerbrechen. Was mich primär stört ist neben der Pseudo-Sicherheit die unerfahrene Blogbesitzer zu haben glauben vor allem die „Abstrafung“ derjeniger die, [wie ich hoffe, Ich mit diesem Beitrag ;) ] sinnvolle und themenrelevante Beiträge leisten, deren „Leistung“ durch rel="nofollow" keinerlei Anerkennung gezollt wird, dadurch das deren Links standardmäßig im Prinzip einfach ingnoriert werden

11 | Gerrit schreibt am 22. Januar 2005, 10:59:

Die Idee, die uns verkauft wird, ist ja folgende:

  • Spammer kommentieren in den Weblogs, damit ihre beworbenen Seiten bei Google im PageRank höher steigen.
  • Wenn wir die PageRank-Funktion für Weblog-Kommentare deaktivieren, fällt dies flach und die Websites der Spammer sinken im PageRank.

Doch so einfach ist es ja nicht, denn der PageRank ist ja nicht der einzige Grund für den Kommentarspam. Auch konventioneller eMail-Spam ist ja nicht für den PageRank konzipiert, sondern für den Menschen. Und der wird weiterhin den Kommentarspam lesen müssen, und einige Promille von Idioten unter den Usern werden weiterhin darauf klicken. Deshalb wird es sich weiterhin lohnen, in den Kommentaren zu spammen.

Es ist einfach naiv zu glauben, dass die Spammer schon von alleine aufhören, wenn sie nach einigen Monaten (oder Jahren) auch mal mitbekommen, dass der PageRank langsam absinkt. Was nur dann klappen wird, wenn auch tatsächlich genügend Leute nofollow einsetzen. Was nicht der Fall sein wird.

12 | Simon schreibt am 22. Januar 2005, 12:03:

Die meisten Spammer nehmen sich nicht die Zeit, Inhalte zu lesen. Dann werden sie sich auch eher nicht damit beschäftigen, ob das nofollow sinnvoll ist oder nicht. Jetzt werden sie aber von allen Seiten mit der PR-Meldung überflutet: "Wir haben eine Möglichkeit, Kommentarspam zu unterbinden." (So wird es ja verkauft.) Und dann würden sie sich zurückhalten oder nach anderen Möglichkeiten suchen ...

Das ist nur eine wilde Theorie. Aber meint ihr, das könnte zum Teil so passieren?

13 | Stefan schreibt am 22. Januar 2005, 13:07:

Das Nofollow-Attribut ist, egal wie man es betrachtet, vollkommen unausgegorener Schwachsinn - sofern man es als Mittel gegen Comment-Spam sieht.

Mal ernsthaft: Nur weil ich durch so ein schnödes Attribut eine PageRank-Bewertung des damit verzierten Links verhindere, deswegen lasse ich doch nicht den evtl. vorhandenen Comment Spam in meinem Blog stehen. Oder andersrum: Jeder halbwegs aktive Blogger sorgt doch sowieso dafür, dass sein Blog Spam-frei ist.

Ergo verbleiben als "Übeltäter" nur zwei Arten von Web-Sites, die maßgeblich zur Beeinflussung des PageRanks führen können: Solche, die explizit und nur zu diesem Zweck gebastelt wurden und solche, die - aus welchen Gründen auch immer - nicht gepflegt werden. Wie hoch ist nun die Wahrscheinlichkeit, dass dort das Nofollow-Attribut zum Einsatz kommt? Genau: ziemlich genau Null. Etwa auf selben Niveau bewegt sich die Sinnhaftigkeit des Einsatzes von Nofollow in einem gepflegten Blog. Denn hier werden sich nur echte Links finden, also solche, die den Besucher mit je nach Kontext weiterem nützlichem Content versorgen. Warum sollten die nicht PageRank-Punkte kassieren?

Dazu kommt noch, dass die meisten Spammer gerade die verwaisten Sites zuklopfen - und das sogar automatisiert. Selbstverständlich werden auch verwaiste Sites von Google und Konsorten indiziert. Meine grobe Schätzung ist, dass sich über 90% des Content Spam auf einer Menge verwaister Blogs findet, die insgesamt maximal 10% der Blogosphere ausmacht.

Nun mag es natürlich sein, dass Google & Co. aufgrund zunehmender Menge des Content Spams wachsende Probleme kriegen, die Masse an Links überhaupt noch zu verarbeiten. Das werden sie aber nicht dadurch in den Griff kriegen, dass sie per Nofollow-Attribut 10% weniger Spam indizieren müssen - schließlich bleiben die bereits erwähnten 90% auf den verwaisten Sites nach wie vor bestehen.

Wesentlich effektiver wäre es meiner Ansicht nach - wenn es denn schon eine Unterstützung der Bots durch den Blogger bedarf - einen Timestamp im Header der Site einzuführen. Bei regelmäßig oder oft genug aktualisierten Sites könnte der Bot dann von einem "gepflegten" Blog ausgehen und Links verfolgen. Wurde die Site aber lange nicht mehr aktualisiert könnte sich der Bot auf das Indizieren der echten Inhalte beschränken und das Verfolgen der Links unterlassen. Damit wären zumindest schon einmal die verwaisten Blogs aus dem Content-Spam-Rennen ohne dass deren echte Inhalte aus den Indizes verschwinden.

Das Problem mit explizit zum Zweck des Google-Bombings erstellten Sites bleibt dann allerdings immer noch. Nur: das dürfen die Suchmaschinen gerne selbst in den Griff kriegen.

15 | Stefan schreibt am 22. Januar 2005, 14:55:

Hi Jörg,

Ich glaube, ich muss meine Aussage ein wenig relativieren. So kann es nämlich durchaus sein, dass auch "gepflegte" (die Diskussion darüber, was ein gepflegtes Blog ist und was nicht gehört sicher woanders hin ...) Blogs Comment Spam enthalten - nämlich in den von dir erwähnten Postings aus der Steinzeit des Blogs. Wer seine Kommentare nicht regelmäßig/automatisch (z.B. per RSS-Feed derselben) auf Neueingänge auch im Altlasten-Bereich (*g*) prüft, tappt schnell in diese Falle. Allerdings greift auch hier der Nofollow-Tag nicht. Es sei denn, dieser würde von der verwendeten Software dynamisch und automatisch beim Abruf/Erstellen der Seite generiert. Selbst dann würde es bis zum nächsten Update durch den Betreiber dauern, bis die Maßnahme bleibt - was aber effektiv wieder nur einen im Promille-Bereich angesiedelten Erfolg repräsentieren dürfte.

Zu den Zeitstempeln: Im Header des HTML-Quellcodes meines Blogs findet sich sowas definitiv nicht. Wenn du auf den vom Betriebssystem beim Erstellen der Datei erzeugten Zeitstempel anspielst: Klar, allerdings heißt ein geänderter Zeitstempel nicht, dass sich auch an den Inhalten wirklich was geändert hat.

Was mir vorschwebt ist ein zusätzlicher Zeitstempel im Quellcode selbst. Dieser, in Verbindung mit beispielsweise einem MD5-Hash würde ein relativ einfaches Aussieben der "schwarzen Schafe" erlauben. Die Grobidee wäre etwa so:

1: Prüfen des vom Betriebssystem vergebenen Zeitstempels. Hat sich dieser geändert, geht es weiter zu 2, ansonsten zieht der Spider weiter.
2. Prüfen des "Content-Zeitstempels". Hat sich dieser geändert, geht es weiter zu 3 ansonsten zieht der Spider weiter
3. Erzeugen eines MD5-Hash über den Content der Seite. Hat sich dieser gegenüber der letzten bekannten Version geändert, wird die Seite indiziert, ansonsten zieht der Spider weiter.

Nun mag sich gleich die Frage stellen, wozu Schritt 2 eigentlich nötig ist. Antwort: Wenn mich grad die Arbeitswut überkommt und ich das Layout meiner Seite ändere, dann ändert sich auch der vom Betriebssystem vergebene Zeitstempel der jeweiligen Dateien. Da sich der Content jedoch nicht geändert hat bleibt der unter 2. erwähnte Zeitstempel im Quellcode trotzdem der gleiche, der Spider weiß also, dass es für ihn nichts zu tun gibt.

Jetzt könnten natürlich ganz Schlaue hergehen und beide Zeitstempel faken - technisch sicher kein großes Problem. Um das abzufangen dient der MD5-Hash über den Content (wobei ich damit wirkliche Inhalte meine, nicht den gesamten Quellcode der Seite). Hat sich dieser trotz geänderter Zeitstempel nicht verändert, hat man es ziemlich sicher mit einem schwarzen Schaf zu tun, dessen Seite man in Zukunft getrost ignorieren kann.

Zugegeben, dieser Ansatz steht und fällt mit der Definition - oder dem Ausfiltern - des unter 3. erwähnten "Content". Dazu fielen mir schon ein paar Optionen ein, aber da ich weder bei einem Suchmaschinen-Betreiber arbeite noch von diesen für meine Ideen bezahlt werde höre ich hier wieder auf, über die Problematik nachzudenken, da sie mich - genau wie das Nofollow-Attribut - nur peripher tangiert ;-)

16 | Pepino schreibt am 22. Januar 2005, 21:30:

Wie bereits vor einigen Tagen erwähnt: ich werde das ebenfalls keinesfalls einsetzen!

17 | Alex schreibt am 24. Januar 2005, 21:07:

Man bist du toll, ganz ganz großes Kino, du hast die Verschwörung schlechthin aufgedeckt, noch ein wenig mehr Selbstlob und du kriegst nen Orgasmus? Oh man...
Wenn du den unwichtigen Teil weggelassen hättest, wäre der Artikel nur 1/3...

18 | Tolle Seite schreibt am 18. Februar 2005, 12:12:

- sehr sinnvoll

Einfach persönlich kommentieren:



(wird NICHT angezeigt!)


Info speichern?


Bei der Formatierung hilft Textile2. - (Du kannst auch HTML verwenden)

(Achtung! Sende-Button im Vorschau-Fenster!)