Canonical URL – ein Google & Domain-Problem vom Tisch
04.05.2007 | Google | 4 Kommentare | Print
Canonical URL - etwas Hintergrund zu Googles Update Aktivitäten bringen Informationen und Hintergründe zu diesem Begriff. Mit ein paar Handgriffen sind mögliche Probleme zugleich suchmaschinenfreundlich vom Tisch.
Wer sich etwas auf die Suche nach den Hintergründen des beschriebenen Google Pagerank Updates macht, findet neben anderen Vermerken den Begriff Canonical URL. Und obwohl das Thema rund um Googles Problem mit eben diesen URLs bereits einen längeren Bart hat, dürfte es andererseits auch heute bei einigen Schulterzucken und fragende Blicke verursachen. Schauen wir mal hinter das Problem.
Bereits vor dem Zeitalter der Blogs war bekannt, dass die Startseite einer Domain durch verschiedene Webseiten abgebildet und aufrufen werden kann:
- www.canonical-url.de
- canonical-url.de/
- www.canonical-url.de/index.html
- canonical-url.de/home.asp
Während alle diese URLs in den meisten Fällen rein physisch dieselbe Datei aufrufen, sah Google diese Dateien bisher als verschiedene Seiten an. Der Google-Ingenieur Matt Cutts schrieb dazu unter anderem seine Empfehlung SEO Advice: Url Canonicalization. Viele andere Webseiten und Weblogs haben zu ähnlichen Themen berichtet.
Das Problem einfach persönlich vom Tisch
In der Anfangszeit von einfach-persoenlich.de wurde ich aufmerksam darauf, dass die Blogger nicht alle meine Domain mit derselben Adresse verlinkten. Verschiedene Schreibweisen der Links sorgten für unterschiedliche Zieladressen. Kurzerhand habe ich per htaccess-Datei alle diese Einträge auf eine Spur gebracht. Ich entschied mich damals für die Schreibweise mit www“, das wesentlich mehr Links auf eben diese Domain zeigten als auf die Domain ohne www“.
- RewriteEngine On
- RewriteBase /
- RewriteCond %{HTTP_HOST} ^einfach-persoenlich.de [NC]
- RewriteRule ^(.*)$ http://www.einfach-persoenlich.de/$1 [R=301,L]
Vergleichbare Lösungen gibt es natürlich auch, so z.B. für PHP.
Canonicalization Update & weitere Tools
Im März 2007 veröffentlichte Matt Cutts eine Information zum bevorstehenden Canonicalization update von Google. Auch diese enthalten wieder unter anderem Hinweise, wie man technisch diesen Problemen Herr werden kann:
- Cleaning Up Canonical URLs With Redirects
- How to perform 301 redirects in Apache .htaccess, IIS, PHP, ASP and ColdFusion
Zum Thema Canonical URL gibt es auch Lösungsansätze für Wordpress in Form von WP-Plugins:
Auch eine Firefox Extension existiert zu diesem Thema.
Diese allerdings ist schon etwas älter.
(Un)heimlich aber wahr!
Immer wieder stolpere ich per Zufall beim Aufruf von (Kunden-)Domains darüber, dass die Domain zwar mit www, nicht jedoch ohne aufzurufen ist. Mag dies Nachlässigkeit sein oder einfach nur Unkenntnis, mit ein wenig Aufwand klappt nicht nur mit Google, sondern auch mit dem Nachbarn beim Aufruf der Seiten.
War der Artikel für Euch wertvoll? Wollt Ihr Euch den Beitrag als Bookmark merken?
Einfach RSS-Feed abonnieren oder das Lesezeichen mit anderen Menschen teilen:
Kommentare und verweisende Trackbacks
zum Beitrag: Canonical URL – ein Google & Domain-Problem vom Tisch
Kommentare
1 | Jan schreibt am 04.05.2007, 16:17:
Interessant für Apache-User ist in diesem Zusammenhang auch die Direktive RedirectMatch, die bei mcanerin.com erklärt wird.
2 | Sam schreibt am 05.05.2007, 16:33:
"...sah Google diese Dateien bisher als verschiedene Seiten an..."
Wurde das Problem nun durch Google gelöst? Oder hat sich da nichts geändert?
3 | Simon Erdem schreibt am 08.05.2007, 08:26:
ja was ist denn nun? irgendwie hast du nur Dinge erzählt die man schon wußte.
http://www.skoom.de/index.php
http://www.skoom.de/
http://skoom.de/
haben alle den PR5 doch nur www.skoom.de ist im Index. Auf meiner Seite ist dies schon sehr lange so, Google muss also irgendwie mitgekriegt haben das die Seiten identisch sind und hat sich nur die "richtige" gemerkt. Aber mich würde echt interessieren wie denn nun der Regelfall aussieht.
4 | Jörg schreibt am 08.05.2007, 18:03:
@Simon: Sorry, dass ich Deinen Kommentar aus dem Blick verloren habe, aber es soll auch noch andere Prioritäten geben, als immer nur den Blogleitfaden zu folgen... :))
Irgendwie scheint Dich das Thema aber brennend zu interessieren.
- Warum interessierst Du Dich so sehr dafür?
Wie auch immer Google damit umgeht, es ändert an der Behandlung Deiner Seite gar nichts. Das ist alles, was zählt.
Die Seiten waren schon immer doppelter Content und sind spätestens seit Google seinen Doublicate Content Algo verbessert hat ganz klar bereits aus der Wertung gefallen.
Für den normalen Webseitenbetreiber haben diese feinen Unterschiede eh noch nie etwas bedeutet. Nur eben der Missbrauch hat wieder einmal einen Riegel vor die Tür erzwungen.
BTW, versetz Dich doch einfach ein wenig in die Denke von Google. Du willst den Missbrauch eindämmen, doppelten Content vermeiden und bist ein technoligie- und algorithmengeprägtes Unternehmen.
Also veränderst Du die Bedingungen für alle, schließt einige Seiten aus und lebst damit, das einige Webseitenbetreiber auch mit Nachteilen leben müssen. Die große Zahl der Seiten und die Masse des Effektes macht es wett.
Und die Jammerei kommt eh nur aus der Ecke derer, die sich der Nutzung dieses Effektes auf ungewohnte Weise bedient haben. Für alle anderen gibt es ein kleine htaccess und fertig der Lack.
:)
Oder?
Trackback-URL: http://www.einfach-persoenlich.de/m33/etb.cgi/2172
Einfach persönlich kommentieren:
Kommentare des Beitrages per RSS-Feed verfolgen?
Mit dem RSS-Kommentar-Feed kannst Du die Kommentare dieses Beitrages einfach persönlich verfolgen und im Blick behalten, einfach:

