Relevanzoptimierung
In den folgenden Kapiteln wird ein Überblick über gängige Methoden der Relevanzoptimierung von Webdokumenten gegeben. Die Methoden beziehen sich auf die in dieser Arbeit vorgestellten Ranking-Verfahren und lassen sich in On the Page Methoden und Off the Page Methoden der Optimierung einteilen. Mit den vorgestellten Methoden soll deutlich werden, welche konkreten Maßnahmen Webseiten-Betreiber durchführen müssen, um die Relevanz ihrer Webdokumente zu optimieren und dadurch ein besseres Ranking bei Google und auch bei anderen bedeutenden Suchmaschinen zu erzielen.
6.1 Grundlegende Aspekte der Optimierung
Um ein Dokument bei Suchmaschinen möglichst hoch zu positionieren, ist es erforderlich einige grundlegende Aspekte zu berücksichtigen. Grundsätzlich kann mit einem Dokument immer nur zu wenigen Suchbegriffen eine gute Rangposition erzielt werden. Von den hier vorgestellten Methoden sollten möglichst alle konsequent angewendet werden. Es reicht nicht aus nur eine oder zwei Methoden anzuwenden (Glöggler, 2003, S. 115).
Die Optimierung von Dokumenten ist eine langfristige Maßnahme, die ständig angewendet werden muss. Nur langfristig angelegte Strategien sichern eine gute Position. Eine einmal erreichte Rangposition unterliegt der permanenten Neubewertung durch die Ranking-Verfahren. Die eingesetzten Maßnahmen und Parameter sind an die sich ändernden Ranking-Verfahren und Algorithmen entsprechend anzupassen (Glöggler, 2003, S. 115).
Google gibt Richtlinien für Gestaltung und Inhalt als auch technische Richtlinien vor, die von Webseiten-Betreibern unbedingt eingehalten werden sollten. Darüber hinaus werden in den Qualitätsrichtlinien Hinweise gegeben, welche gängigen irreführenden oder manipulativen Praktiken vermieden werden sollten (Google, 2002b).
6.2 On the Page Methoden der Optimierung
On the Page Methoden werden zur Relevanzoptimierung auf die einzelnen Dokumente angewendet. Ziel ist es, Dokumente auf bestimmte Keywords so zu optimieren, dass sie bei Suchanfragen eine möglichst hohe Relevanzbewertung im Hinblick auf bestimmte Suchworte erhalten (Glöggler, 2003, S. 115).
6.2.1 Keyword-Strategie
Die wichtigste Aufgabe die ein Webseiten-Betreiber zu lösen hat, ist die Wahl von geeigneten Keywords. Der Inhalt eines Dokuments soll durch die Keywords optimal repräsentiert und gleichzeitig in entsprechender Wortwahl von Benutzern auch so gesucht werden. Von großer Bedeutung bei der Bestimmung von geeigneten Keywords ist eine genaue Kenntnis der angebotenen Produkte und Dienstleistungen, der fokussierten Zielgruppe sowie spezifischer Fachausdrücke, ihrer Synonyme als auch ihrer umgangssprachlichen Bezeichnungen. Die entscheidende Frage die gestellt werden muss, lautet:
„welche Begriffe verwenden potentielle Kunden, wenn sie mein Produkt oder meine Dienstleistung suchen?“(Glöggler, 2003, S. 126).
Empfehlenswert ist es, eine Liste aller möglichen Keywords zu erstellen, in die Fachbegriffe, Synonyme und umgangssprachlich verwendete Begriffe aufgenommen werden. Firmennamen eignen sich in den seltensten Fällen als Keywords. Geeigneter sind Gattungsbegriffe bzw. Begriffe die Produktkategorien beschreiben. Konkrete Artikelbezeichnungen sind nur dann als Keyword geeignet, wenn sie bei der Zielgruppe einen entsprechenden Bekanntheitsgrad besitzen (Glöggler, 2003, S. 126).
Für die endgültige Bestimmung von geeigneten Keywords sollten alle gefundenen Worte abschließend unter dem Aspekt betrachtet und ausgewählt werden, welches die häufigste Wortwahl der entsprechenden Zielgruppe ist, um das jeweilige Produkt oder die Dienstleistung über die Suchmaschine zu suchen. Ein einmal festgelegtes Keyword-Spektrum sollte einer permanenten kritischen Überprüfung unterliegen. Dies kann z.B. über die Analyse der Webserver Log Files geschehen, die Auskunft darüber geben ob die Besucher auch tatsächlich mit den gewählten Keywords auf die Webseite gelangt sind (Glöggler, 2003, S. 126f).
Oft versuchen Benutzer ihre Suchanfragen mittels Kombinationen von Suchwörtern genauer einzugrenzen. Wird beispielsweise ein „Hotel“ in „Stuttgart“ gesucht, so wird die Suchanfrage ziemlich sicher mit den Begriffen
Hotel + Stuttgart bzw. Stuttgart + Hotel
formuliert. Wenn das Hotel für den Benutzer noch weitere Voraussetzungen wie z.B. einen Wellness-Bereich oder die Angliederung an einen Golfplatz erfüllen soll, wird die Suchanfrage ziemlich wahrscheinlich
Hotel + Stuttgart + Wellness bzw. Hotel + Stuttgart + Golfplatz
lauten. Aufgabe bei der Bestimmung geeigneter Suchworte ist es also, Wortkombinationen so zu bestimmen, dass das Produkt- und Dienstleistungsspektrum aus dem Blickwinkel von Benutzern beschrieben wird (Glöggler, 2003, S. 127).
Die Anzahl von verschiedenen Keywords gilt als weiteres wichtiges Erfolgskriterium. Sehr viele Webseiten-Betreiber begehen den Fehler, ein Dokument für möglichst viele Suchbegriffe zu optimieren. Dokumente werden zwar aufgrund der Vorkommnis von Begriffen im Dokument Teil einer Suchanfrage, aber Kern aller TF-Rankingmethoden ist, dass ein Dokument immer dann im Ranking weit vorne liegt, wenn es ein Thema oder nur einige wenige Themen zum Schwerpunkt hat und diese durch wenige Keywords abgebildet werden. Glöggler empfiehlt „circa drei bis fünf Keywords verstärkt je Dokument einzusetzen, um eine Steigerung der Gewichtung für diese Begriffe zu erreichen“ (Glöggler, 2003, S. 128).
Ein Dokument wird bei der Optimierung auf einige wenige Keywords zwar nur Teil einiger weniger Variationen von Suchanfragen, aber dafür erreicht es eine wesentlich höhere Rangposition und erzielt dadurch eine höhere Anzahl an Besuchern (Glöggler, 2003, S. 128).
Im Hinblick auf eine optimale Keyword-Strategie gibt es noch weit mehr als die hier aufgeführten Aspekte zu berücksichtigen. So wird von Google auch die Keyword-Dichte, die Lage von Keywords sowie das Vorhandensein von Keywords in ALT-Tags (Alternativtext von Bildern) und Kommentaren berücksichtigt. Diese weiteren On the Page Methoden werden beispielsweise in Glöggler (2003, S. 144-151) beschrieben.
6.2.2 Auswahl des Dokumententyps
Suchmaschinen ermöglichen nur eine sehr eingeschränkte Auswahl an Textdateien zu indexieren. Wenn ein Dokument nicht einem definierten Dokumententyp entspricht, wird es auch nicht indexiert. Google unterstützt derzeit neben HTML, dem Standarddokumententyp im WWW, noch folgende weitere Dokumenttypen (Google, 2003j):
· Adobe Portable Document Format (pdf)
· Adobe PostScript (ps)
· Lotus 1-2-3 (wk1, wk2, wk3, wk4, wk5, wki, wks, wku)
· Lotus WordPro (lwp)
· MacWrite (mw)
· Microsoft Excel (xls)
· Microsoft PowerPoint (ppt)
· Microsoft Word (doc)
· Microsoft Works (wks, wps, wdb)
· Microsoft Write (wri)
· Rich Text Format (rtf)
· Text (ans, txt)
6.2.3 Dynamisch generierte HTML-Dokumente
Im Gegensatz zu statischen HTML-Dokumenten ist bei dynamisch generierten HTML-Dokumenten der Inhalt nicht fest in HTML-Tags eingebunden, sondern wird aus einer Datenbank ausgelesen und innerhalb einer vordefinierten Ausgabeseite dargestellt. Der Text wird über die Ausgabeseite in HTML eingebettet, damit ein HTML-Client das dynamisch erzeugte Dokument unproblematisch interpretieren kann (Glöggler, 2003,
S. 119).
Datenbankbasierte Webseiten beinhalten im URL oft Sonderzeichen wie „?“, „&“ oder „%“, gefolgt von Parametern. Ein Beispiel für eine dynamische URL ist:
http://www.philipp-wiedmaier.de/modules.php?name=Search
Suchmaschinen indexieren dynamisch erzeugte Dokumente nicht oder nur unter bestimmten Voraussetzungen (Glöggler, 2003, S. 119).
Google nimmt inzwischen teilweise auch dynamische Dokumente mit Parametern auf. Es ist allerdings nicht immer nachvollziehbar, nach welcher Logik Google vorgeht (Fischerländer, 2003, S. 84).
Google selbst weist in seinen Richtlinien für Gestaltung und Inhalt darauf hin, dass einige dynamisch erzeugte Dokumente im Unterschied zu statischen Seiten nicht indexiert werden. Es wird empfohlen wenige und kurze Parameter zu verwenden (Google, 2002b).
Es existieren verschiedene Lösungen um die Sonderzeichen umzuwandeln oder zu unterdrücken. Für den weit verbreiteten Apache Webserver kann dies beispielsweise mit dem Zusatzmodul mod_rewrite geschehen. Das Modul schreibt die vom Client aufgerufene URL nach vorgegebenen Regeln um und reicht diese dann an den Webserver weiter. Dadurch können auch dynamisch generierte Inhalte von Suchmaschinen indexiert werden. Eine ausführliche Abhandlung dieser Methode findet sich beispielsweise in Fischerländer (2003, S. 84).
6.2.4 Der Dokumententitel
Der Dokumententitel, der Text der im Head-Bereich eines Dokuments zwischen den title-Tags steht, ist für eine Dokument in vielfältiger Weise von außerordentlicher Bedeutung. Der Titel ist für den Benutzer im Kopf des Browsers immer sichtbar und stellt die einzigste Meta-Information innerhalb des Head-Bereichs dar, die im sichtbaren Bereich des Browsers erscheint. Nimmt ein Benutzer einen URL in die Favoritenliste seines Browsers auf, erscheint der Dokumententitel als Kurzinformation. Der Dokumententitel wird in der Suchergebnisliste als Verweis und Kurzreferenz für ein Dokument verwendet. Es ist deshalb wichtig, dass der Titel aussagekräftig ist, denn ein Benutzer wird einen Verweis nur verfolgen, wenn er ausreichend motiviert ist (Glöggler, 2003, S. 131f).
Für die statistischen Gewichtungsmodelle (vgl. Kapitel 4.2) stellt der Dokumententitel einen wichtigen Parameter dar. Google und alle anderen Suchmaschinen ordnen den Keywords, die sich im Dokumententitel befinden, eine hohe Bedeutung zu. Der Dokumententitel muss deshalb sehr sorgfältig bestimmt werden. Es müssen die Keywords im Titel aufgeführt werden, die den Inhalt des Dokuments am besten repräsentieren. Suchmaschinen indexieren Substantive und eliminieren Bindewörter, weshalb der Dokumententitel am besten ausschließlich aus Substantiven zusammengesetzt wird. Glöggler führt einige Beispiele von Dokumententiteln auf, die vermieden werden sollten:
· „Herzlich willkommen auf unserer Homepage“
· „Firma Maier, Engelbertstrasse 3, 80732 München“
· „Wir verkaufen schöne und aktuelle Mode“
Keines der aufgeführten Beispiele lässt eine automatisierte inhaltliche Bewertung des Dokuments zu. Die Titel sind gegebenenfalls für einen Webseiten-Betreiber sinnvoll, aber in keinem Fall geeignet eine gute Rangposition bei Suchmaschinen zu erreichen. Die Berücksichtigung des Firmennamens im Titel ist im Hinblick auf den Erfolg einer intuitiven Suche nur dann von Relevanz, wenn der Firmenname über einen entsprechend hohen Bekanntheitsgrad verfügt. Ist ein Markenname jedoch sehr bekannt, werden die Benutzer eher die direkte URL der Domain eingeben (Glöggler, 2003,
S. 133f).
Suchmaschinen erfassen nur eine sehr begrenzte Anzahl an Zeichen bzw. Worten des Titels, weshalb die zur Verfügung stehenden Zeichen (ca. 80 bis 200), ausschließlich dazu verwendet werden sollten, um Begriffe aufzuführen, die als Suchworte Relevanz besitzen. Straßennamen o.ä. sind im allgemeinen Verschwendung wertvollen Platzes (Glöggler, 2003, S. 134).
Wichtig ist, dass ein Dokumententitel über einen Bezug zum Text im Dokument verfügt. Wenn ein Begriff nur im Titel und nicht mehr im Text erscheint, hat er für Information Retrieval Systeme keinen Bezug zum Inhalt eines Dokuments. Ein Wort aus dem Dokumententitel muss also im Text selbst noch einmal vorkommen, um eine höhere Relevanz für das Dokument zu besitzen. Grundlage dieses Beurteilungsverfahren ist die Beobachtung, dass ein Autor für einen Text eine Überschrift so wählt, dass sie das Thema eines Textes wiedergibt. Wenn keines der verwendeten Wörter des Titels im Text noch einmal vorkommt, kann dies zu einer geringeren Gewichtung der Begriffe führen oder im Extremfall dazu, dass ein Begriff oder das gesamte Dokument nicht indexiert wird (Glöggler, 2003, S. 135).
6.2.5 Bedeutung der Meta-Tags
„Meta-Tags bieten komprimierte Informationen über Informationen“ (Glöggler, 2003, S. 137). Grundsätzlich dienen sie dazu, Textdokumente an Hand von bestimmten Angaben besser verwalten und verwerten zu können. Die Kommerzialisierung des WWW und damit verbunden, der Versuch von Webseiten-Betreiber möglichst viele Besucher auf eine Webseite zu bringen, führte schnell zu einem Missbrauch der Meta-Tags. In vielen Fällen wurden und werden auch heute noch in den Meta-Tags Angaben gemacht, die wenig mit dem Inhalt eines Dokuments zu tun haben und überwiegend nur dazu dienen, mehr Besucher auf eine Webseite zu bringen (Glöggler, 2003, S. 137).
Die Suchmaschinen reagierten auf diesen Missbrauch der Meta-Tags und berücksichtigten teilweise das Meta-Tag Keywords nicht mehr zur Bewertung des Inhalts. Google berücksichtigte es überhaupt noch nie (Glöggler, 2003, S. 137).
Da nur noch wenige Suchmaschinen Meta-Tags umfassend beachten und bei Google die Meta-Tags keinen Einfluss auf die Relevanz eines Dokuments haben, soll hier nicht weiter auf die einzelnen Meta-Tags eingegangen werden. Eine umfassende Abhandlung der Meta-Tags findet sich beispielsweise in Glöggler (2003, S. 137-144).
6.2.6 Textauszeichnung, Textgröße und Überschriften
Google differenziert die Wichtigkeit von Keywords innerhalb eines Textes in Abhängigkeit der verwendeten Schriftgröße, der eingesetzten Textauszeichnung sowie ihrer Verwendung als Überschrift. Im HTML-Code werden Überschriften über die Tags h1 bis h6 definiert. Die Bedeutung einer Überschrift richtet sich also nach dem verwendeten Tag, wobei h1 die höchste und h6 die niedrigste Bedeutung hat.
Im Hinblick auf die Textanalyse durch Retrievalsysteme sieht Glöggler (2003, S. 152) nachfolgende Tags als relevant an:
· bewirkt fett formatierten Text.
· bewirkt kursiv formatierten Text.
· bewirkt unterstrichenen Text.
· bewirkt größer formatierten Text.
· bewirkt hochgestellten Text.
· bewirkt fetten, hervorgehobenen Text.
Keywords die innerhalb dieser Tags stehen, werden von verschiedenen Information Retrieval Systemen stärker gewichtet, als ein Keyword ohne Textauszeichnung.
Google hat als eine der ersten Suchmaschinen Angaben zu einer unterschiedlichen Gewichtung von Text in Abhängigkeit ihrer Buchstabengröße gemacht. Es wird hierzu die im Text überwiegend verwendete Zeichengröße bestimmt und Begriffe die kleiner, oder größer dargestellt werden, schwächer bzw. stärker bewertet. Diesem Verfahren liegt die Überlegung zu Grunde, dass ein Autor eher wichtige Wörter größer und unwichtigere Angaben eher kleiner darstellt (Glöggler, 2003, S. 152).
6.2.7 Link-Strukturen und Verzeichnistiefe
Suchmaschinen haben ein berechtigtes Interesse möglichst alle Dokumente eines Webauftritts zu erfassen, sie zu bewerten und zu indexieren. Damit dies unproblematisch durchgeführt werden kann, ist es erforderlich eine Verweisstruktur zu erstellen, die es möglich macht alle Dokumente effizient zu erfassen. In diesem Zusammenhang werden oft zwei wesentliche Fehler gemacht. Einzelne Dokumente werden untereinander nicht immer so verlinkt, dass durch die Verfolgung der Verweise alle Dokumente erreichbar sind. Häufig werden bei großen Webauftritten von Zeit zu Zeit neue Dokumente hinzugefügt, die keinen Verweis von einem anderen Dokument erhalten. Das betreffende Dokument kann dann nicht indexiert werden (Glöggler, 2003, S. 153).
Ein weiteres Problem ist, dass Verweise ausschließlich über JavaScript oder über referenzierte Bilddateien erfolgen und damit die Erfassung von Dokumenten erschweren. Die Webrobot-Clients der Suchmaschinen haben grundsätzlich Schwierigkeiten JavaScript auszuwerten und damit auch die betreffenden Dokumente zu indexieren. Einfache Textverweise werden von Suchmaschinen vorgezogen (Glöggler, 2003, S. 153f).
Es empfiehlt sich eine zentrale Navigationsseite zu erstellen, die auf alle Dokumente einen Verweis richtet und die Text in den Hyperlinks beinhaltet, der den Inhalt des betreffenden Dokuments wiedergibt. Es ist meist ausreichend nur diese zentrale Navigationsseite bei den Suchmaschinen anzumelden, da über diese alle anderen Dokumente vollständig erfasst werden können. Diese Seite gilt es konsequent aktuell zu halten, da sie von den Suchmaschinen nach der Indexierung bevorzugt aufgesucht wird (Glöggler, 2003, S. 154).
6.2.8 Valides HTML
Bei fehlerhaftem oder unsauber programmierten HTML-Code besteht die Gefahr, dass die Suchmaschinen Texte und Keywords nicht in der gewünschten Form interpretieren und entsprechend erfassen. Die Suchmaschinen halten sich mit Informationen über Fehler die toleriert bzw. Fehler die nicht toleriert werden, sehr zurück. Das folgende Beispiel soll das Problem anhand von fehlerhaften Hyperlinks verdeutlichen:
http://www.hdm-stuttgart.de
Die Vielfalt an möglichen Fehlern ist speziell bei Hyperlinks enorm. Die Fehler erfolgen meist nicht aus Unkenntnis sondern aus Unachtsamkeit. Die Folgen sind oft gravierend. Im obigen Beispiel würde der Hyperlink nicht als solcher erkannt und das zugehörige Dokument könnte nicht indexiert werden (Glöggler, 2003, S. 161).
Schwierigkeiten bereiten oftmals auch WYSIWYG-Editoren (What you see is what you get), deren Trend zu properitären HTML-Tags vor allem vom US-Unternehmen Microsoft gepflegt wird. Die HTML-Tags ermöglichen zwar eine Erweiterung der Darstellungsmöglichkeiten, die Mehrzahl der Suchmaschinen orientiert sich aber ausschließlich an den offiziellen W3C.org HTML- und XML-Standards, was zu Problemen bei der Interpretation von nicht offiziellen Tags führen kann (Glöggler, 2003, S. 161f).
Die Erstellung von sauberem und fehlerfreiem HTML-Code muss bei der Programmierung berücksichtigt werden. Insbesondere sind die Vorgaben des World Wide Web Consortiums (W3C) zu beachten. Die Validierung dieser Vorgaben kann z.B. mit dem vom W3C zur Verfügung gestellten HTML-Validator vorgenommen werden (Glöggler, 2003, S. 162).
6.2.9 Cookies und Log In
Cookies (Textdateien, die vom Server an den Client übertragen werden) dienen dazu einen Client beim nochmaligen Besuch einer Webseite zu identifizieren. Beim Einsatz von Cookies muss beachtet werden, dass Suchmaschinen Cookies nicht akzeptieren und deshalb Webseiten, die für die Übertragung eines Dokuments Cookies benötigen, nicht indexieren (Glöggler, 2003, S. 165).
Bei einem Log In-Verfahren werden bestimmte Dokumente nur übertragen wenn sich ein Client mittels korrekter Log In-Daten (Benutzername und Passwort) authentifiziert. Da Suchmaschinen aber nicht über diese Log In-Daten verfügen, können folglich diese Dokumente nicht indexiert werden (Glöggler, 2003, S. 165).
6.3 Off the Page Methoden der Optimierung
Im Gegensatz zu den On the Page Methoden (vgl. Kapitel 6.2), beziehen sich Off the Page Methoden nicht direkt auf den Inhalt oder Aufbau eines Dokuments, sondern auf die Systematiken des Hypermedia. Darunter fallen alle Möglichkeiten zur Beeinflussung der Gewichtung, die sich durch die gegenseitige Vernetzung der HTML-Dokumente im Internet und durch die Parameter und Protokollinformationen des Anwendungsprotokolls HTTP ergeben (Glöggler, 2003, S. 169).
6.3.1 Domain-Name und Bezeichnung der Verzeichnisse
Keywords, die sich im URL befinden, werden von einigen Suchmaschinen besonders hoch bewertet. Auch Google berücksichtigt Keywords im URL. Wird der Aufbau eines URL im Hinblick auf Keywords betrachtet, so kann dieser in einen Domain-Namen, der Bezeichnung der Verzeichnisse und einen Dokumentennamen eingeteilt werden. Der gesamte URL kann somit verwendet werden, um Keywords, die zum Dokumententitel und Dokumenteninhalt konsistent sind, zu positionieren und dadurch eine verbesserte Gewichtung der Keywords zu erreichen (Glöggler, 2003, S. 169).
Der wichtigste Teil der URL ist der Domain-Name. Ein Webseiten-Betreiber will verständlicherweise seinen Firmennamen als Domain-Name abbilden. Der Firmenname weist aber oft nicht die gewünschten Keywords auf. Um dieses Problem zu umgehen könnten mehrere Domain-Namen verwendet werden, die auf ein und dieselbe Webpräsenz verweisen. Während der Domain-Name mit dem Firmennamen die Domain an Kunden kommuniziert, wird der Domain-Name mit den Keywords für die Indexierung eingesetzt. Nachfolgendes Beispiel soll dies verdeutlichen:
· Firmen-Domain:
(1) www.firma.de
· Domain für die Suchmaschinen:
(2) www.netzwerkschrank.de
(3) www.netzwerkschrank.com
(4) www.firma-netzwerkschrank.de
Domain (1) ist für Kunden ausgelegt, die das Unternehmen über den Firmennamen suchen. Die Domains (2) bis (4) sind für die Indexierung durch die Suchmaschinen gedacht (Glöggler, 2003, S. 170).
Keywords im Verzeichnisnamen oder im Dokumentnamen werden schwächer bewertet als Keywords im Domain-Namen, sollten aber dennoch berücksichtigt werden. Für obiges Beispiel würden sich folgende URLs ergeben (Glöggler, 2003, S. 170):
(2) www.netzwerkschrank.de/netzwerkschrank/netzwerkschrank.html
(3) www.netzwerkschrank.com/netzwerkschrank/netzwerkschrank.html
(4) www.firma-netzwerkschrank.de/netzwerkschrank/netzwerkschrank.html
6.3.2 Aktualität und Änderungsfrequenz
Dokumente, die einer häufigen Änderung unterliegen und aktuelle Inhalte bieten, werden von Suchmaschinen bevorzugt und höher bewertet als Dokumente die nur selten aktualisiert werden. Hintergrund ist, dass die Aktualität von Informationen wesentlichen Einfluss auf die Qualität der Suchergebnisse hat. Das Erstellungs- bzw. Änderungsdatum (Last-Modified-Date) eines Dokuments kann von Suchmaschinen sehr einfach festgestellt werden. Mithilfe eines speziellen HTTP-Befehls (if-modified-since) können Suchmaschinen bestimmen, dass nur Dokumente übertragen werden, die nach einem bestimmten Datum verändert wurden (Glöggler, 2003, S. 171ff).
Webseiten-Betreiber müssen berücksichtigen, dass ein Dokument nicht unendlich lange unverändert bleiben darf. Eine Veränderung des Änderungsdatums durch einen simplen Öffnen und Sichern Vorgang ist dabei wenig wirkungsvoll. Vielmehr müssen auch inhaltliche Änderungen vorgenommen werden, da bei der Erfassung für jedes Dokument u.a. auf Basis des Inhalts eine Check-Summe errechnet wird, die es ermöglicht inhaltliche Änderungen festzustellen. Die Checksumme muss verändert sein, damit ein Dokument als inhaltlich aktualisiert gilt. Dynamisch erzeugte HTML-Seiten weisen kein Änderungsdatum aus, weshalb für sie keine Änderungsfrequenz berechnet werden kann (Glöggler, 2003, S. 174).
6.3.3 Optimierung des PageRanks
Das für das Ranking bei Google dominierende PageRank-Verfahren (vgl. Kapitel 5) stellt das vermutlich am schwersten zu beeinflussende Gewichtungsverfahren dar. Die einzige Möglichkeit den PageRank der eigenen Webdokumente zu optimieren sind ausreichend viele und qualitativ hochwertige Verweise von anderen Webdokumenten. Dies kann nur durch Mithilfe von anderen Webseiten-Betreibern geschehen (Glöggler, 2003, S. 178f).
Um herauszufinden welche und wieviele Webdokumente auf eine Webpräsenz verweisen, kann bei Google das Schlüsselwort link: verwendet werden. Nach dem Schlüsselwort muss die entsprechende URL eingegeben werden. In Abb. 17 wird ersichtlich, dass 979 Webdokumente auf www.hdm-stuttgart.de verweisen.
Verschiedene Webseiten-Betreiber versuchen über zahlreiche Webseiten unter verschiedenen Domain-Namen und IP-Adressen die Anzahl der eingehenden Verweise für die zu promotende Webpräsenz zu erhöhen. Es wird dabei aber nicht berücksichtigt, dass diese selbst erstellten Webseiten nur eine sehr geringe Wirkung erzielen können, da ihnen i.d.R. selbst Verweise aus dem Web fehlen, die entsprechend weitergegeben werden können. Glöggler verdeutlich dies:
„Ein Dokument, das selbst einen hohen PageRank Wert hat, gibt auch einen entsprechend höheren Wert weiter. Aus diesem Grund ist es hilfreicher, einige wenige Verweise von hoch bewerteten Webseiten zu erwirken, als viele Verweise von unbedeutenden Dokumenten“ (Glöggler, 2003, S. 181)
Es gilt auch zu beachten, dass gegenseitig verlinkte Dokumente von Google als Zirkelbezug interpretiert und nicht gewertet werden. Ein Zirkelbezug entsteht, wenn ein Dokument, das einen Verweis von einem anderen Dokument erhalten hat, wieder direkt oder indirekt auf das verweisende Dokument verweist. In nachfolgendem Beispiel ist ein Zirkelbezug dargestellt:
Da Dokument D wieder auf A verweist, entsteht ein Zirkelbezug, der dazu führt, dass letztendlich keines der vier Dokumente einen PageRank-Wert erhält. Google erkennt Zirkelbezüge also auch über mehrere Dokumente hinweg und wertet keine Weitergabe von PageRank-Werten (Glöggler, 2003, S. 180).
Von besonderer Bedeutung für Google sind auch die Begriffe, die den klickbaren Text eines Hyperlinks bilden. Enthält dieser klickbare Text ein Keyword, das einen Bezug zum Inhalt des Dokuments hat, wird dem Verweis ein höherer Wert zugewiesen (Glöggler, 2003, S. 182).
Ein Optimaler Hyperlink für ein einzelnes Keyword ist also beispielsweise
Keyword
Nicht geeignet ist beispielsweise folgender Hyperlink:
hier klicken
Bei einigen Webseiten kann es vorkommen, dass diese keinen PageRank-Wert aufweisen. Dieser PageRank 0 (PR0) kann auf zwei Ursachen zurückzuführen sein (Wimmeroth & Brochhagen, 2003, S. 21):
· Es handelt sich um ein Webdokument, dass zwar von Google indexiert wurde, aber keinen eingehenden Verweis besitzt.
· Es handelt sich um eine „Bestrafung“ durch Google.
Im zweiten Fall reagiert Google auf unzulässige Maßnahmen (Spam) wie beispielsweise Keyword-Stuffing (übermäßige Wiederholung von Schlüsselwörtern im Dokument) oder Cloaking (Server basierte Systematik, die unterschiedliche Dokumente in Abhängigkeit des anfragenden Clients auf einen HTTP-Request liefert) (Glöggler, 2003, S. 187-197).
Es ist also neben den Optimierungsmöglichkeiten auch wichtig bestimmte unzulässige Maßnahmen zu unterlassen, da Google diese Maßnahmen erkennt und im Hinblick auf das Ranking entsprechend reagiert.
Dieser Artikel ist ein kleiner Auszug meiner Studienarbeit “Relevanzoptimierung und Ranking-Verfahren der Suchmaschine Google”
Download der kompletten Studienarbeit (mit Abbildungen):
http://www.wissen24.de/vorschau/25665.html
Mehr Info zu Relevanzoptimierung






