Digital-Nirvana.de





PageRank – Das Herzstück der Google-Technologie

14. August 2004 02:30 - Digital-Nirvana

In den folgenden Kapiteln wird das dominierende Verfahren zur Relevanzbewertung von Dokumenten, Googles PageRank, vorgestellt. Es soll ein möglichst breiter Überblick über alle Aspekte des Verfahrens gegeben werden. Neben dem theoretischen Ansatz von PageRank wird der zugrundeliegende Algorithmus behandelt. Für die Relevanzoptimierung von Webdokumenten ist eine detaillierte Kenntnis dieses Verfahrens hilfreich.

5.1 Theoretischer Ansatz von PageRank

PageRank (PR – zur Entstehung und Begriffsklärung vgl. Kapitel 3.1.1)
„[...] basiert auf der in der akademischen Welt geltenden Prämisse, dass die Wichtigkeit einer Forschungsarbeit daran gemessen werden kann, wie oft sie in anderen Arbeiten zitiert wird“ (Calishain & Dornfest, 2003, S. 330).
Diese Prämisse wurde von den beiden Google-Gründern Brin und Page einfach auf das WWW übertragen. Die Wichtigkeit eines Webdokuments lässt sich also an der Anzahl der Hyperlinks messen, die von anderen Webdokumenten darauf verweisen (Calishain & Dornfest, 2003, S. 330).
Google stellt das Kernprinzip von PageRank selbst wie folgt dar:
„Im Wesentlichen interpretiert Google ein Link von Seite A auf Seite B als ’Votum’ von Seite A für Seite B. Google bewertet die Wichtigkeit einer Seite nach den erzielten Voten. Außerdem analysiert Google die Wichtigkeit der Seite, die das Votum abgegeben hat. Dabei hat ein Votum von einer Seite, die selbst als ’wichtig’ gewertet wird, ein größeres Gewicht und somit größeren Einfluss auf die Bewertung anderer Seiten. Wichtige, qualitativ hochwertige Seiten werden von PageRank höher eingestuft und demnach auch in den Ergebnissen an einer vorderen Position aufgeführt“ (Google, 2003d).
Die Gewichtung eines Votums ist bei Google also davon abhängig, welchen PageRank und damit wie viele eigene Votes das verweisende Webdokument erhalten hat. Der PageRank selbst drückt sich als Ergebnis in einem numerischen Wert aus (Glöggler, 2003, S. 82) und wird durch einen Algorithmus berechnet (vgl. Kapitel 5.2).

5.2 Der PageRank-Algorithmus

Das PageRank-Verfahren kann an Hand des 1997 veröffentlichten Algorithmus erläutert werden. Es ist verständlich, dass der ursprünglich veröffentlichte Algorithmus an die fortschreitende Entwicklung im WWW angepasst wurde und ständig modifiziert wird (Glöggler, 2003, S. 83).

5.2.1 Definition des PageRank-Algorithmus

Der ursprüngliche PageRank-Algorithmus wurde von den Google-Gründern Larry Page und Sergey Brin wie folgt definiert (Glöggler, 2003, S. 83):

PR(A) = (1 – d) + d(PR(T1)/C(T1) + ….PR(Tn)/C(Tn))

Hierbei ist:
PR(A) = der PageRank Wert von A berechnet aus allen eingehenden Verweisen.
A = das Dokument für den der PageRank Wert ermittelt wird.
d = ein Dämpfungsfaktor zwischen 0 und 1 (oftmals ~ 0,85).
PR(T1) = der PageRank Wert des Dokuments T1 das auf A verweist.
C(T1) = die Gesamtanzahl aller ausgehenden Verweise von T1.

„PR(TN)/C(Tn) bedeutet, dass der Verweiswert für jede Seite die auf A zeigt, aus dem PageRank der Seite n, unter Berücksichtigung der Anzahl aller ausgehenden Verweise von Tn berechnet wird“ (Glöggler, 2003, S.83).

Aus der Formel wird ersichtlich, dass es sich bei PageRank um eine iterative Berechnung des Wertes PR(A) handelt, da zur Berechnung zunächst alle PageRank-Werte PR(n) derjenigen Dokumente erforderlich sind, die auf A verweisen (Glöggler, 2003, S. 83).
Ein neu indexiertes Dokument besitzt also zunächst keinen PageRank. Diesem Problem wird mit der Zuordnung eines initialen Wertes begegnet, welcher durch Statistische Gewichtungsmodelle wie TF (vgl. Kapitel 4.2.2) oder einer differenzierten Bewertung der Position von Schlüsselwörtern (vgl. Kapitel 4.2.4) bestimmt werden kann. Der Dämpfungsfaktor d stellt innerhalb des Algorithmus eine Individualisierungsvariable dar und reflektiert den Faktor, den ein Dokument einem anderen Dokument von dem eigenen Wert zuweisen kann. Die Individualisierungsvariable dient zur Feineinstellung der Berechnungsmethode und bedeutet, dass ein Dokument einem anderen Dokument durch einen ausgehenden Verweis nicht seinen vollen Wert zuweisen kann. (Glöggler, 2003, S. 84).

5.2.2 Iterative Berechnung des PageRanks

Das iterative Verfahren der PageRank-Berechnung soll an Hand eines Beispiels mit den vier Dokumenten A, B, C, D verdeutlicht werden:

In der Ausgangssituation erhält jedes Dokument zur Vereinfachung den PageRank-Wert 1. Die unterschiedlichen, ausgehenden Verweise werden durch die Pfeile dargestellt. Zunächst wird der Dämpfungsfaktor d mit einem Wert von 0,85 angewendet.
Der PageRank-Wert für die Dokumente wird dann wie folgt berechnet (Glöggler, 2003, S. 84f):
· Dokument A: Der um d bereinigte Wert für Verweise von A ist
d * PR(TA) = 1 * 0,85 = 0,85. Da A auf zwei Dokumente verweist, ist
d (PR(TA)/C(TA)) = 0,85 / 2 = 0,425. Als Ergebnis des iterativen Prozesses wird also den Dokumenten B und C jeweils der Wert 0,425 zu ihren bisherigen Werten zugewiesen.
· Dokument B: Dokument B besitzt nur einen ausgehenden Verweis. B weist also dem Dokument C am Ende des iterativen Prozesses den Wert 1 x 0,85 = 0,85 zu.
· Dokumente C und D: Dokument C besitzt einen ausgehenden Verweis auf A, weshalb der Wert des Verweises auf A gleichfalls 0,85 ist. Analog ergibt sich der Wert für den Verweis von D auf C.

In Abbildung 13 wird ersichtlich wie sich die einzelnen PageRank-Werte der Dokumente nach der ersten Iteration entwickeln. Da der Kern des PageRank-Verfahrens darauf beruht, dass besser verlinkte Dokumente auch einen höheren Wert zugewiesen bekommen, wird der iterative Prozess mindestens ein zweites Mal durchgeführt. Bei erneuter Anwendung des Verfahrens ergeben sich folgende PageRank-Werte:

Abbildung 14: PageRank – zweite Iteration (Glöggler, 2003, S. 86)
Das Ergebnis zeigt auf, dass die Dokumente auf die am häufigsten verwiesen wird, den höchsten PageRank-Wert erhalten. Dokument D erhält keinen Verweis von einem anderen Dokument und weist deshalb auch bei mehrmaligen Iterationen immer nur den initialen Wert aus (Glöggler, 2003, S. 86).
Bereits nach wenigen Iterationen ergibt sich eine sehr gute Näherung an die tatsächlichen Werte. Um den PageRank für das komplette WWW zu berechnen werden von Larry Page und Sergey Brin ca. 100 Iterationen als hinreichend genannt (Sobek, 2002).

5.2.3 Das Random Surfer Modell

Die Google-Gründer rechtfertigen in ihren Veröffentlichungen den PageRank-Algorithmus mit einem Modell zur Abbildung des Benutzer-Verhaltens, dem sog. Random Surfer Modell. Dabei führen sie einen Zufalls-Surfer an, der von einer Webseite zur nächsten jeweils beliebige Verweise verfolgt, ohne dabei auf die Inhalte zu achten (Sobek, 2002).
Die Wahrscheinlichkeit mit der sich der Zufalls-Surfer auf einer Webseite befindet, lässt sich aus dem PageRank der Webseite herleiten. Ein bestimmter Verweis wird von dem Zufalls-Surfer nun verfolgt, wobei sich die Wahrscheinlichkeit, welcher Verweis verfolgt wird, einzig und allein aus der Anzahl der Verweise ergibt, aus denen der Benutzer auswählen kann. Aufgrund dessen fließt der PageRank einer verweisenden Webseite stets nach der Anzahl der ausgehenden Verweise gewichtet in die Berechnung des PageRanks einer Webseite, auf die verwiesen wird, ein (Sobek, 2002).

Die Wahrscheinlichkeit, dass der Zufalls-Surfer auf eine Webseite gelangt, ist also die Summe der Wahrscheinlichkeiten, mit der er von einer verweisenden Webseite den entsprechenden Verweis verfolgt. Die Wahrscheinlichkeit mit der ein Zufalls-Surfer auf eine Webseite gelangt wird um den Faktor d gedämpft. Die Dämpfung erfolgt aufgrund der Tatsache, dass ein Zufalls-Surfer nicht unbegrenzt viele Verweise verfolgt, sondern nach einer bestimmten Zeit eine beliebige andere Webseite aufruft. Je höher d ist, um so wahrscheinlicher ist es, dass der Zufalls-Surfer Verweise verfolgt. Da nach dem Abbruch der Verweis-Verfolgung eine beliebige Webseite aufgerufen wird, geht die Wahrscheinlichkeit mit der ein Benutzer dies durchführt, mit dem Wert (1-d) als Konstante in die Berechnung des PageRanks jeder Webseite mit ein (Sobek, 2002).

5.2.4 Weitere Einflussfaktoren im Rahmen des PageRank-Verfahrens

Für die Berechnung des PageRanks sind noch weitere Einflussfaktoren als nur die einfache Verweis-Struktur des WWW zu berücksichtigen. Larry Page selbst skizziert in der Patentschrift (Page, 1998) zum PageRank-Verfahren die folgenden potentiellen Einflussfaktoren (Sobek, 2002):
· Die Stärke der Hervorhebung eines Verweises
· Die Position eines Verweises innerhalb des Dokuments
· Die Distanz zwischen Webseiten
· Die Bedeutung eines verweisenden Dokuments
· Die Aktualität eines verweisenden Dokuments

Welche dieser Faktoren tatsächlich in das PageRank-Verfahren implementiert sind, ist empirisch kaum zu belegen. Die Implementierung würde zunächst auf bessere Annäherung des Random Surfer Modells (vgl. Kapitel 5.2.3) an tatsächliches Nutzerverhalten abzielen. Durch die Einbeziehung von Hervorhebung und Position eines Verweises wird berücksichtigt, dass ein Benutzer nicht völlig unüberlegt einen Verweis anklickt, sondern unabhängig vom Ankertext eher deutlich erkennbare und unmittelbar sichtbare Verweise verfolgt. Durch die anderen Faktoren könnte Google eine weit größere Flexibilität in der Bestimmung der Bedeutung eines eingehenden Verweises für eine Webseite erreichen (Sobek, 2002).

Glöggler sieht neben der Anzahl der eingehenden Verweise insbesondere die Qualität der verweisenden Seite als weiteren Einflussfaktor an:
„Die Qualität einer Seite kann sich z.B. durch ihre besondere Bedeutung im Web oder durch eine thematische Ähnlichkeit zum Verweis ausdrücken. Besondere qualitative Bedeutung für Google haben in diesem Zusammenhang intellektuell bewertete Webkataloge wie z.B. Yahoo oder der Katalog des Open Directory Project, die manuell einen besonders hohen Page-Rank-Wert zugeordnet bekommen haben“ (Glöggler, 2003, S. 86).

5.2.5 Problematik des Konzepts

Google erzielt durch das PageRank-Verfahren hervorragende Suchergebnisse. Allerdings bringt das Konzept auch eine Reihe von Problemen mit sich. Neue Webseiten können zu Beginn nur durch den kombinierten Einsatz weiterer Gewichtungsmethoden, wie beispielsweise dem Term Frequency Algorithmus (vgl. Kapitel 4.2.2) oder einer differenzierten Gewichtung von Keywords in Abhängigkeit ihrer Lage (vgl. Kapitel 4.2.4), eine relativ gute Platzierung bei Google erhalten (Glöggler, 2003, S. 182).
Mittelfristig werden bei einem dominierenden Einsatz des Verfahrens bereits bekannte Webseiten bevorzugt. Hochwertige, aber weniger bekannte Webauftritte werden dementsprechend benachteiligt. Google und andere Suchmaschinen, die Link Popularity einsetzen, begegnen dem Problem mit einer mittlerweile reduzierten Dominanz des Verfahrens und setzen weiterhin auch auf Statistische Gewichtungsmodelle (vgl. Kapitel 4.2). Im Hinblick auf die Relevanzoptimierung stellt PageRank aber nach wie vor das entscheidende Verfahren zur Relevanzbewertung von Dokumenten dar (Glöggler, S. 178-182).

5.3 Möglichkeiten den PageRank einzusehen

Für Webseiten-Betreiber ist es wichtig den aktuellen PageRank der eigenen Webdokumente zu kennen, um dadurch auch die Wirksamkeit von Relevanzoptimierungen kontinuierlich überprüfen zu können. In der Suchergebnisliste von Google (vgl. Kapitel 4.1.3) wird der numerische PageRank-Wert allerdings nicht angezeigt. Um diesen in Erfahrung zu bringen ist entweder eine Suche im Google-Verzeichnis oder die Nutzung der Google Toolbar erforderlich.

5.3.1 PageRank-Wert über das Google-Verzeichnis

Das Google-Verzeichnis ermöglicht eine katalogbasierte Suche, wobei Webseiten bestimmten Kategorien zugeordnet sind. Die Kategorien enthalten wiederum Unterkategorien. Der Aufbau ist dem Verzeichnis von Yahoo ähnlich. In der tiefsten Ebene wird eine Trefferliste mit direkten Links angezeigt, wobei der PageRank als kleiner, grüner Farbbalken links neben dem Link [1] dargestellt wird (Wimmeroth & Brochhagen, 2003, S. 19). Die Links werden nach absteigendem PageRank [2] aufgelistet (Google, 2003i):

Die Anzeige erfolgt auf einer Skala von 1 bis 7 (höchster Wert = 7), wobei der genaue numerische Wert nicht angezeigt wird. Er kann aber über die zweigeteilte Balkengrafik bzw. die Breite von deren Einzelgrafiken bestimmt werden (Sobek, 2002).

5.3.2 PageRank-Wert über die Google-Toolbar

Die Google Toolbar ist ein Browser-Plugin für den Microsoft Internet Explorer, welches komfortable Suchfunktionen bereitstellt. Zum Funktionsumfang zählt die Darstellung des PageRanks der aktuell besuchten Webseite (vgl. Abb. 16). Im Gegensatz zum Google Directory werden bei der Toolbar Abstufungen zwischen den numerischen Werten 0 bis 10 vorgenommen (höchster Wert = 10). Die Toolbar kann kostenlos von Google bezogen werden (Google, 2004f).

Dieser Artikel ist ein kleiner Auszug meiner Studienarbeit “Relevanzoptimierung und Ranking-Verfahren der Suchmaschine Google”

Download der kompletten Studienarbeit (mit Abbildungen):
http://www.wissen24.de/vorschau/25665.html

Google – Eine Erfolgsstory (Auszug Studienarbeit)

14. August 2004 02:30 - Digital-Nirvana

In den folgenden Kapiteln wird ein Überblick über das Unternehmen Google gegeben. Neben dessen Entstehung, Entwicklung und heutiger Position, werden Gründe für den Erfolg aufgezeigt, sowie aktuelle Entwicklungen im Markt der Suchmaschinen und Konkurrenzaktivitäten dargestellt. Dieser Überblick soll im Hinblick auf die in dieser Arbeit untersuchten Aspekte ein besseres Verständnis der Zusammenhänge erreichen.

3.1 Entstehung von Google

Die Suchmaschine Google ist aus einem akademischen Projekt heraus entstanden. Im Jahr 1995 trafen sich erstmals die späteren Google-Gründer Lawrence („Larry“) Page und Sergey Brin, beide Doktoranden der Computerwissenschaft an der Universität Stanford in Kalifornien, USA (Google, 2003h).

3.1.1 Entwicklung von PageRank und BackRub

Im Jahr 1996 beginnen Larry Page und Sergey Brin ihre Arbeit an einer neuartigen und mächtigen Suchmaschine. Im Rahmen ihrer Arbeiten beschreiben sie die mathematisch-theoretischen Grundlagen und implementieren ein erstes Suchmaschinensystem auf der Grundlage ihrer Technik. Der Google-Prototyp erhält zunächst den Namen „BackRub“, eine Anspielung auf die Fähigkeit Links (Verweise), die auf ein Webdokument verweisen (sog. „back links“), zu analysieren. Das Suchmaschinensystem stand Interessenten unter der Adresse http://google.stanford.edu zur Verfügung, welche auch heute noch existiert (Wimmeroth & Brochhagen, 2003, S. 12).

In ihrem Dokument „The Anatomy of a Large-Scale Hypertextual Web Search Engine” (Brin & Page, 1998) beschreiben Larry Page und Sergey Brin die Technologie, die sich für die relevanten Suchergebnisse der Suchmaschine Google verantwortlich zeigt. Die Technologie wird von den Entwicklern PageRank (vgl. Kapitel 5) genannt und „nimmt eine objektive Bewertung der Wichtigkeit von Websites vor“ (Google, 2003d). Der Name bezieht sich nicht etwa auf „Page“ im Sinne einer Web„page“, sondern auf den Namen des Entwicklers Larry Page (Stock & Stock, 2001). Sowohl PageRank als auch Google sind als Markennamen urheberrechtlich geschützt (Wimmeroth & Brochhagen, 2003, S. 12).

3.1.2 Gründung von Google

Im ersten Halbjahr 1998 setzten Larry Page und Sergey Brin ihre Arbeiten an der Suchmaschine fort und vervollständigten ihre Technologie. Trotz des damaligen Dotcom-Fiebers zeigten die großen Unternehmen wenig Interesse für ihre Idee und der Versuch Investoren zu gewinnen scheiterte, worüber sie im Nachhinein durchaus froh waren. Der Yahoo-Gründer David Filo befand ihre Technologie für grundsolide, ermutigte sie aber für das Wachstum des Suchdienstes eine Firma zu gründen. “When it’s fully developed and scalable, let’s talk again” (Google, 2003h).
Larry und Sergey entschieden sich dazu nun doch eigene Wege zu beschreiten, sie benötigten nur etwas Startkapital für ihr Vorhaben. Einer der das volle Potential der Technologie erkannte war Andy Bechtolsheim, einer der Gründer von Sun Microsystems. Ihm genügte bereits eine kurze Demonstration, um Larry und Sergey einen Scheck in Höhe von 100.000 US-Dollar auszuhändigen. Der Scheck war allerdings ausgestellt auf eine Firma names Google Inc., und diese Firma existierte nicht. Er konnte erst eingelöst werden als Larry und Sergey alle Formalitäten zur Gründung der neuen Firma erledigt hatten. Es gelang ihnen bei Freunden, Bekannten und in ihren Familien weitere Geldgeber zu finden, so dass sie es auf ein Startkapital in Höhe von ca. einer Million US-Dollar brachten. Am 7. September 1998 wird Google Inc. gegründet, ein klassisches Garagen-Startup mit Sitz in Menlo Park, Kalifornien (Google, 2003h).

3.1.3 Der rasante Aufstieg

Zu Beginn beantwortete Google, immer noch in der Beta-Phase, bereits 10.000 Suchanfragen am Tag, ein halbes Jahr später waren es bereits 500.000. Die Presse wurde schnell auf die neue Suchmaschine mit den relevanten Suchergebnissen aufmerksam. Die Zahl der Mitarbeiter war auf acht angestiegen, so dass das Garagenbüro schnell zu eng wurde und Google im Februar 1999 in ein Büro der University Avenue in Palo Alto umzog. Aufgrund der Tatsache, dass Google konsequent auf das Betriebssystem Linux setzt, konnte man den großen Linux Distributor Red Hat als Kunden gewinnen (Google, 2003h).
Im Juni 1999 investierten die führenden Venture Capital-Firmen Sequoia Capital und Kleiner Perkins Caufield & Buyers 25 Millionen US-Dollar in die neue Firma. Von nun an ging es in großen Schritten weiter. Inzwischen war die Zahl der Mitarbeiter so stark angewachsen, dass Google erneut den Firmensitz verlegte. Google bezog Quartier im sog. „Googleplex“ in Mountain View, Kalifornien, wo auch heute noch der Sitz des Unternehmens ist. Die Anzahl der Suchanfragen stieg auf drei Millionen pro Tag an, nachdem AOL/Netscape Google als Web-Suchdienst auswählte (Google, 2003h).
Am 21. September 1999 wurde die Beta-Phase endgültig abgeschlossen und der schon lange nur noch symbolische „beta“ Sticker von der Google-Website entfernt. Die Expansion konnte durch neue Lizenznehmer wie z.B. Virgilio, dem führenden Online-Portal Italiens, vorangetrieben werden. Google erhielt mehrere Awards (Auszeichnungen) für das Jahr 1999 und konnte dadurch den Bekanntheitsgrad weiter steigern (Google, 2003h).
Der endgültige Durchbruch gelang Google im Jahr 2000, als am 26. Juni Yahoo von Inktomis Suchtechnologie auf Googles Lösung umstieg und Google dadurch zur weltweit größten Suchmaschine, mit einem Index von einer Milliarde URLs, avancierte. Google beantwortete nun 18 Millionen Suchanfragen pro Tag und startete den Suchdienst in 10 weiteren Sprachen. Durch den großen Deal mit Yahoo stieg der Bekanntheitsgrad von Google enorm an. Ende des Jahres 2000 lag die Zahl der durchschnittlichen täglichen Anfragen schon bei 100 Millionen, was auch ein Verdienst der neu eingeführten Google Toolbar war, ein Browser-Plugin, das komfortable Suchfunktionen jederzeit zur Verfügung stellt. Google stellte im Jahr 2000 auch sein neues Programm AdWords vor, mit dem auch kleinere Werbetreibende innerhalb weniger Minuten eine Online Kampagne starten und Werbeanzeigen kontextbezogen platzieren können. AdWords stellt auch heute noch ein wichtiges Standbein in Googles Geschäftsmodell dar (Google, 2003h).
Im Jahre 2001 konnte Google die Akquisition des Unternehmens Deja.com vermelden und sich damit das Usenet-Archiv mit über 500 Millionen Beiträgen bis zurück ins Jahr 1995 sichern. Google entwickelte auf Grundlage dieses Archivs die Google Groups, welche über eine Web-Oberfläche die Teilnahme an den Diskussionen des Usenet ermöglichen. Als weitere Neuentwicklungen starteten 2001 der Google Zeitgeist, eine Statistik der häufigsten Suchbegriffe, sowie die Google Bildersuche und die Google Katalogsuche. Während bei der Bildersuche zunächst 250 Millionen Bilddateien durchsucht werden können, stellt die Katalogsuche 110 eingescannte Kataloge zur Verfügung, die im Volltext durchsucht werden können. Googles Suchdienst startete in einer jeweiligen Landesversion in mehreren Ländern, darunter auch Deutschland mit Google.de. Am Ende des Jahres 2001 durchsuchte Google bereits drei Milliarden Webdokumente (Google, 2003h).
Die Google AdWords wurden im Jahr 2002 stark überarbeitet. Die Abrechnung erfolgt nun über das Cost per Click-Verfahren (CPC). Der Start der Google Labs ermöglicht den Google-Entwicklern ihre Experimente und Gedankenspiele dem interessierten Publikum vorzustellen und diese an der Entwicklung zukünftiger Google-Features teilhaben zu lassen. Schließlich starteten im Jahr 2002 die Beta-Version der Google News, die kostenlosen Zugang zu 4500 weltweiten Newsquellen ermöglichen, sowie eine erste Test-Version des Produktsuchservice Froogle, welcher Benutzern hilft mehrere Anbieter für spezifische Produkte zu finden und dazu Preise und Fotos zur Verfügung stellt (Google, 2003h).

3.1.4 Bedeutung des Wortes „Google“

„Das Wort ’Google’ ist im Amerikanischen die umgangssprachliche Form des Wortes ’Googol’. Dieses Wort wurde Ende der dreißiger Jahre des vorigen Jahrhunderts von Milton Sirotta, dem damals neunjährigen Neffen des amerikanischen Mathematikers Edward Kasner, erdacht. Kasner sollte einen Namen für die Zahl 10¹ºº finden und gab diese Frage an seinen Neffen weiter“ (Wimmeroth & Brochhagen, 2003, S. 12).
Der Name Google symbolisiert also das Ziel, eine Suchmaschine mit einem größtmöglichen Umfang der Datenbasis zu realisieren (Wimmeroth & Brochhagen, 2003, S. 12). Inzwischen hat sich stellvertretend für die Suche im Internet das Wort „googlen“ eingebürgert. Das englische Lexikon Oxford Dictionary führt „to google” inzwischen als reguläres Verb und die American Dialect Society nominierte das Verb „google” als nützlichstes Wort des Jahres 2002 (American Dialect Society, 2003).

3.2 Google heute

Nach der rasanten Entwicklung des Unternehmens (vgl. Kapitel 3.1.3) stellt Google heute die – mit Abstand – führende Suchmaschine im World Wide Web dar, wie die Ausführungen in Kapitel 3.2.1 verdeutlichen. Google hat sich innerhalb von nur wenigen Jahren von einem Garagen-Startup zu einem profitablen Global Player entwickelt.

3.2.1 Googles Vorrangstellung

Google nimmt innerhalb der Internet-Suchmaschinen eine dominante Position ein, wie folgende Zahlen aufzeigen (Google, 2004b):
· Google beantwortet täglich über 200 Millionen Suchanfragen, soviel wie keine andere Suchmaschine.
· Google durchsucht über vier Milliarden Webdokumente und hat damit den größten Index aller Suchmaschinen.
· Die Website von Google (http://www.google.com ) ist eine der 10 populärsten Internetseiten weltweit.
· Googles Bildersuche durchsucht über 880 Millionen Bilddateien und ist damit die umfassendste Bildersuche im WWW.
· Die Google Groups enthalten über 845 Millionen Usenet-Mitteilungen. Damit sind sie die weltweit größte Sammlung von Mitteilungen.
· Google stellt seine Benutzeroberfläche in 97 Sprachen zur Verfügung und bietet Suchergebnisse in 35 verschiedenen Sprachen an.
Google beschäftigt derzeit über 1900 Mitarbeiter an weltweit 21 Standorten (Google, 2004a):

Nach einer aktuellen Studie von Nielsen Netratings (2004a), dem führenden
Anbieter auf dem Gebiet der Messung und Analyse von Internet-Nutzungsdaten, führt Google in den USA im Januar 2004 mit 59 Millionen Nutzern bzw. 39 Prozent der aktiven Internet-Nutzer die Liste der Top-Suchplattformen an (vgl. Tabelle 1).

Tabelle 1: Top 5 Suchplattformen USA (Nielsen Netratings, 2004a, S. 1)
Search Destinations UniqueAudience(000) Active Reach(%)
1. Google 59,327 39.37
2. Yahoo! Search 45,774 30.38
3. MSN Search 44,651 29.63
4. AOL Search 23,394 15.53
5. Ask Jeeves 12,792 8.49

Auch in Europa ist Google nach einer aktuellen Studie (Nielsen Netratings, 2004b) klarer Marktführer:
„Derzeit nutzen mehr als 55 Millionen Europäer die Suchmaschine Google. Mit einer Reichweite von gut 47 Prozent ist Google damit ein fester Bestandteil der Internetnutzung“ (Nielsen Netratings, 2004b, S. 1).

Google (vgl. Tabelle 2 und Abb. 3) ist unter den Top 10 der europäischen Suchangebote nicht nur die beliebteste Suchmaschine, sondern auch die Suchplattform wo die Benutzer die meisten Seiten aufrufen und am längsten verweilen. Dass die Benutzer vergleichsweise lange bei Google verweilen, zeigt die Nutzungsdauer von über 15 Minuten im Januar 2004. Damit ist Google die einzige Suchmaschine, auf der Besucher länger als durchschnittlich 10 Minuten pro Monat verweilen. An zweiter Stelle in der Hitliste nach Nutzungsdauer rangiert mit der Google Bildersuche ein weiteres Google-Angebot (Nielsen Netratings, 2004b, S. 1).

Die täglich aktualisierten Statistiken des deutschen Statistik-Spezialisten Webhits.de weisen für den 12. April 2004 einen Google-Marktanteil in Deutschland von fast 75 Prozent aus. Die anderen Suchmaschinen folgen erst weit abgeschlagen (Webhits, 2004).

Da in dieser Arbeit die Ranking-Verfahren und die Relevanzoptimierung im Vordergrund steht, gilt es zu beachten, dass der Einfluss von Google wesentlich weiter als in den aufgeführten Studien reicht. Google ist mit anderen Seiten verflochten, die den Index als Informationsquelle nutzen. Hierzu gehören auch Schwergewichte wie AOL Time Warner. Hinzu kommen die vielen Seiten, die über die API (Application Programming Interface = öffentlich verfügbare Programmierschnittstelle) auf Google zugreifen (Calishan & Dornfest, 2003, S. 321). Den Marktforschern von IPOfinancial.com, einem auf Börsengänge spezialisierten Marktforschungs- unternehmen, zufolge „wickelt Google derzeit aufgrund verschiedener Partnerschaften etwa 80 Prozent aller Suchanfragen im Internet ab“ (Bayer, 2004).

Die dominante Position und der Wert der Marke „Google“ wird auch durch den Gewinn des von den Marktforschern Interbrand verliehenen „Brand of the Year“ (Rusch, 2004) deutlich. Google erhielt 2003 im zweiten Jahr in Folge diese Auszeichnung und wird somit als wertvollste Marke weltweit angesehen, wie aus Abb. 5 ersichtlich wird.

3.2.2 Googles Geschäftsmodell

Das Geschäftsmodell von Google basiert auf den Umsatzströmen Suchdienste und Anzeigenprogramme (Google, 2003e):
· Suchdienste:
Die Suchdienste von Google bieten Partnern (Webseiten oder Portale) Zugang zu Milliarden von Webseiten und der weltweit fortschrittlichsten Suchtechnologie. Zusätzlich bieten die Partner-Webseiten von Google Zugang zu weiteren Umsatzmöglichkeiten über die gesponserten Links von Googles weltweitem Netzwerk, das mehr als 100.000 Kunden umfasst. Durch die Partner-Webseiten von Google erhalten die Anzeigen der Google-Kunden eine enorme Reichweite. Derzeitige Partner sind beispielsweise AOL Time Warner, Amazon.com, T-Online (Europe), Yahoo! Japan, AT&T WorldNet, InfoSpace, Ask Jeeves, Libero, Virgilio, F2 und News Interactive. Zu dem Umsatzstrom der Suchdienste zählt auch Googles Search Appliance, eine integrierte Suchlösung für Geschäftskunden, die die Suchtechnologie von Google auf Intranets und Webseiten von Unternehmen und Organisationen ausdehnt. Die Suchlösung ist in verschiedenen Größen, die auf die Bedürfnisse vieler Unternehmen zugeschnitten sind, erhältlich und bietet neue Ergebnisse sowie einen einfach zu bedienenden Administrationsbereich an. Zu den Search Appliance-Kunden gehören beispielsweise Pfizer, Procter & Gamble, Xerox, Cisco Systems, Boeing und die U.S. Army (Google, 2003e).

· Anzeigenprogramme:
Google beschreitet für seine Anzeigenprogramme den Weg der Content-bezogenen Werbung:
“Das Anzeigenprogramm von Google ermöglicht es Kunden, Anzeigeninhalte genau den Web-Nutzern anzeigen zu lassen, die Informationen zu einem bestimmten Produkt oder Service suchen. Das Ergebnis ist eine äußerst zielgerichtete Dienstleistung, die durchgängig bis zu fünffach höhere Klickraten erzielt als der Branchendurchschnitt für herkömmliche Bannerwerbung“ (Google, 2003e).
Google bietet derzeit das Programm AdWords an. Das Programm ist dem sog. Payed Placement, also dem Ranking gegen Bezahlung, zuzuordnen und wird in Kapitel 4.5 behandelt. Web-Publishern bietet Google zudem das Programm AdSense an, das darauf ausgerichtet ist, das Umsatzpotential einer Webseite zu maximieren, indem die für einen Seiteninhalt wichtigen Anzeigen angezeigt werden. Google bezahlt für die Platzierung der Anzeigen auf den Partner-Webseiten (Google, 2003e).

3.2.3 Geschäftszahlen

War Google als ein nicht börsennotiertes Privatunternehmen zunächst nicht verpflichtet Geschäftszahlen preiszugeben, sorgte das Unternehmen im Zuge des am 29. April 2004 beantragten Börsenganges für eine Ende der Spekulationen um die Geschäftszahlen. Aus dem Antrag, den Google bei der US-Börsenaufsicht Securities and Exchange Commission (SEC) eingereicht hat, geht hervor, dass das Unternehmen seit dem Jahr 2001 profitabel wirtschaftet.
Im Jahr 2003 erzielte Google bei 962 Millionen US-Dollar Umsatz einen Nettogewinn von 106 Millionen US-Dollar. 96 Prozent der Einnahmen erzielte Google mit Anzeigen (vgl. Kapitel 3.2.2 und 4.5), die auf eigenen und Partnerwebseiten platziert sind. Investitionen von 38 Millionen US-Dollar hat Google inzwischen in einen Bargeldbestand von 455 Millionen US-Dollar (Stand Ende März) verwandelt. Die genaue Mitarbeiterzahl wurde mit 1907 angegeben (Cloer, 2004). Google ist damit eines der wenigen Internet-Unternehmen das gegen den Abwärtstrend der New Economy gewachsen ist und profitabel arbeitet.

3.3 Gründe für den Erfolg von Google

Als wesentliche Gründe für den Erfolg von Google gelten neben den extrem kurzen Antwortzeiten und der aufgeräumten Benutzeroberfläche (vgl. Kapitel 3.3.2) vor allem die hochwertigen Suchergebnisse (Sommergut, 2003), die primär ein Verdienst des PageRank-Verfahrens sind (vgl. Kapitel 5).

3.3.1 Philosophie von Google

Das gesamte Konzept von Google orientiert sich an den Wünschen und Bedürfnissen der Benutzer und ist auf die Hauptfunktion – das Suchen – ausgerichtet. Die Philosophie und die Ziele von Google werden durch das Unternehmen wie folgt dargestellt:
„Google möchte die beste Sucherfahrung im Internet bieten, indem die weltweiten Informationen universell zugänglich und nutzbar gemacht werden“ (Google, 2003a).
„Google wurde entworfen, um Ordnung in das Informationschaos zu bringen. Google ist das, was ein Suchdienst leisten sollte: Eine durchdachte Methode, das Internet anhand seiner eigenen Struktur zu ordnen, und nicht ein begrenztes Verzeichnis, das durch Bearbeitung entstanden ist oder eine Liste von Ergebnissen, die an den Meistbietenden verkauft wurden“ (Google, 2002a).

3.3.2 Herausragende Usability

Ein wesentlicher Grund für den Erfolg von Google stellt die durchdachte und intuitiv zu bedienende Oberfläche dar. Die herausragende Usability (Gebrauchstauglichkeit) und die Konzentration auf das Wesentliche ist erklärte Unternehmenspolitik von Google. Auf der Startseite befinden sich keine störenden Popup-Fenster oder Werbebanner. Die Oberfläche wirkt geradezu spartanisch und beruhigend. Google bezeichnet dieses Design als „Nonsens frei“ (Wimmeroth & Brochhagen, 2003, S. 27).

Die Betreiber von Google haben nie wie bei AltaVista oder Excite versucht, ihre Suchmaschine in ein Portal umzuwandeln. Selbst auf den Resultatseiten findet sich Werbung nur in Form von Textverweisen (Bager, 2002). Dieser konsequente Verzicht bietet für den Nutzer entscheidende Vorteile:
· Der Blick des Nutzers wird nicht vom Wesentlichen abgelenkt
· Die gesamte Performanz steigt aufgrund der kürzeren Ladezeiten
· Geringe clientseitige Anforderungen (z.B. auch auf älteren Browsern darstellbar, kein JavaScript oder Flash-Plugin notwendig)

3.4 Aktuelle Entwicklungen

Der Markt der Suchmaschinen unterliegt derzeit einem rasanten Konzentrationsprozess. Nachdem im letzten Jahr zahlreiche Firmenübernahmen stattfanden kristallisieren sich Yahoo und Microsoft als einzigst ernstzunehmende Konkurrenten für Google heraus (vgl. Kapitel 3.4.2). Google versucht der verstärkten Konkurrenzsituation mit neuen, innovativen Angeboten sowie dem geplanten Börsengang zu begegnen.

3.4.1 Googles Zukunftspläne

Google wird eine rosige Zukunft vorausgesagt. „Google ist eine Maschine zum Gelddrucken” (Bayer, 2004), analysiert David Menlow, Präsident von IPOfinancial.com. Mit Spannung wird der geplante Börsengang von der Finanzwelt verfolgt. Nach dem Platzen der Dotcom-Blase gab es lange Zeit keine spektakulären Börsengänge mehr. Die Analysten sind sich, was den Stellenwert des Börsengangs betrifft, einig. Roger McNamee, Managing Director der Investmentgruppe Silver Lake Partners, sieht Googles Börsengang als den wichtigsten des gesamten Jahrzehnts. „Google ist weltbekannt und die Nachfrage nach den Aktien wird jeden Rahmen sprengen“ (Bayer, 2004). Google ist für die Zukunft hervorragend positioniert und in einem hochprofitablen Markt tätig. Die Banker von Piper Jaffray sehen in der Vermarktung von Suchmaschinen das am schnellsten wachsende Erlösmodell im Internet, weit vor Bezahlinhalten, E-Commerce oder klassischer Werbung. War dieser Markt 2002 noch 1,8 Milliarden US-Dollar schwer, so sollen die Anzeigenerlöse bis ins Jahr 2007 auf 7 Milliarden US-Dollar ansteigen (Winterbauer, 2003, S. 21).
Google überrascht immer wieder mit neuen, innovativen Angeboten. Für viel Wirbel sorgt derzeit der geplante Dienst „Gmail“, ein kostenloses E-Mail-Angebot mit Features, die sich deutlich von der Konkurrenz abheben. Google plant den Nutzern des webbasierten Postfaches ein Gigabyte – 1000 Megabyte – Speicherplatz zur Verfügung zu stellen. Im Vergleich dazu bietet der Webmail-Dienst von Yahoo seinen Kunden gerade mal 4 Megabyte Speicher für ihre Post, Hotmail von Microsoft sogar nur 2 Megabyte. Laut Google reicht der Speicherplatz für 500.000 E-Mails. Die Idee dahinter ist, dass ein Kunde sein Leben lang alle E-Mails speichern kann und mithilfe der bewährten Google-Suchtechnologie schnell jedes erhaltene und gesendete Mail finden kann (Google nach eigenem Gusto, In: NZZ vom 10.04.2004, S. 52). Der Dienst wird durch bezahlte Werbeanzeigen finanziert. Google prüft die elektronische Post auf bestimmte Begriffe und platziert dazu passende Werbeanzeigen (Gieritz & Masuhr, 2004, S. 22-23). Dieses Vorhaben löste bei Datenschützern weltweit Empörung aus, da die kontextabhängigen Werbeanzeigen die Privatsphäre der Anwender missachtet. Nachdem der Mail-Service für den Big Brother Award nominiert wurde, plant Google nun einige Modifikationen vorzunehmen und die kontextabhängige Werbung nur bei Zustimmung des Nutzers anzuzeigen. Der Dienst ist derzeit in der Testphase und nur einem kleinen Anwenderkreis vorbehalten.

In den USA startete mit “Google Local” eine Art Gelbe-Seiten-Auskunft. Google attackiert damit die gesamte Auskunftsbranche, von Telefondiensten bis zu den gedruckten Branchenbüchern. Google verdient daran, Einträge zahlender Kunden in der Trefferliste zu platzieren (Gieritz & Masuhr, 2004, S. 22-23). Der Betatest für die Dienste “Google Personalized” und “Web Alerts” startete im März 2004. Bei der personalisierten Suche (Google, 2004c) kann der Anwender seine Präferenzen für bevorzugte Themenbereiche setzen, welche bei der Suche präzisere Resultate liefern sollen (Google nach eigenem Gusto, In: NZZ vom 10.04.2004, S. 52). Bei Web Alerts (Google, 2004c) können sich Nutzer wahlweise täglich oder wöchentlich Suchergebnisse zu einem selbst gewählten Suchbegriff per E-Mail zukommen lassen. Ein vergleichbarer, in der Beta-Phase befindlicher und auf die Nachrichtensuche bezogener Dienst, ist „News Alerts“ (Google, 2004c).
Bereits als Beta-Version erscheint auf der US-Website von Google der Einkaufsführer „Froogle“ (Google, 2004d), eine Produktsuchmaschine, die zur ernsthaften Konkurrenz für etablierte Online-Marktplätze wie eBay oder Amazon avancieren könnte. Die Suchergebnisse enthalten neben dem Preis, der Produktbeschreibung und dem Seitentitel auch ein Bild des Produktes. Das Ranking von Froogle orientiert sich am bewährten Google-Ranking.

In den „Google Labs“ (Google, 2004c), dem „Technologiespielplatz“ von Google, können interessierte Anwender innovative Ideen für die Zukunft testen. Ob sich die, in Beta-Versionen verfügbaren, Ideen durchsetzen und verwirklicht werden, hängt auch von dem Feedback der Nutzer ab. Google bittet seine Nutzer um die Abgabe von Kommentaren, Wertungen und Erfahrungsberichten zu den jeweiligen Testfunktionen (Wimmeroth & Brochhagen, 2003, S. 25).

3.4.2 Aktivitäten der Konkurrenz

Die beiden Konkurrenten Yahoo und Microsoft haben offiziell angekündigt, Google den Platz an der Spitze streitig zu machen (Schmalholz, 2004, S. 26). Insbesondere Yahoo sorgte mit spektakulären Firmenübernahmen für den Konzentrationsprozess im Markt der Suchmaschinen. Das renommierte Internet-Portal übernahm Ende 2002 für 235 Millionen US-Dollar den Suchtechnologie-Spezialisten Inktomi. Im Juli 2003 gelang Yahoo dann der große Coup. Für 1,6 Milliarden US-Dollar konnte der Internet-Dienstleister Overture übernommen werden. Overture gilt in der Branche neben Google als die zukunftsträchtigste Internet-Firma überhaupt. 2002 konnte das Unternehmen mit der Vermarktung von bezahlten Links in Suchmaschinen einen Umsatz von 667 Millionen US-Dollar erzielen und war damit das umsatzstärkste Web-Unternehmen (Winterbauer, 2004, S. 21). Mit dieser Akquisition erhielt Yahoo auch die neben Google bedeutendsten Suchmaschinen Altavista und Alltheweb, die Overture zuvor übernommen hatte. Laut Yahoo-Deutschland-Chef Franz Dillitzer sicherte sich Yahoo damit auch die patentrechtlich geschützten Algorithmen der Suchvorgänge. So besitzt Yahoo nun alle neben Google weltweit bedeutenden Lieferanten von Internet-Suchtechnologie (Schmalholz, 2004, S. 26).

Im Februar 2004 erhöhte Yahoo den Druck auf Google erneut, als Yahoo begann eigene Suchtechnik auf seinen Seiten einzuführen. Wer bisher mit Yahoo gesucht hat, verwendete tatsächlich die Technologie von Google. Diese Kooperation ist nun beendet, nur noch bei der Bildersuche greift Yahoo vorerst auf Google zurück, da noch keine eigene Lösung dazu vorhanden ist. Größere finanzielle Auswirkungen hat das Ende der Partnerschaft vorerst nicht. Experten zufolge hat Yahoo jährlich weniger als 10 Millionen US-Dollar an Lizenzgebühren an Google bezahlt. Der Einfluss auf die Suchanfragen trifft Google stärker. Yahoo könnte über die eigene Suchmaschine über 40 Prozent des Web-weiten Suchaufkommens auf seine Seiten ziehen (Bayer, 2004).
Gefahr droht Google auch von Microsoft. Der Software-Riese aus Redmond zieht derzeit seine besten Entwickler aus aller Welt zusammen, um Google schon bald Paroli bieten zu können. Mit einer als Kompliment verkleideten Drohung kündigte Microsoft-Mitgründer Bill Gates beim Weltwirtschaftsgipfel in Davos den Kampf an. Zunächst sprach er den Google-Entwicklern seine Anerkennung für die hochintelligente Gestaltung ihrer Suchtechnologie aus, um dann ebenso freundlich hinzuzufügen: “Aber wir werden euch kriegen” (Schmalholz, 2004, S. 26). Im Markt der Suchmaschinen zeichnet sich also ein Dreikampf ab, die weiteren Unternehmen in diesem Marktsegment sind für die Marktführerschaft relativ unbedeutend und stellen keine ernsthafte Konkurrenz für Google dar.
Tom Ewing, European Market Analyst, sieht die Situation im Markt der Suchmaschinen derzeit folgendermaßen:
“Googles Spitzenposition wirkt derzeit unantastbar. Aber einige der größten Anbieter im Internet entwickeln derzeit konkurrierende Suchtechnologien, was die Situation in diesem Marktsegment in den nächsten eineinhalb Jahren durchaus ändern kann. Beispielsweise hat Yahoo! in den USA vor kurzem seine neue Suchtechnologie YST auf den Markt gebracht und plant, diese in den kommenden Wochen auch in Europa einzuführen. Alles in allem wird es also sehr interessant sein, diesen Sektor und seine Entwicklung künftig zu beobachten” (Nielsen Netratings, 2004b, S. 2).

Dieser Artikel ist ein kleiner Auszug meiner Studienarbeit “Relevanzoptimierung und Ranking-Verfahren der Suchmaschine Google”

Download der kompletten Studienarbeit (mit Abbildungen):
http://www.wissen24.de/vorschau/25665.html

Ranking-Verfahren von Google

13. Juli 2004 12:16 - Digital-Nirvana

Meine Große Studienarbeit

“Relevanzoptimierung und Ranking-Verfahren der Suchmaschine Google”

ist ab sofort auf Wissen24.de verfügbar.


» Vorschau


» Downloaden

Die Arbeit wurde von mir im 4. Semester im Fach Informationstechnik geschrieben.

IT-Inventar PHP Script

13. Juli 2004 11:20 - Digital-Nirvana

Mit diesem PHP-Script wird ein IT-Inventar realisiert.
In dem Inventar können Computer, Drucker, Monitore, Betriebssysteme sowie die zugehörigen Standorte und Benutzer verwaltet werden.

Funktionsumfang:

- Administrationsbereich zum Hinzufügen, Editieren und Löschen einzelner Positionen
- Suchfunktionen
- Sortierfunktionen
- verschiedene Anzeigemodi
- Statistiken

Das IT-Inventar ist eine Studienarbeit im Wahlpflichtfach Administration und Programmierung von LAMP-Systemen 2 im Studiengang Informationswirtschaft der Fachhochschule Stuttgart – Hochschule der Medien im Sommersemester 2004.

>> Zum IT-Inventar

Wortraetsel

17. April 2004 18:45 - Digital-Nirvana

“Die Sprache kann es nicht entbehren,
die Zeitung bringt es jeden Tag,
der Kaufmann brauchts, will er sich nähren,
und selten fehlt es im Vertrag.”

Jaeger

17. April 2004 18:44 - Digital-Nirvana

Ein Jäger geht aus dem Haus um zu jagen. Er geht 5 km nach Süden, 5 km nach Westen und 5 km nach Norden. Er kommt wieder an seinem Haus an und erlegt einen Bären. Hat der Bär braunes oder weißes Fell?

Der fehlende Euro

17. April 2004 18:44 - Digital-Nirvana

Drei Jungen kaufen für 15,- Euro einen Fußball in einem Sportgeschäft. Als die Jungen den Laden verlassen wollen, sagt der Geschäftsführer dem Verkäufer, dass der Ball eigentlich nur noch 10,- Euro wert wäre und die übrigen 5 Euro unter den Jungen aufgeteilt werden sollen. Nun fragt sich der Verkäufer, wie er das machen soll und entschließt sich für folgende Lösung: Er trinkt ein Bier für 2,- Euro und gibt jedem Jungen einen Euro wieder zurück. Nun haben die Jungen jeder 4 Euro für den Ball bezahlt (12,- Euro) und der Verkäufer hat 2,- Euro für sein Bier bezahlt. Das sind zusammen 14 Euro…. Wo ist der fehlende Euro?

Was ist das III

17. April 2004 18:43 - Digital-Nirvana

Was ist mächtiger als Gott, bösartiger als der Teufel, die Armen haben es, die Zufriedenen brauchen es, und wenn du es isst, stirbst du.

5 Wuerfel

17. April 2004 18:42 - Digital-Nirvana

5 Würfel sind aufeinander gestapelt. Auf dem obersten Würfel sind ganz oben 2 Augen zu sehen. Wieviele Augen kann man bei den 5 Würfeln insgesamt sehen?

4 Liter-Problem

17. April 2004 18:41 - Digital-Nirvana

Mit etwas nachdenken, sollte jeder auf die Lösung kommen.

Sie haben zwei Behälter. Der eine faßt 3 Liter, der andere 5 Liter. Sie stehen vor einem Brunnen und treffen einen Bekannten, der von ihnen genau vier Liter haben will. Wie stellen Sie das an, wenn Sie nur Ihre zwei Behälter benutzen dürfen? Sie dürfen die Behälter beliebig oft verwenden.