emseo – Digital & SEO Agentur

wie-funktioniert-die-google-suche

Kaum einer schlägt noch lange nach der richtigen Information im Lexikon oder sucht auf einer analogen Karte nach dem Weg. Solche Informationen beschaffen wir uns seit mehr oder weniger 20 Jahren durch Suchmaschinen wie Google.

Mit einem Markenwert von 309 Millarden US Dollar gehört Google 2019 zu den drei wertvollsten Marken der Welt. Nur Amazon und Apple sind dem Konzern in diesem Jahr einen Schritt voraus. Doch wieso ist Google eigentlich so erfolgreich und worin besteht der große Mehrwert den die Suchmaschine uns liefert?

Wozu überhaupt eine Suchmaschine?

Bevor wir uns der Frage nach der Funktionsweise von Google widmen, müssen wir uns zunächst die Problemstellung vor Augen führen, die Suchmaschinen wie Google versuchen zu lösen.

Mit steigender Vernetzung der Welt stieg Mitte der 1990er Jahre die Informationsmenge ortsunabhängig enorm an. Innerhalb weniger Jahre war es nicht mehr möglich, das World Wide Web in Form von sogenannten Webkatalogen – wie anfangs von beispielsweise Yahoo – händisch zu pflegen. Du kannst dir sicherlich nicht einmal mehr wirklich vorstellen, wie es ist, die Informationen noch langwierig per Hand nachzublättern.

Um diese Informationen zu strukturieren, tüftelte man damals vielerorts an sogenannten Suchmaschinen, die bei der Informationsbeschaffung helfen sollten und begann verschiedene Prototypen auf den Markt zu bringen. Getrieben von dieser Idee gründeten Larry Page und Sergey Brin 1998 die Firma „Google Inc.“.

Das Ziel von Google

Das Ziel von Google ist es, die Informationen der Welt zu organisieren und für alle zu jeder Zeit zugänglich und nutzbar zu machen. Diese einfache Aussage ist der Leitfaden für alle unsere Entscheidungen.

Quelle: Google

So viel zum ideologischen Ziel hinter der Suchmaschine. Doch wie sieht es aus technischer Sicht mit der Google Suche aus? Was passiert eigentlich, wenn wir bei Google eine Suchanfrage stellen?

Funktionsweise von Google

Wie funktioniert die Google-Suche?

Grundsätzlich kann man die Prozesse der Google-Suche in die folgenden vier Bereiche unterteilen.

  • Crawling
  • Scheduling
  • Indexing
  • Searching

Crawling

Beim Crawling durchsuchen zahlreiche Bots (oft auch Robot, Spider oder Searchbot genannt) das World Wide Web (WWW) automatisch und laden dabei die Inhalte der Webseiten herunter.

Der Crawler startet dabei auf einer Webseite und erstellt dabei eine Liste aller auf dieser Seite zu findenden Hyperlinks. Die URLs die sich hinter diesen Links verbergen, werden dann an den Scheduler gesendet.

Crawler kann man gezielt über die Robots.txt der eigenen Seite steuern.

Im nächsten Schritt werden diese Inhalte vom Crawler grob analysiert. Unter anderem wird hierbei geprüft, wie der HTTP-Statuscode der Webseite ist. Am bekanntesten ist sicherlich der HTTP-Statuscode 404 oder 404-Fehlermeldung.

Ist ein Status 404 vorhanden, bedeutet das für den Webcrawler, dass die Inhalte unter dieser Adresse nicht mehr verfügbar sind. Diese URLs werden früher oder später aus dem Index gelöscht.

Scheduling

Der Scheduler agiert wie eine Art Projekt- oder Zeitmanager für die gesamten Crawling-Prozesse. Er sammelt und verwaltet dabei die verschiedenen Webadressen und ordnet sie so, dass klare, wiederkehrende Crawling-Aufträge an die Robots weitergegeben werden.

Andersherum erhält der Scheduler stetig neue Kenntnis von Webseiten, die die Crawler aufgrund von Verlinkungen auf bereits besuchten Seiten entdeckt haben. Diese sind dann wiederum vom Scheduler zu planen.

Indexing

Nach einer ersten Analyse, die bereits im Crawling-Prozess stattfindet, kommt es im Folgenden zu einer erneuten umfangreichen Prüfung der Inhalte. Die zuvor heruntergeladenen Inhalte der Seite – seien es Texte, Bilder, Videos, Dokumente, etc. – werden schließlich nach mehr als 200 Rankingfaktoren beurteilt.

Ziel dieses Prozesses ist es, für jedes Dokument darzustellen, welche Relevanz es für welche Suchbegriffe hat. Der Output dieses Prozesses nennt sich Index.

Ein solcher Index dient dazu, im Searching-Prozess als Datenbank agieren zu können. Zur Erstellung eines solchen Indizes wird ein sogenannter invertierter Index (hier) verwendet, bei dem zuerst die verwendeten Keywords von den entsprechenden Webseiten jeweils den entsprechenden URLs zugeordnet werden.

Im nächsten Schritt wird dann festgestellt, welche Relevanz die jeweiligen Webseiten für bestimmte Suchanfragen haben sollten.

Searching

Gibt nun ein Nutzer eine Suchanfrage in das User Interface von Google ein, greift die Suchmaschine bei diesem Prozess auf den zuvor erstellten Index zurück. Er spielt also eine zuvor erstellte Liste von „relevanten Ergebnissen“ an den Nutzer der Suchmaschine aus. Eine Echtzeit-Suche über das gesamte Internet geschieht in diesem Fall nicht. 

Dies wäre wesentlich aufwendiger und würde viel zu viel Zeit kosten. Der enorme Vorteil, den die Google-Suche schon seit mehr als 20 Jahren ausmacht, die enorme Geschwindigkeit bei der Ausgabe der Suchergebnisse wäre mit einer Echtzeit-Suche nicht zu bewältigen.

Warum bietet Google keine Echtzeit-Suche?

Die kurze Antwort auf diese Frage lautet schlicht und ergreifend: Aufwand. Niemand weiß aktuell, wie groß das World Wide Web tatsächlich ist. Schätzungen zu Folge besteht der von Google indexierte Teil des Internets aus ca. 56 Milliarden Webseiten.

Wie groß das Internet tatsächlich ist, lässt sich nicht verlässlich sagen. Der unbekannte, nicht indexierte Teil des Internets – das sogenannte Deep Web – könnte diese Zahl auf jeden Fall noch enorm steigern. Allein diese 56 Milliarden Webseiten in Echtzeit zu überprüfen wäre ein gewaltiger Rechenaufwand auf Knopfdruck.

Zusätzlich spielt vor allem die enorme Zahl an Suchanfragen eine Rolle. Bei mehr als 84,4 Millionen Google-Suchanfragen allein in Deutschland pro Tag werden die Dimensionen deutlich, die für eine Echtzeit-Berechnung notwendig wären.

Warum wählen wir Google?

Schon vor 20 Jahren verstanden es die Gründer von Google, die Suchmaschine auf das Wesentliche zu beschränken. Während andere Anbieter beispielsweise Nachrichten oder Werbeanzeigen auf der Startseite ihrer Suchmaschine anboten, setzte Google 1998 früh auf eine minimalistische und eindeutige Designstruktur.

Eine große weiße Webseite mit einem prägnanten, einfachen Eingabefeld im Zentrum, das unmissverständlich den Call-To-Action andeutete.

Doch nicht nur das schöne Layout hat Google so erfolgreich gemacht. Auch die schnelle Erreichbarkeit des Suchinterfaces sowie das schnelle Ausspielen von Suchergebnisseiten trugen maßgeblich dazu bei, dass Google heute die wohl erfolgreichste Suchmaschine der Welt ist.

Alternativen zur Google Suchmaschine

Wie finanziert sich Google?

Eine spannende Frage, im Zusammenhang mit der kostenlosen Nutzung ist außerdem das Finanzierungsmodell der Suchmaschine, die vermutlich weit mehr als 1 Million weltweit miteinander vernetzte Server zum Betrieb betreiben muss.

Über 90% der Einnahmen generiert Google mit dem Werbenetzwerk Google Ads. Dabei werden den Suchenden neben den organischen Suchbegriffen je nach Suchanfrage auch mehrere bezahlte Suchergebnisse angezeigt, die schließlich bezahlten Traffic auf die Webseiten der Anzeigengeber leiten sollen.

Bernd Wecks
Bernd Wecks
Ich heiße Bernd Wecks, bin 24 Jahre alt und komme aus Freren im Emsland. Ich betreibe die Seite emseo.de. Für Kooperationsanfragen oder einfach nur einen netten Austausch bin ich immer gern zu haben. Einfach eine Mail an: berndwecks@emseo.de.

Teile diesen Beitrag gerne , wenn du magst!

Share on facebook
Share on linkedin
Share on email

Verpasse nichts Mehr!

Melde dich zu unserem Newsletter an.

Weitere Beiträge

wie-funktioniert-die-google-suche
Allgemein

So funktioniert die Google Suche

Kaum einer schlägt noch lange nach der richtigen Information im Lexikon oder sucht auf einer analogen Karte nach dem Weg. Solche Informationen beschaffen wir uns

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

Brauchst du Unterstützung bei deiner Optimierung?

Wir von emseo.de bringen dich nach vorne!

Individuell. Menschlich. Nah.