Wie funktioniert eine Suchmaschine? Zunächst einmal sollten Sie wissen, dass die Suchergebnisse im Browser keine Live-Ergebnisse darstellen. Bevor eine Internetseite bzw. Dokument im Suchergebnis Ihres Browsers erscheint, muss sie von der Suchmaschine verarbeitet worden sein. Hierfür sind drei Funktionen und die dazugehörigen Systemkomponenten verantwortlich:
Datengewinnung: Um die unzähligen Daten aus dem World Wide Web auszuwerten, müssen sie zunächst beschafft werden. Das dafür zuständige Webcrawler-System, ruft eine Seite nach der anderen ab und lädt diese herunter. Das Webcrawler-System überprüft ebenfalls die Existenz und die Aktualisierung von bereits vorhandenen Dokumenten. Somit wird der eigene Datenbestand der Suchmaschine, immer aktuell gehalten.
Datenanalyse und -verwaltung: Sind die Dokumente lokal gespeichert, wird eine durchsuchbare Datenstruktur aufgebaut. Um die relevanten Informationen in den großen Datenbeständen zu gewinnen, wird eine weitere Komponente benötigt, das sogenannte Information-Retrieval-System. Diese Systemkomponente reduziert als erstes die Texte auf das Wesentliche, um sie verarbeiten zu können. Das Information-Retrieval-System versucht, die relevantesten Informationen auf eine Suchanfrage zu finden. Jedes Dokument erhält einen Relevanz Wert, anhand verschiedener Methoden. Die Relevanz oder die sogenannte Gewichtung, gilt immer im Bezug zu einem bestimmten Schlüsselwort (Keyword). "Gute" und sorgfältig ausgesuchte Keywords sind wichtig, um bei der Indexierung der Texte eine hohe Gewichtung bzw. Relevanz zu erhalten. Die Datengewinnung, Datenanalyse und -verwaltung arbeiten ständig daran, die Datenbasis zu erweitern und zu aktualisieren.
Suchanfragen verarbeiten: Die Funktionalität der Suchmaschine wird durch den Query-Prozessor bzw. Searcher umgesetzt. Der Query-Prozessor bildet die Schnittstelle zum Benutzer. Der Benutzer gibt ein Keyword ein und erhält eine nach der Gewichtung sortierte Liste, aus dem Index des Information-Retrieval-Systems. Diese Liste erscheint im Browser als Ergebnisliste. Auch hier gilt, je höher die Relevanz im Bezug auf die Schlüsselwörter, desto höher das Ranking in den Suchmaschinen.