Google-Index

Alle Webseiten, die Google für seine Suche erfasst hat, werden in der Datenbank der Suchmaschine gespeichert – dem Google-Index. Zudem werden dort alle Wörter sowie deren Position auf diesen Seiten kompiliert und Millionen von Websites mit bestimmten Keywords oder Keyword-Kombinationen verknüpft. Auch Aspekte wie der Zeitpunkt der Veröffentlichung und ob die jeweilige Seite Fotos, Videos oder andere Elemente enthält, werden im Google-Index beachtet. Sobald ein Nutzer bei Google eine Suchanfrage stellt, wird der Index nach übereinstimmenden Seiten durchsucht und die relevantesten Ergebnisse zurückgegeben.

Indexierungsstatus

Beim Google-Index handelt es sich um keine statische, sondern um eine dynamische Datenbank, die durch fortlaufendes Crawling (Durchsuchen und Erfassen von Websites bzw. Website-Inhalten) kontinuierlich erweitert und aktualisiert wird. Um seinen Index zu füllen und zu organisieren, nutzt Google einen Crawler namens „Googlebot“.

Den Indexierungsstatus der eigenen Website kann man unter „Indexierungsstatus“ in der Google Search Console überprüfen. Die Auswertung in Diagrammform (s. Abb.) gibt Aufschluss darüber, wie viele URLs der untersuchten Domain sich aktuell im Google-Index befinden, und wie sich diese Zahl im Laufe eines Jahres entwickelt hat. In der erweiterten Ansicht wird zudem die Anzahl der durch eine robots.txt-Datei blockierten Seiten angezeigt.

Indexierunsgstatus
Indexierungsstatus in der Search Console

Eine steigende Anzahl indexierter Seiten (bei konstanter bzw. steigender URL-Zahl) ist ein Hinweis darauf, dass der Googlebot regelmäßig Zugriff auf die Seite hat. Ein Verlust indexierter Seiten kann ein Indiz dafür sein, dass Google beispielsweise aufgrund einer fehlerhaften robots.txt-Datei oder von Server-Problemen über einen gewissen Zeitraum nicht auf die Seite zugreifen konnte.