Indexierung

Eine Indexierung vom Crawler ist notwendig, damit Seiteninhalte von Google erfasst werden

Hast Du eine Webseite, muss sie für Google und andere Suchmaschinen auffindbar sein.

Das ist nur möglich, wenn sie zuvor indexiert wurde.

Befinden sich ihre Inhalte im Index, kann der Suchende sie über die Eingabe bestimmter Keywords schnell aufrufen.

Indexierung

Was versteht man unter Indexierung?

Indexieren bedeutet, Informationen zu erfassen. Auf das Internet bezogen, versteht man darunter die Aufnahme von Webseiten in den Google Index. Dieses umfangreiche Suchmaschinenverzeichnis enthält alle vom Google Robot (Crawler, Bot) durchsuchten und gespeicherten Seiten. Wird Deine Seite beispielsweise aufgrund eines Fehlers in der URL nicht in den Index aufgenommen, erscheint sie nicht unter den organischen Suchergebnissen.

Im Unterschied zu einem Lexikon ist der Google Index dynamisch. Dauernd kommen neue Webseiten hinzu. Andere werden entfernt, weil sie gegen die Google Richtlinien verstoßen. Darüber hinaus ändern sich die Seiten und die Kriterien für das Suchmaschinenranking laufend. Wie die Bewertung der Inhalte durch Google erfolgt, verrät der Suchmaschinenanbieter nicht. Den Google Index nutzen auch Suchmaschinen wie Yahoo und Bing.

Der indexierte Content wird mit verschiedenen Deskriptoren wie beispielsweise Keywords ausgestattet, gesammelt, sortiert und für die Suche aufbereitet. Gibt eine Person bei Google ein Suchwort oder eine Keywordkombination ein, werden ihr alle relevanten Inhalte angezeigt. Die Seiten Indexierung basiert auf dem Data Mining, dem Isolieren wichtiger Inhalte aus einer umfangreichen Datenmenge. Google nutzt mittlerweile den Caffeine-Index. Für ihn durchsuchen Bots das Internet rund um die Uhr. So werden Textseiten und URL mit Videos und Podcasts schneller indexiert und gefunden.

Wie funktioniert die Indexierung?

Der größte Suchmaschinenanbieter der Welt nutzt zum Indexieren einen Crawler (Bot, Robot). Das ist eine Software, die mithilfe der KI arbeitet. Der Bot durchsucht (crawlt) alle Seiten und Unterseiten auf Links und wandert von einem Link zum nächsten. Dabei findet er miteinander verlinkte Seiten. Er liest den Quellcode der Seiten aus und sendet ihn anschließend an den Index. Dort erfolgt die Sortierung und Hierarchisierung der Seiten nach definierten Rankingfaktoren. Diese Bewertung erfolgt mithilfe eines speziellen Algorithmus.

Warum ist die Indexierung für die SEO wichtig?

Die Indexierung ist Voraussetzung für die SEO: Ohne Aufnahme in den Index können Suchmaschinen Deine Seite nicht finden. Zusätzliche Onpage- und Offpage-Optimierungen und regelmäßig aktualisierter nützlicher Content können Deiner Seite bei der Indexierung ein höheres Ranking verschaffen.

Wie Du die Indexierung einleitest beziehungsweise verhinderst

Webseiteninhaber mussten früher bei Google einen Antrag auf Indexierung stellen. Und dafür war das Vorhandensein eines Google-Kontos erforderlich. Seit Einführung des Caffeine-Index ist das nicht mehr nötig. Allerdings kannst Du trotzdem in der Google Search Console einen Antrag auf Aufnahme Deiner URL stellen. Damit Deine Seite vollständig indexiert wird, lädst Du bei den Google Webmaster Tools eine Sitemap Deiner Webseite hoch. Diese enthält alle URL Deiner Seite. Damit der Crawler Deine Webseite einlesen kann, fügst Du Meta-Informationen in den Content ein. Diese bestehen aus Meta-Title und Meta-Description. Außerdem kannst Du Meta-Tags und andere Instruktionen an den Robot integrieren.

Die Dauer bis zur vollständigen Indexierung nach der manuellen Anmeldung beträgt im Extremfall mehrere Wochen bis Monate. Üblicherweise erfolgt sie jedoch innerhalb weniger Tage. Für die unterschiedliche Zeitdauer und den variierenden Umfang gibt es mehrere Gründe. Bestehende Webseiten werden anders indexiert als neu angelegte. Seiten mit vielen eingehenden Links können von den Google Crawlern schneller gefunden werden. Manchmal möchten Webseiten-Inhaber ihren Content nicht indexieren lassen. Das ist beispielsweise der Fall, wenn die Seite

Möchtest Du das Indexieren verhindern, kannst Du das beispielsweise mit dem noindex Meta-Tag tun. Mit ihm kennzeichnest Du nicht themenrelevante Seiten wie Kategorieseiten (Onlineshops), Impressum und Datenschutzrichtlinien. Mithilfe der robots.txt Datei sperrst Du einige Unterordner Deiner Domain oder die gesamte Domain. Wurde Deine URL aufgrund negativer SEO oder eines Hacks aus dem Verzeichnis entfernt, kannst Du das problemlos rückgängig machen: Du stellst bei Google einen Antrag auf Wiederaufnahme.

Warum Du die Indexierung kontrollieren solltest

Google ändert seine Algorithmen regelmäßig, damit die Bots Spamseiten und Link-Netzwerke nicht indexieren können. Daher solltest Du Dir als Webmaster den Status von Zeit zu Zeit anzeigen lassen. Dafür ist lediglich eine Registrierung bei den Webmaster Tools erforderlich.

Häufige Fragen und Antworten

Was heißt „eine Seite ist indexiert“?
Im Idealfall werden sämtliche relevanten Unterseiten vom Crawler zuverlässig erfasst und indexiert, also über die Suchmaschine auffindbar gemacht. Kann im Gegenzug ein Google-Bot eine Webseite nicht indexieren, werden keine Links zu der entsprechenden Seite in den Google SERPs ausgegeben.
Wird Deine Website bei Google indexiert?
Wenn Du Google Search Console bislang nicht nutzt, dann solltest du das nun tun. Es ist kostenlos. Und jeder, der eine Website betreibt und sich dafür interessiert, welchen Traffic er von Google bekommt, sollte die Google Search Console nutzen. Wenn die Seite im index ist, erhältst du die Antwort “URL is on Google.”