Technisches SEO

Teilweise Indexierung: warum Seiten bei Google verschwinden

Por Lucas ·

Praktische Diagnose von Coverage-Problemen in der Search Console: wie man Seiten identifiziert, priorisiert und behebt, die Google nicht indexiert.

Sie haben 800 Artikel veroffentlicht, die Search Console meldet 312 indexiert, und der Kunde will wissen, wo die anderen 488 stecken. Die ehrliche Antwort steht selten im Sitemap-XML. Teilweise Indexierung ist ein zusammengesetztes Symptom: teils technisch, teils qualitativ, teils architektonisch. Bevor Sie Googlebot beschuldigen, trennen Sie Seiten, die er nicht crawlen kann, Seiten, die er crawlt und ablehnt, und Seiten, die er mit geringer Zuverlassigkeit indexiert. Jeder Bucket braucht einen anderen Eingriff, und alle als dasselbe Problem zu behandeln ist der haufigste Fehler in Coverage-Audits.

Startpunkt ist der Seiten-Bericht in GSC, besonders Gecrawlt, zurzeit nicht indexiert und Gefunden, zurzeit nicht indexiert. Ersteres heisst, Google hat den Inhalt gesehen und beiseitegelegt; Zweiteres, dass er nicht einmal den Fetch priorisiert hat. Bei einem E-Commerce-Kunden mit 14k SKUs fanden wir 6.200 URLs in Gefunden, gefangen in tiefer PLP-Paginierung, ein Lehrbuchfall von schlecht verteiltem Crawl Budget: wann es kritisch wird und wie man es misst. Die Loesung war keine erzwungene Reindexierung, sondern 40% der paginierten URLs durch Filterkonsolidierung zu streichen, was meist On-Page fur E-Commerce: PLP vs PDP ohne Kannibalisierung entwirrt, die in stiller Kannibalisierung feststecken.

Wird die Seite gecrawlt, aber abgelehnt, verschiebt sich das Problem zur wahrgenommenen Qualitaet. Google berechnet einen internen Score aus Duplikatssignalen, semantischer Tiefe und SERP-Nachfrage; Seiten unter dem Schwellenwert werden zu Geistern. Hier zeigt die Log file analysis: Was Googlebot wirklich tut Muster, die GSC verbirgt: die Bot-Besuchsfrequenz sinkt Woche fuer Woche, ein Desinteressesignal, das weit frueher als der Index-Wurf feuert. Aus Logs und Coverage-Bericht konnten wir Decay bis zu 3 Wochen im Voraus erkennen, was das Eingriffsfenster des Redaktionsteams komplett verschiebt.

Danach folgen die technischen Verdaechtigen. Eine falsch konfigurierte robots.txt, eine vergessene noindex-Direktive im Template, ein Canonical, der auf die falsche Seite zeigt. Jeder erzeugt ein stilles Leck, und Tools wie Screaming Frog, Sitebulb und die URL Inspection API loesen in Stunden, was ein manueller Auditor in Wochen finden wuerde. Ich empfehle, die Checklisten robots.txt: Fallen, die die Indexierung lautlos blockieren und Canonical Tags: haeufige Fehler, die organischen Traffic ausbluten parallel zu durchlaufen, bevor irgendeine Content-Hypothese aufgestellt wird, denn 30% der Faelle enden hier und sparen unnoetiges Umschreiben. Fuegen Sie hreflang-Validierung hinzu, wenn die Seite mehrsprachig ist, gemaess hreflang ohne schmerzen: implementierung fuer mehrsprachige websites.

Die Content-Dimension kommt ins Spiel, sobald das Technische sauber ist. Duenne Seiten, teilweise duplizierter Inhalt oder Material, das die dominante Suchintention verfehlt, fallen zuerst. Filtern Sie den Leistungsbericht nach geringen Impressionen und CTR null, um Kandidaten zu finden, und vergleichen Sie mit der aktuellen SERP: zeigt Seite eins heute ein Vergleichsformat und Ihr Artikel ist ein generisches Listicle, hat Google bereits entschieden. Der Rahmen aus Suchintention: 4 Typen und wie man sie in der SERP mappt hilft, neu zu klassifizieren, bevor Sie zu Neuschreiben oder neubauen: Entscheidung anhand von SERP-Daten uebergehen, einer Entscheidung, die datengetrieben statt gefuehlsbasiert getroffen werden muss.

Die interne Architektur schliesst die Diagnose ab. Verwaiste Seiten mit weniger als 2 internen Verlinkungen fallen 4-mal haeufiger innerhalb von 90 Tagen aus dem Index, basierend auf Daten aus 12 Audits im letzten Quartal. Eine solide Intelligentes Interlinking: die Karte interner Autoritaet-Karte verteilt Equity neu, ohne neue Backlinks zu brauchen, und holt URLs meist in 2 bis 6 Wochen zurueck. Kombinieren Sie das mit einer sauberen XML-Sitemap ohne 404s oder Redirects, wie in Modernes XML-Sitemap: Prioritaet, lastmod und was du ignorieren kannst beschrieben, und Sie entziehen Google die letzten Vorwaende, Ihr Inventar zu ignorieren.

Praktisches Takeaway: Bauen Sie eine woechentliche Pipeline mit drei BigQuery-Abfragen auf rohen GSC-Daten, einem Screaming-Frog-Crawl und Serverlogs der letzten 4 Wochen. Klassifizieren Sie jede nicht indexierte URL als Technik, Qualitaet oder Architektur und priorisieren Sie nach historischem Impressionspotenzial. Teilweise Indexierung loest sich nicht per Klick auf Indexierung beantragen, sondern durch das Beseitigen der Gruende, warum Google entschieden hat, kein Budget auf Ihre Seite zu verwenden.

Nenhum comentário ainda

Seja o primeiro a comentar.

Deixe seu comentário

Entre com sua conta Canverly para comentar. Você pode usar a mesma conta em qualquer site da rede.

Entrar com Canverly