SEO Técnico

Indexacion parcial: por que las paginas desaparecen de Google

Por Lucas ·

Diagnostico practico de problemas de cobertura en Search Console: como identificar, priorizar y resolver paginas que Google decide no indexar.

Publicaste 800 articulos, Search Console reporta 312 indexados, y el cliente quiere saber donde estan los otros 488. La respuesta honesta rara vez esta en el XML del sitemap. La indexacion parcial es un sintoma compuesto: parte tecnica, parte calidad, parte arquitectura. Antes de culpar a Googlebot, hay que separar paginas que no puede rastrear, paginas que rastrea pero rechaza, y paginas que indexa con baja confianza. Cada grupo pide una intervencion distinta, y tratar todo como el mismo problema es el error mas frecuente en auditorias de cobertura.

El punto de partida es el informe Paginas de GSC, especificamente las categorias Rastreada, actualmente no indexada y Descubierta, actualmente no indexada. La primera indica que Google vio el contenido y decidio archivarlo; la segunda, que ni siquiera prioritizo el fetch. En un cliente de e-commerce con 14k SKUs encontramos 6.200 URLs en Descubierta atrapadas en paginacion profunda de PLP, un caso clasico de Crawl budget: cuando preocuparse y como medirlo mal distribuido. La correccion no fue forzar reindexacion, fue cortar 40% de URLs paginadas via consolidacion de filtros, lo que suele desbloquear On-page para e-commerce: PLP vs PDP sin canibalizar atascados en canibalizacion silenciosa.

Cuando la pagina es rastreada pero rechazada, el problema migra a calidad percibida. Google calcula un score interno que combina senales de duplicacion, profundidad semantica y demanda de SERP, y las paginas bajo el umbral se vuelven fantasmas. Aqui el Log file analysis: que esta haciendo realmente Googlebot revela patrones que GSC esconde: frecuencia de visita del bot cayendo semana a semana, una senal de desinteres mucho mas temprana que la salida del indice. Cruzando logs con el reporte de cobertura logramos anticipar decay hasta 3 semanas antes, y eso cambia por completo la ventana de intervencion del equipo editorial.

Los sospechosos tecnicos vienen despues. Un robots.txt mal escrito, una directiva noindex olvidada en template, un canonical apuntando a otra pagina por error. Cada uno crea un agujero silencioso, y herramientas como Screaming Frog, Sitebulb y la propia URL Inspection API resuelven en horas lo que un auditor manual tardaria semanas. Recomiendo correr en paralelo el checklist de robots.txt: trampas que bloquean la indexacion en silencio y Canonical tags: errores comunes que sangran trafico organico antes de cualquier hipotesis de contenido, porque 30% de los casos mueren aqui y se ahorra reescritura innecesaria. Suma validacion de hreflang si el sitio es multilingue, segun hreflang sin dolor: implementacion para sitios multilingues.

La dimension de contenido entra despues que lo tecnico esta limpio. Paginas delgadas, contenido duplicado parcial, o material que no responde la intencion dominante caen primero. Usa el reporte de Rendimiento filtrado por impresiones bajas y CTR cero para encontrar candidatos, y cruza con datos del SERP actual: si la primera pagina hoy muestra formato comparativo y tu articulo es un listicle generico, Google ya decidio. La pista de Intencion de busqueda: 4 tipos y como mapearla en la SERP ayuda a reclasificar antes de pasar a Reescribir o rehacer: la decision basada en datos de SERP, decision que debe ser por datos, no por sentimiento.

Arquitectura interna cierra el diagnostico. Paginas huerfanas, con menos de 2 enlaces internos apuntando, son 4x mas propensas a salir del indice en ventanas de 90 dias, segun datos que recogimos en 12 auditorias el ultimo trimestre. Un mapa de Interlinking inteligente: el mapa de autoridad interna bien hecho redistribuye equity sin necesitar backlinks nuevos, y suele traer URLs de regreso en 2 a 6 semanas. Combina eso con sitemap XML limpio, sin URLs 404 o redirigidas, segun Sitemap XML moderno: prioridad, lastmod y que ignorar, y eliminas los ultimos pretextos para que Google ignore tu inventario.

Takeaway practico: monta un pipeline semanal con tres queries en BigQuery jalando GSC crudo, un crawl de Screaming Frog y logs del servidor de las ultimas 4 semanas. Clasifica cada URL no indexada en tecnica, calidad o arquitectura, y prioriza por las de mayor potencial de impresion historica. La indexacion parcial no se resuelve con el boton Solicitar Indexacion, se resuelve eliminando las razones por las que Google prefirio no gastar recurso en tu pagina.

Nenhum comentário ainda

Seja o primeiro a comentar.

Deixe seu comentário

Entre com sua conta Canverly para comentar. Você pode usar a mesma conta em qualquer site da rede.

Entrar com Canverly