Fundamentos de búsqueda
10 min de lecturaRastreo e indexación de páginas de producto
Que Google rastree tus páginas no garantiza que aparecerán en los resultados de búsqueda. El rastreo y la indexación son dos procesos separados, y entender la brecha entre ambos es crítico para cualquier tienda que gestione miles de URLs de producto.
In this guide
- 1. Rastreo vs. indexación: la diferencia que importa
- 2. Por qué Google omite la indexación de páginas de producto
- 3. Etiquetas canonical y contenido duplicado en ecommerce
- 4. Gestionar la inflación de índice por filtros y facetas
- 5. Verificar el estado de indexación en Google Search Console
- 6. Pasos prácticos para mejorar la indexación de páginas de producto
Rastreo vs. indexación: la diferencia que importa
Rastreo significa que Googlebot visitó tu página y descargó su contenido. Indexación significa que Google analizó ese contenido, lo consideró digno de inclusión y lo almacenó en su índice de búsqueda. Una página puede ser rastreada pero no indexada, lo cual sucede más a menudo de lo que la mayoría de propietarios de tiendas creen.
Piensa en el rastreo como Google recorriendo cada pasillo de tu tienda física. La indexación es Google decidiendo qué productos merecen estar en el estante para que los compradores los encuentren. Si una página de producto tiene contenido delgado, duplica otra página o tiene problemas técnicos, Google puede rastrearla y luego decidir que no merece un lugar en el índice.
Para una tienda online típica con 20.000 páginas de producto, comúnmente vemos que del 30 % al 50 % de esas páginas quedan sin indexar. Eso significa que miles de productos son invisibles en los resultados de búsqueda. La brecha entre páginas rastreadas e indexadas es donde se esconden la mayoría de las oportunidades de SEO para ecommerce.
Por qué Google omite la indexación de páginas de producto
La razón más común por la que Google se niega a indexar una página de producto es el contenido duplicado o casi duplicado. Cuando 500 productos del mismo fabricante comparten descripciones idénticas que solo difieren en el nombre del producto, Google ve poca razón para indexar las 500 versiones. Elige unas pocas e ignora el resto.
El contenido delgado es el segundo mayor culpable. Una página de producto con una descripción de 20 palabras, un precio y un botón de compra proporciona casi ninguna información para que Google la evalúe. Compáralo con un competidor cuya página de producto incluye una descripción única de 300 palabras, reseñas de clientes, tablas de especificaciones e instrucciones de uso. Google indexará la página más rica y omitirá la delgada.
Las señales técnicas también pueden impedir la indexación. Las páginas que cargan lentamente, devuelven errores soft 404, tienen etiquetas canonical contradictorias o están bloqueadas por directivas noindex nunca llegarán al índice sin importar la calidad de su contenido.
Las señales de calidad de página también importan. Si tu sitio tiene una proporción alta de páginas de baja calidad, Google puede reducir la tasa de rastreo para todo tu dominio, dificultando que incluso tus buenas páginas se indexen rápidamente.
Ejecuta un rastreo con Screaming Frog o Sitebulb y filtra por páginas con menos de 100 palabras de texto en el cuerpo. Esas páginas delgadas son tus principales candidatas para mejora de contenido o consolidación.
Etiquetas canonical y contenido duplicado en ecommerce
Las etiquetas canonical le dicen a Google cuál versión de una página es la original cuando múltiples URLs muestran contenido similar o idéntico. Para sitios de ecommerce, la canonicalización no es opcional. Sin ella, Google debe adivinar qué URL indexar, y a menudo adivina mal.
Las variantes de producto crean el escenario canonical más común. Una camiseta azul en /products/cotton-tee?color=blue y una versión roja en /products/cotton-tee?color=red pueden compartir el 90 % de su contenido. Si son realmente el mismo producto con un selector de color, ambas URLs deberían canonicalizar a la página principal del producto en /products/cotton-tee. Si las variantes de color tienen demanda de búsqueda significativamente diferente (la gente busca específicamente "camiseta algodón azul"), pueden justificar páginas indexadas separadas.
La navegación facetada genera aún más complejidad canonical. Una URL como /shoes?size=10&color=black&brand=nike&sort=price-low es una de potencialmente millones de combinaciones de filtro. Estas vistas filtradas deberían canonicalizar a la página de categoría principal o bloquearse de la indexación por completo. La elección depende de si esa combinación específica de filtros tiene demanda de búsqueda real.
Vemos dos errores canonical comunes en tiendas. Primero, canonicals circulares donde la página A canonicaliza a la página B y la página B canonicaliza de vuelta a la página A. Segundo, canonicalizar todas las variantes de producto a un solo padre cuando cada variante tiene volumen de búsqueda independiente, esencialmente ocultando páginas posicionables de Google.
Gestionar la inflación de índice por filtros y facetas
La inflación de índice ocurre cuando Google indexa miles de URLs de bajo valor que diluyen las señales de calidad general de tu sitio. Para ecommerce, la fuente principal de inflación de índice es la navegación facetada que genera URLs filtrables.
Considera una tienda de muebles con 200 productos en la categoría "sofás". Si los compradores pueden filtrar por color (10 opciones), material (8 opciones), rango de precio (5 tramos) y capacidad de asientos (4 opciones), las combinaciones de URL posibles alcanzan 1.600 antes de considerar filtros de selección múltiple. La mayoría de estas vistas filtradas muestran el mismo pequeño conjunto de productos en diferentes órdenes.
El enfoque estándar para controlar la inflación de índice implica tres capas. Primero, usa robots.txt para bloquear a Googlebot de rastrear los patrones de filtro sin valor más evidentes. Segundo, aplica etiquetas noindex a las páginas filtradas que Googlebot aún puede alcanzar por otros caminos. Tercero, usa etiquetas canonical para apuntar las vistas filtradas a la página de categoría principal.
Un enfoque más quirúrgico es permitir selectivamente la indexación en combinaciones de filtros que coincidan con consultas de búsqueda reales. Si la gente busca "sofás de cuero" en números significativos, la URL /sofas?material=cuero podría valer la pena indexar. Pero /sofas?material=cuero&color=marron&asientos=3 casi seguro que no.
Las tiendas Shopify manejan esto de forma diferente a WooCommerce o Magento porque Shopify no genera URLs de filtro por defecto. Las apps de filtro de terceros como Smart Product Filter crean estas URLs, y cada app maneja las etiquetas canonical y los controles de indexación de manera diferente. Siempre verifica cómo tu app de filtros gestiona estos detalles técnicos.
Verificar el estado de indexación en Google Search Console
Google Search Console proporciona dos herramientas principales para monitorear la indexación. El informe de Páginas (antes informe de Cobertura) muestra cuántas de tus páginas están indexadas y por qué el resto fue excluido. La herramienta de Inspección de URLs te permite verificar el estado de páginas individuales.
En el informe de Páginas, concéntrate en la pestaña "No indexadas". Google agrupa las páginas excluidas por razón: "Rastreada, actualmente no indexada", "Descubierta, actualmente no indexada", "Duplicado sin canonical seleccionada por el usuario", "Excluida por etiqueta noindex", y varias otras. Cada razón requiere una solución diferente.
"Rastreada, actualmente no indexada" significa que Google visitó la página pero eligió no añadirla al índice. Esto normalmente señala un problema de calidad de contenido. Mejorar el contenido de la página, añadir descripciones únicas o enriquecerla con reseñas y datos estructurados puede ayudar.
"Descubierta, actualmente no indexada" significa que Google sabe que la URL existe pero no se ha molestado en rastrearla aún. Esto indica baja prioridad de rastreo, a menudo causada por enlazado interno débil o la página estando demasiado profunda en la jerarquía del sitio.
La herramienta de Inspección de URLs te muestra exactamente lo que Google ve cuando rastrea una página específica. Úsala para verificar que tus etiquetas canonical estén siendo respetadas, que tu página se renderice correctamente y que no haya etiquetas noindex accidentales bloqueando la indexación. Recomendamos inspeccionar de 10 a 20 páginas de producto representativas mensualmente para detectar problemas temprano.
Exporta los datos de "No indexadas" de GSC como hoja de cálculo y categoriza las páginas por tipo (producto, categoría, filtro, blog). Esto revela si tus problemas de indexación se concentran en un tipo de página específico, haciendo la solución más dirigida.
Pasos prácticos para mejorar la indexación de páginas de producto
Comienza auditando qué páginas de producto están indexadas actualmente. Usa el operador site: en Google (site:tutienda.com/products/) para obtener un conteo aproximado, luego contrasta con los datos de GSC para mayor precisión. Si menos del 70 % de tus páginas de producto están indexadas, tienes trabajo por hacer.
Escribe descripciones de producto únicas primero para tus productos más vendidos y de mayor margen. Estas páginas tienen el mayor potencial de ingresos desde la búsqueda orgánica. Incluso añadir de 150 a 200 palabras de contenido único y descriptivo por página de producto puede marcar la diferencia entre indexada e ignorada.
Consolida páginas que no sirven ningún propósito independiente. Si tienes 30 variantes de color del mismo producto y ninguno de esos términos específicos de color tiene volumen de búsqueda, consolídalos bajo una sola página de producto con un selector de color. Esa única página fuerte superará a 30 páginas delgadas siempre.
Fortalece el enlazado interno hacia páginas de producto que quieres indexadas. Enlaza desde publicaciones de blog relacionadas, desde la sección de productos destacados de la página de inicio y desde otras páginas de producto vía widgets de "los clientes también compraron" o "productos relacionados". Cada enlace interno adicional señala a Google que la página es relevante.
Finalmente, mantén tu sitemap limpio. Elimina URLs que devuelven errores 404, que están configuradas como noindex o que has decidido consolidar. Un sitemap limpio que solo contenga páginas que genuinamente quieres indexadas le da a Google una imagen más clara de la estructura de tu sitio.
Herramientas y recursos gratuitos
Trabaja con expertos SEO que entienden el e-commerce
La primera agencia SEO del mundo fundada por e-commerce