Fondamenti della ricerca

10 min di lettura

Scansione e indicizzazione delle pagine prodotto

Il fatto che Google scansioni le tue pagine non garantisce che appariranno nei risultati di ricerca. La scansione e l'indicizzazione sono due processi separati, e comprendere il divario tra i due è fondamentale per qualsiasi negozio che gestisce migliaia di URL di prodotto.

Scansione vs. indicizzazione: la differenza che conta

Scansione significa che Googlebot ha visitato la tua pagina e ne ha scaricato il contenuto. Indicizzazione significa che Google ha analizzato quel contenuto, lo ha ritenuto degno di inclusione e lo ha memorizzato nel suo indice di ricerca. Una pagina può essere scansionata ma non indicizzata, cosa che accade più spesso di quanto la maggior parte dei proprietari di negozi realizzi.

Pensa alla scansione come Google che percorre ogni corsia del tuo negozio fisico. L'indicizzazione è Google che decide quali prodotti meritano di essere messi sullo scaffale perché gli acquirenti li trovino. Se una pagina prodotto ha contenuti sottili, duplica un'altra pagina o ha problemi tecnici, Google può scansionarla e poi decidere che non merita un posto nell'indice.

Per un tipico negozio online con 20.000 pagine prodotto, vediamo comunemente che dal 30 % al 50 % di quelle pagine non viene indicizzato. Ciò significa che migliaia di prodotti sono invisibili nei risultati di ricerca. Il divario tra pagine scansionate e indicizzate è dove si nascondono la maggior parte delle opportunità SEO ecommerce.

Scansionata: Googlebot ha visitato e scaricato il contenuto della pagina
Indicizzata: Google ha analizzato e memorizzato la pagina nel suo database di ricerca
Scansionata ma non indicizzata: Google ha visto la pagina ma ha scelto di non includerla
Non scansionata: Google non ha ancora visitato la pagina o l'ha saltata intenzionalmente

Perché Google salta l'indicizzazione delle pagine prodotto

La ragione più comune per cui Google rifiuta di indicizzare una pagina prodotto è il contenuto duplicato o quasi duplicato. Quando 500 prodotti dello stesso produttore condividono descrizioni identiche che differiscono solo nel nome del prodotto, Google vede poco motivo per indicizzare tutte le 500 versioni. Ne sceglie alcune e ignora il resto.

Il contenuto sottile è il secondo maggior colpevole. Una pagina prodotto con una descrizione di 20 parole, un prezzo e un pulsante acquista fornisce quasi nessuna informazione per la valutazione di Google. Confrontala con un concorrente la cui pagina prodotto include una descrizione unica di 300 parole, recensioni dei clienti, tabelle delle specifiche e istruzioni d'uso. Google indicizzerà la pagina più ricca e salterà quella sottile.

Anche i segnali tecnici possono impedire l'indicizzazione. Le pagine che caricano lentamente, restituiscono errori soft 404, hanno tag canonical contrastanti o sono bloccate da direttive noindex non entreranno mai nell'indice, indipendentemente dalla qualità del loro contenuto.

Contano anche i segnali di qualità della pagina. Se il tuo sito ha un'alta proporzione di pagine di bassa qualità, Google può ridurre la frequenza di crawl per l'intero dominio, rendendo più difficile l'indicizzazione rapida anche delle tue pagine valide.

Descrizioni duplicate o quasi duplicate tra le pagine prodotto
Contenuto sottile con meno di 50 parole di testo unico
Tempi di caricamento lenti superiori a 5 secondi
Tag canonical contrastanti o errati
Tag noindex applicati accidentalmente da plugin o impostazioni del tema
Tip

Esegui un crawl con Screaming Frog o Sitebulb e filtra le pagine con meno di 100 parole di corpo del testo. Quelle pagine sottili sono i tuoi principali candidati per il miglioramento o il consolidamento dei contenuti.

Tag canonical e contenuto duplicato nell'ecommerce

I tag canonical indicano a Google quale versione di una pagina è l'originale quando più URL mostrano contenuto simile o identico. Per i siti ecommerce, la canonicalizzazione non è opzionale. Senza di essa, Google deve indovinare quale URL indicizzare, e spesso indovina male.

Le varianti di prodotto creano lo scenario canonical più comune. Una maglietta blu a /products/cotton-tee?color=blue e una versione rossa a /products/cotton-tee?color=red possono condividere il 90 % del contenuto. Se sono veramente lo stesso prodotto con un selettore di colore, entrambe le URL dovrebbero canonicalizzare alla pagina prodotto principale a /products/cotton-tee. Se le varianti di colore hanno una domanda di ricerca significativamente diversa (le persone cercano specificamente "maglietta cotone blu"), possono giustificare pagine indicizzate separate.

La navigazione a faccette genera ancora più complessità canonical. Un URL come /shoes?size=10&color=black&brand=nike&sort=price-low è una delle potenzialmente milioni di combinazioni di filtri. Queste viste filtrate dovrebbero canonicalizzare alla pagina di categoria principale o essere bloccate dall'indicizzazione interamente. La scelta dipende dal fatto che quella specifica combinazione di filtri abbia una reale domanda di ricerca.

Vediamo i negozi commettere due errori canonical comuni. Primo, canonical circolari dove la pagina A canonicalizza alla pagina B e la pagina B canonicalizza alla pagina A. Secondo, canonicalizzare tutte le varianti di prodotto a un singolo genitore quando ogni variante ha volume di ricerca indipendente, nascondendo essenzialmente pagine posizionabili da Google.

Gestire il gonfiamento dell'indice da filtri e faccette

Il gonfiamento dell'indice si verifica quando Google indicizza migliaia di URL di basso valore che diluiscono i segnali di qualità complessivi del tuo sito. Per l'ecommerce, la fonte principale di gonfiamento dell'indice è la navigazione a faccette che genera URL filtrabili.

Considera un negozio di mobili con 200 prodotti nella categoria "divani". Se gli acquirenti possono filtrare per colore (10 opzioni), materiale (8 opzioni), fascia di prezzo (5 intervalli) e posti a sedere (4 opzioni), le possibili combinazioni di URL raggiungono 1.600 prima di considerare i filtri a selezione multipla. La maggior parte di queste viste filtrate mostra lo stesso piccolo insieme di prodotti in ordini diversi.

L'approccio standard per controllare il gonfiamento dell'indice coinvolge tre livelli. Primo, usa robots.txt per bloccare Googlebot dalla scansione dei pattern di filtro senza valore più ovvi. Secondo, applica tag noindex alle pagine filtrate che Googlebot può ancora raggiungere attraverso altri percorsi. Terzo, usa tag canonical per puntare le viste filtrate alla pagina di categoria principale.

Un approccio più chirurgico è consentire selettivamente l'indicizzazione sulle combinazioni di filtri che corrispondono a query di ricerca reali. Se le persone cercano "divani in pelle" in numeri significativi, l'URL /divani?materiale=pelle potrebbe valere l'indicizzazione. Ma /divani?materiale=pelle&colore=marrone&posti=3 quasi certamente no.

I negozi Shopify gestiscono questo diversamente da WooCommerce o Magento perché Shopify non genera URL di filtro per default. Le app di filtro di terze parti come Smart Product Filter creano queste URL, e ogni app gestisce tag canonical e controlli di indicizzazione diversamente. Verifica sempre come la tua app di filtro gestisce questi dettagli tecnici.

Verifica il conteggio delle URL indicizzate in GSC e confronta con le pagine indicizzabili previste
Blocca i pattern di filtro senza valore in robots.txt come prima linea di difesa
Applica noindex alle pagine filtrate che vengono scansionate nonostante le regole robots.txt
Indicizza selettivamente le combinazioni di filtro ad alto valore con domanda comprovata
Rivedi le impostazioni delle app di filtro di terze parti per la gestione canonical e indicizzazione

Controllare lo stato di indicizzazione in Google Search Console

Google Search Console fornisce due strumenti principali per monitorare l'indicizzazione. Il report Pagine (precedentemente report Copertura) mostra quante delle tue pagine sono indicizzate e perché il resto è stato escluso. Lo strumento Controllo URL ti permette di verificare lo stato di singole pagine.

Nel report Pagine, concentrati sulla scheda "Non indicizzate". Google raggruppa le pagine escluse per motivo: "Scansionata, attualmente non indicizzata", "Scoperta, attualmente non indicizzata", "Duplicato senza canonical selezionata dall'utente", "Esclusa dal tag noindex", e diversi altri. Ogni motivo richiede una correzione diversa.

"Scansionata, attualmente non indicizzata" significa che Google ha visitato la pagina ma ha scelto di non aggiungerla all'indice. Questo di solito segnala un problema di qualità dei contenuti. Migliorare il contenuto della pagina, aggiungere descrizioni uniche o arricchirla con recensioni e dati strutturati può aiutare.

"Scoperta, attualmente non indicizzata" significa che Google sa che l'URL esiste ma non si è ancora preso la briga di scansionarla. Questo indica bassa priorità di crawl, spesso causata da linking interno debole o dalla pagina che si trova troppo in profondità nella gerarchia del sito.

Lo strumento Controllo URL ti mostra esattamente cosa vede Google quando scansiona una pagina specifica. Usalo per verificare che i tuoi tag canonical vengano rispettati, che la tua pagina sia renderizzata correttamente e che nessun tag noindex accidentale stia bloccando l'indicizzazione. Raccomandiamo di ispezionare da 10 a 20 pagine prodotto rappresentative mensilmente per individuare i problemi in anticipo.

Tip

Esporta i dati "Non indicizzate" da GSC come foglio di calcolo e categorizza le pagine per tipo (prodotto, categoria, filtro, blog). Questo rivela se i tuoi problemi di indicizzazione sono concentrati in un tipo di pagina specifico, rendendo la correzione più mirata.

Passi pratici per migliorare l'indicizzazione delle pagine prodotto

Inizia verificando quali pagine prodotto sono attualmente indicizzate. Usa l'operatore site: in Google (site:tuonegozio.com/products/) per ottenere un conteggio approssimativo, poi confronta con i dati GSC per accuratezza. Se meno del 70 % delle tue pagine prodotto sono indicizzate, hai del lavoro da fare.

Scrivi descrizioni di prodotto uniche per i tuoi prodotti più venduti e a margine più alto prima. Queste pagine hanno il maggior potenziale di ricavi dalla ricerca organica. Anche aggiungere da 150 a 200 parole di contenuto unico e descrittivo per pagina prodotto può fare la differenza tra indicizzata e ignorata.

Consolida le pagine che non servono a uno scopo indipendente. Se hai 30 varianti di colore dello stesso prodotto e nessuno di quei termini specifici per colore ha volume di ricerca, consolidali sotto un'unica pagina prodotto con un selettore di colore. Quella singola pagina forte supererà 30 pagine sottili ogni volta.

Rafforza il linking interno verso le pagine prodotto che vuoi indicizzate. Linka da articoli di blog correlati, dalla sezione prodotti in evidenza della homepage e da altre pagine prodotto tramite widget "i clienti hanno anche acquistato" o "prodotti correlati". Ogni link interno aggiuntivo segnala a Google che la pagina è importante.

Infine, mantieni la tua sitemap pulita. Rimuovi le URL che restituiscono errori 404, che sono impostate su noindex o che hai deciso di consolidare. Una sitemap snella che contiene solo pagine che vuoi genuinamente indicizzate dà a Google un'immagine più chiara della struttura del tuo sito.

Verifica i tassi di indicizzazione attuali usando GSC e l'operatore site:
Scrivi descrizioni uniche per i prodotti più venduti prima
Consolida le pagine di varianti sottili sotto singole pagine prodotto forti
Costruisci link interni da articoli del blog, homepage e prodotti correlati
Pulisci la tua sitemap per includere solo URL genuinamente indicizzabili

Lavora con esperti SEO che capiscono l’e-commerce

La prima agenzia SEO al mondo fondata dall’e-commerce

Scansione e indicizzazione delle pagine prodotto - EcomSEO Academy | EcomSEO