Fondamenti della ricerca
10 min di letturaScansione e indicizzazione delle pagine prodotto
Il fatto che Google scansioni le tue pagine non garantisce che appariranno nei risultati di ricerca. La scansione e l'indicizzazione sono due processi separati, e comprendere il divario tra i due è fondamentale per qualsiasi negozio che gestisce migliaia di URL di prodotto.
In this guide
- 1. Scansione vs. indicizzazione: la differenza che conta
- 2. Perché Google salta l'indicizzazione delle pagine prodotto
- 3. Tag canonical e contenuto duplicato nell'ecommerce
- 4. Gestire il gonfiamento dell'indice da filtri e faccette
- 5. Controllare lo stato di indicizzazione in Google Search Console
- 6. Passi pratici per migliorare l'indicizzazione delle pagine prodotto
Scansione vs. indicizzazione: la differenza che conta
Scansione significa che Googlebot ha visitato la tua pagina e ne ha scaricato il contenuto. Indicizzazione significa che Google ha analizzato quel contenuto, lo ha ritenuto degno di inclusione e lo ha memorizzato nel suo indice di ricerca. Una pagina può essere scansionata ma non indicizzata, cosa che accade più spesso di quanto la maggior parte dei proprietari di negozi realizzi.
Pensa alla scansione come Google che percorre ogni corsia del tuo negozio fisico. L'indicizzazione è Google che decide quali prodotti meritano di essere messi sullo scaffale perché gli acquirenti li trovino. Se una pagina prodotto ha contenuti sottili, duplica un'altra pagina o ha problemi tecnici, Google può scansionarla e poi decidere che non merita un posto nell'indice.
Per un tipico negozio online con 20.000 pagine prodotto, vediamo comunemente che dal 30 % al 50 % di quelle pagine non viene indicizzato. Ciò significa che migliaia di prodotti sono invisibili nei risultati di ricerca. Il divario tra pagine scansionate e indicizzate è dove si nascondono la maggior parte delle opportunità SEO ecommerce.
Perché Google salta l'indicizzazione delle pagine prodotto
La ragione più comune per cui Google rifiuta di indicizzare una pagina prodotto è il contenuto duplicato o quasi duplicato. Quando 500 prodotti dello stesso produttore condividono descrizioni identiche che differiscono solo nel nome del prodotto, Google vede poco motivo per indicizzare tutte le 500 versioni. Ne sceglie alcune e ignora il resto.
Il contenuto sottile è il secondo maggior colpevole. Una pagina prodotto con una descrizione di 20 parole, un prezzo e un pulsante acquista fornisce quasi nessuna informazione per la valutazione di Google. Confrontala con un concorrente la cui pagina prodotto include una descrizione unica di 300 parole, recensioni dei clienti, tabelle delle specifiche e istruzioni d'uso. Google indicizzerà la pagina più ricca e salterà quella sottile.
Anche i segnali tecnici possono impedire l'indicizzazione. Le pagine che caricano lentamente, restituiscono errori soft 404, hanno tag canonical contrastanti o sono bloccate da direttive noindex non entreranno mai nell'indice, indipendentemente dalla qualità del loro contenuto.
Contano anche i segnali di qualità della pagina. Se il tuo sito ha un'alta proporzione di pagine di bassa qualità, Google può ridurre la frequenza di crawl per l'intero dominio, rendendo più difficile l'indicizzazione rapida anche delle tue pagine valide.
Esegui un crawl con Screaming Frog o Sitebulb e filtra le pagine con meno di 100 parole di corpo del testo. Quelle pagine sottili sono i tuoi principali candidati per il miglioramento o il consolidamento dei contenuti.
Tag canonical e contenuto duplicato nell'ecommerce
I tag canonical indicano a Google quale versione di una pagina è l'originale quando più URL mostrano contenuto simile o identico. Per i siti ecommerce, la canonicalizzazione non è opzionale. Senza di essa, Google deve indovinare quale URL indicizzare, e spesso indovina male.
Le varianti di prodotto creano lo scenario canonical più comune. Una maglietta blu a /products/cotton-tee?color=blue e una versione rossa a /products/cotton-tee?color=red possono condividere il 90 % del contenuto. Se sono veramente lo stesso prodotto con un selettore di colore, entrambe le URL dovrebbero canonicalizzare alla pagina prodotto principale a /products/cotton-tee. Se le varianti di colore hanno una domanda di ricerca significativamente diversa (le persone cercano specificamente "maglietta cotone blu"), possono giustificare pagine indicizzate separate.
La navigazione a faccette genera ancora più complessità canonical. Un URL come /shoes?size=10&color=black&brand=nike&sort=price-low è una delle potenzialmente milioni di combinazioni di filtri. Queste viste filtrate dovrebbero canonicalizzare alla pagina di categoria principale o essere bloccate dall'indicizzazione interamente. La scelta dipende dal fatto che quella specifica combinazione di filtri abbia una reale domanda di ricerca.
Vediamo i negozi commettere due errori canonical comuni. Primo, canonical circolari dove la pagina A canonicalizza alla pagina B e la pagina B canonicalizza alla pagina A. Secondo, canonicalizzare tutte le varianti di prodotto a un singolo genitore quando ogni variante ha volume di ricerca indipendente, nascondendo essenzialmente pagine posizionabili da Google.
Gestire il gonfiamento dell'indice da filtri e faccette
Il gonfiamento dell'indice si verifica quando Google indicizza migliaia di URL di basso valore che diluiscono i segnali di qualità complessivi del tuo sito. Per l'ecommerce, la fonte principale di gonfiamento dell'indice è la navigazione a faccette che genera URL filtrabili.
Considera un negozio di mobili con 200 prodotti nella categoria "divani". Se gli acquirenti possono filtrare per colore (10 opzioni), materiale (8 opzioni), fascia di prezzo (5 intervalli) e posti a sedere (4 opzioni), le possibili combinazioni di URL raggiungono 1.600 prima di considerare i filtri a selezione multipla. La maggior parte di queste viste filtrate mostra lo stesso piccolo insieme di prodotti in ordini diversi.
L'approccio standard per controllare il gonfiamento dell'indice coinvolge tre livelli. Primo, usa robots.txt per bloccare Googlebot dalla scansione dei pattern di filtro senza valore più ovvi. Secondo, applica tag noindex alle pagine filtrate che Googlebot può ancora raggiungere attraverso altri percorsi. Terzo, usa tag canonical per puntare le viste filtrate alla pagina di categoria principale.
Un approccio più chirurgico è consentire selettivamente l'indicizzazione sulle combinazioni di filtri che corrispondono a query di ricerca reali. Se le persone cercano "divani in pelle" in numeri significativi, l'URL /divani?materiale=pelle potrebbe valere l'indicizzazione. Ma /divani?materiale=pelle&colore=marrone&posti=3 quasi certamente no.
I negozi Shopify gestiscono questo diversamente da WooCommerce o Magento perché Shopify non genera URL di filtro per default. Le app di filtro di terze parti come Smart Product Filter creano queste URL, e ogni app gestisce tag canonical e controlli di indicizzazione diversamente. Verifica sempre come la tua app di filtro gestisce questi dettagli tecnici.
Controllare lo stato di indicizzazione in Google Search Console
Google Search Console fornisce due strumenti principali per monitorare l'indicizzazione. Il report Pagine (precedentemente report Copertura) mostra quante delle tue pagine sono indicizzate e perché il resto è stato escluso. Lo strumento Controllo URL ti permette di verificare lo stato di singole pagine.
Nel report Pagine, concentrati sulla scheda "Non indicizzate". Google raggruppa le pagine escluse per motivo: "Scansionata, attualmente non indicizzata", "Scoperta, attualmente non indicizzata", "Duplicato senza canonical selezionata dall'utente", "Esclusa dal tag noindex", e diversi altri. Ogni motivo richiede una correzione diversa.
"Scansionata, attualmente non indicizzata" significa che Google ha visitato la pagina ma ha scelto di non aggiungerla all'indice. Questo di solito segnala un problema di qualità dei contenuti. Migliorare il contenuto della pagina, aggiungere descrizioni uniche o arricchirla con recensioni e dati strutturati può aiutare.
"Scoperta, attualmente non indicizzata" significa che Google sa che l'URL esiste ma non si è ancora preso la briga di scansionarla. Questo indica bassa priorità di crawl, spesso causata da linking interno debole o dalla pagina che si trova troppo in profondità nella gerarchia del sito.
Lo strumento Controllo URL ti mostra esattamente cosa vede Google quando scansiona una pagina specifica. Usalo per verificare che i tuoi tag canonical vengano rispettati, che la tua pagina sia renderizzata correttamente e che nessun tag noindex accidentale stia bloccando l'indicizzazione. Raccomandiamo di ispezionare da 10 a 20 pagine prodotto rappresentative mensilmente per individuare i problemi in anticipo.
Esporta i dati "Non indicizzate" da GSC come foglio di calcolo e categorizza le pagine per tipo (prodotto, categoria, filtro, blog). Questo rivela se i tuoi problemi di indicizzazione sono concentrati in un tipo di pagina specifico, rendendo la correzione più mirata.
Passi pratici per migliorare l'indicizzazione delle pagine prodotto
Inizia verificando quali pagine prodotto sono attualmente indicizzate. Usa l'operatore site: in Google (site:tuonegozio.com/products/) per ottenere un conteggio approssimativo, poi confronta con i dati GSC per accuratezza. Se meno del 70 % delle tue pagine prodotto sono indicizzate, hai del lavoro da fare.
Scrivi descrizioni di prodotto uniche per i tuoi prodotti più venduti e a margine più alto prima. Queste pagine hanno il maggior potenziale di ricavi dalla ricerca organica. Anche aggiungere da 150 a 200 parole di contenuto unico e descrittivo per pagina prodotto può fare la differenza tra indicizzata e ignorata.
Consolida le pagine che non servono a uno scopo indipendente. Se hai 30 varianti di colore dello stesso prodotto e nessuno di quei termini specifici per colore ha volume di ricerca, consolidali sotto un'unica pagina prodotto con un selettore di colore. Quella singola pagina forte supererà 30 pagine sottili ogni volta.
Rafforza il linking interno verso le pagine prodotto che vuoi indicizzate. Linka da articoli di blog correlati, dalla sezione prodotti in evidenza della homepage e da altre pagine prodotto tramite widget "i clienti hanno anche acquistato" o "prodotti correlati". Ogni link interno aggiuntivo segnala a Google che la pagina è importante.
Infine, mantieni la tua sitemap pulita. Rimuovi le URL che restituiscono errori 404, che sono impostate su noindex o che hai deciso di consolidare. Una sitemap snella che contiene solo pagine che vuoi genuinamente indicizzate dà a Google un'immagine più chiara della struttura del tuo sito.
Strumenti e risorse gratuite
Lavora con esperti SEO che capiscono l’e-commerce
La prima agenzia SEO al mondo fondata dall’e-commerce