Il Substack di Francesco Margherita
Il Podcast di Francesco Margherita
Cosa cambia davvero con la ricerca visiva + AI?
0:00
-5:10

Cosa cambia davvero con la ricerca visiva + AI?

Ogni tanto mi chiedono come vanno ottimizzate adesso le immagini lato SEO. La domanda è mal posta, perché oggi non si tratta più di ottimizzare l'immagine. C'è tanto altro... vuoi vedere?

Nel web dell’intrattenimento, le immagini non sono appendici decorative, ma sono esse stesse il contenuto da comunicare. Questo significa che le immagini hanno di per sé un potere convertente, da cui:

L’immagine non è più un complemento, è la query

  • Con strumenti come Google Lens, l’utente parte da un'immagine per ottenere risultati testuali, locali, commerciali o informativi.

Esempio: scatto una foto a una borsa → Google la identifica, capisce il materiale, il brand, e mostra prodotti simili (o il tuo… se sei bravo).

Multimodalità: immagine + testo + contesto

Google oggi può gestire una query composta tipo:

“Scarpe come queste (immagine) ma con tacco più alto”

Questo obbliga i contenuti a essere semanticamente allineati tra testo, immagine e contesto.

L'AI capisce cosa c’è dentro l'immagine

Niente più trucchi da quattro soldi: Google riesce a riconoscere oggetti, ambienti, brand, espressioni facciali, persino lo stile visivo (minimal, retrò, luxury).

  • Tradotto: se vendi occhiali “vintage anni ‘70” e le tue foto sembrano scattate da un iPhone nel 2023 con un modello da Zara, sei semanticamente incoerente → esci dalla SERP visiva.


Impatti strategici sulla SEO

1. Ottimizzazione immagini = anche visual e semantica

Non basta fare:

  • alt="sedia in legno"

  • title="sedia vintage"

Ora serve anche:

  • Contesto testuale coerente

  • Nominare le entità visive nella pagina ("questa sedia Thonet anni '20 ha uno schienale ricurvo tipico…")

  • Markup dati strutturati (Product, ImageObject, VisualArtwork…)

  • Caricamento rapido + webp + lazy loading SEO-friendly


2. Cura del visual matching

La foto DEVE corrispondere semanticamente al testo.
Se parli di “design industriale”, la tua immagine non può essere una cassettiera shabby chic.

In ottica Lens e Google Shopping, la coerenza visiva + testuale aumenta le probabilità di comparire nei risultati multimodali o nel carosello visivo.


Adozione del Multisearch

Google Multisearch = immagine + testo.

Immagina:

L’utente carica la foto di un mobile → scrive “ma con cassetti bianchi”.

Da cui, lato SEO:

  • Il tuo sito deve avere immagini semanticamente flessibili: più angoli, più varianti, più scenari d’uso.

  • Ti tocca sviluppare campagne contenutistiche con immagini diversificate, testuali e visive, per catturare combinazioni multimodali.


Cosa dovrebbero fare ora i brand?

Perché è urgente ottimizzare tutte le immagini con metadati coerenti e markup? Per comparire nei risultati Lens e nella Ricerca Immagini (classico, ma sempre efficace)

Produrre contenuti visivi originali

Google non preferirà le immagini duplicate o stock nella ricerca visuale

Analizzare le SERP visive delle keyword target

Spesso Google mostra solo immagini → competizione invisibile ai tool classici

Segmentare per stile e contesto d’uso

L’AI classifica anche lo stile: rustic, scandinavo, urbano, luxury...

Creare contenuti multimodali (immagini + testo + video + entità)

Per abilitare il ranking nei risultati AI generativi e Lens


E quindi:

I SEO che ignorano la ricerca visiva nel 2025 sono come i medici che ignoravano i germi nel 1800: stanno operando, ma non sanno cosa toccano.

Non è più il tempo di alt text buttati lì. È il tempo della SEO visiva strategica, dell’allineamento semantico e del design intenzionale.

A buon intenditor…


Impara direttamente dalle mie SEO Audit

Scopri il programma aggiornato del mio nuovo corso SEO individuale, in videoconferenza (2 sessioni). Impara direttamente dalle mie SEO audit e spacca tutto!

Scopri di più sul Corso SEO

Discussione su questo episodio

Avatar di User