Dalla SEO alla GEO — White Paper

00Introduzione

Per vent'anni la ricerca ha avuto una grammatica stabile: query → lista di link → click. Quella grammatica si sta rompendo.

Per vent'anni la ricerca online ha funzionato secondo una grammatica stabile: un utente digita una query, un motore restituisce una lista ordinata di link, l'utente clicca e arriva su un sito. Su quella meccanica — crawling, indexing, ranking, click-through — si è costruita un'intera disciplina, la SEO, e con essa il modello economico del web aperto, dove la visibilità si traduceva in traffico e il traffico in valore.

I motori generativi (Google con AI Overviews e AI Mode, ChatGPT, Perplexity, Microsoft Copilot, Claude) non restituiscono più primariamente una lista di link: leggono il web al posto dell'utente, sintetizzano una risposta e citano poche fonti. Il click, che era il fine, diventa l'eccezione. Cambia l'unità di competizione (non più la pagina ma il singolo chunk di contenuto che un sistema di retrieval può estrarre e citare), cambiano le metriche (dalla posizione in SERP alla quota di citazione), cambiano gli attori (un arcipelago frammentato e in rapida evoluzione, anche fuori dall'Occidente). Da questo spostamento nasce la GEO, Generative Engine Optimization.

Questo documento ha tre obiettivi: spiegare come funzionano davvero i motori a livello di retrieval (embedding, chunking, re-ranking, query fan-out) e di selezione fonti, motore per motore; distinguere ciò che è documentato da ciò che è inferito tramite reverse-engineering o solo affermato dai vendor; collocare il fenomeno nel contesto italiano ed europeo, dove il quadro normativo (AI Act, opt-out TDM, DSA, GDPR) è il più stringente al mondo e condiziona concretamente cosa la GEO può e non può fare. Il taglio è formativo e analitico: capire il meccanismo, non vendere una ricetta.

Nota metodologica. Documento elaborato a partire da una ricerca su fonti primarie e secondarie (paper accademici, documentazione ufficiale dei motori, report di settore, analisi di reverse-engineering indipendenti). Le sezioni distinguono esplicitamente i fatti documentati dai claim dei vendor e dalle analisi non confermate ufficialmente. Tutte le fonti sono elencate in bibliografia.

—In breve

Cinque punti

Lo zero-click è strutturale: nel 2024 il 58,5% delle ricerche Google USA finiva senza click (SparkToro/Datos), salito al 68,01% a inizio 2026. Con un AI Overview il CTR organico della pagina top cala del 47-61% a seconda dello studio (Authoritas, Pew, Seer Interactive, Ahrefs).
La GEO nasce dal paper di Aggarwal et al. (IIT Delhi/Princeton, KDD 2024): statistiche, citazioni e quotazioni alzano la visibilità "fino al 40%"; il keyword stuffing è l'unico metodo testato che la peggiora.
Ogni motore ha una pipeline diversa (ChatGPT su Bing/scraping, Perplexity con crawler proprio, Claude su Brave, Copilot su Bing/Prometheus, Gemini con fan-out): tutti usano RAG, embeddings e selezione a livello di chunk, per cui struttura, freschezza, autorevolezza e citabilità contano più del posizionamento tradizionale.
La visibilità AI è una distribuzione, non un punteggio: una misura singola ha errore standard 0,370 (inutile); servono 7-10+ run per prompt (paper "Don't Measure Once", arXiv:2604.07585).
Google stessa (maggio 2026) dichiara che "GEO è ancora SEO" e smonta 5 miti, tra cui llms.txt e il chunking manuale.

Key Findings

Il comportamento di ricerca è cambiato strutturalmente, non marginalmente. Lo zero-click è passato da ~50% (SparkToro 2019) a 68,01% (Q1 2026 USA). Gartner ha previsto (feb 2024) un calo del 25% del volume di ricerca tradizionale entro il 2026 — una previsione, non un consuntivo.
Il posizionamento organico tradizionale resta importante ma non è più sufficiente. Ahrefs (gen 2026): solo il 38% delle pagine citate negli AI Overviews è anche nella top-10 organica (era 76% a luglio 2025).
Le tattiche GEO con evidenza empirica sono poche e specifiche: statistiche, citazioni di fonti, quotazioni, freschezza, struttura answer-first. Molti consigli popolari (llms.txt, schema-as-hack, chunking manuale) non hanno evidenza di funzionare e alcuni sono smentiti da Google.
Il mercato italiano/UE è in ritardo ma in rapida accelerazione: AI Overviews in Italia dal 26 marzo 2025; uso GenAI in Italia al 20% (sotto media UE 33%, Eurostat 2025); dopo il reclamo FIEG (15 ottobre 2025) l'AGCOM ha trasmesso il caso alla Commissione UE ex art. 65 DSA (29 aprile 2026). La frammentazione è globale: in Cina Doubao, ERNIE, DeepSeek e Qwen superano insieme i 900 milioni di utenti.
Il contesto normativo UE è il più stringente al mondo: AI Act, GDPR, opt-out TDM ex art. 4 CDSM, caso Garante-OpenAI e dispute publisher modellano come la GEO può operare in Europa.

01Fondamenti

L'evoluzione dalla SEO alla GEO

Come funzionava (e funziona) la ricerca tradizionale

La SEO classica si basa su tre fasi: crawling (un bot come Googlebot scopre e scarica pagine), indexing (le pagine vengono analizzate e archiviate in un indice), ranking (un algoritmo ordina le pagine per una query producendo la SERP, la lista di "link blu"). Il modello economico del web aperto era basato sul click-through: l'utente cercava, vedeva una lista di risultati e cliccava su un sito, generando traffico monetizzabile.

Come funziona la ricerca AI-driven

I motori generativi non restituiscono primariamente una lista di link, ma sintetizzano una risposta da più fonti usando un LLM, citandone alcune inline. Questo produce risposte zero-click: l'utente ottiene la risposta senza visitare alcun sito. Google ha integrato il paradigma con gli AI Overviews (riquadri generativi in cima alla SERP) e l'AI Mode (esperienza conversazionale completa).

Punti di svolta e timeline

Mag 2023: Google annuncia la Search Generative Experience (SGE) come esperimento in Search Labs.
14 mag 2024: Google lancia ufficialmente gli AI Overviews negli USA (al Google I/O).
28 ott 2024: AI Overviews estesi a oltre 100 paesi e territori.
31 ott 2024: OpenAI lancia ChatGPT Search.
5 mar 2025: AI Overviews passano a Gemini 2.0; Google annuncia AI Mode come esperimento Labs.
26 mar 2025: AI Overviews arrivano in Italia e in altri paesi europei.
20 mag 2025: AI Mode esteso a tutti gli utenti USA.
15 mag 2026: Google pubblica la guida ufficiale GEO ("Optimizing your website for generative AI features").
5 giu 2026: Google pubblica la guida sui servizi SEO di terze parti e aggiorna "Do you need an SEO?", nominando AEO/GEO come categoria di servizio.

Perplexity (fondata nel 2022) ha reso popolare il concetto di "answer engine" con citazioni trasparenti. Claude (Anthropic) ha aggiunto la ricerca web nel 2025.

Il paper fondativo "GEO: Generative Engine Optimization"

Il termine è stato formalizzato nel paper di Pranjal Aggarwal, Vishvak Murahari, Tanmay Rajpurohit, Ashwin Kalyan, Karthik Narasimhan e Ameet Deshpande (IIT Delhi/Princeton/Allen AI), pubblicato a KDD 2024 (arXiv:2311.09735, DOI 10.1145/3637528.3671900). Risultati chiave, verificati sul testo originale:

Hanno introdotto GEO-bench, un benchmark di 10.000 query da domini diversi.
Hanno testato 9 metodi di ottimizzazione: Authoritative, Keyword Stuffing, Statistics Addition, Quotation Addition, Cite Sources, Fluency Optimization, Easy-to-Understand, Technical Terms, Unique Words.
Due metriche: Position-Adjusted Word Count (parole attribuite a una fonte, pesate per posizione nella risposta) e Subjective Impression (punteggio qualitativo G-Eval su 7 dimensioni).
I metodi migliori — Quotation Addition +41%, Statistics Addition +31%, Cite Sources +28%, Fluency Optimization +28% — possono aumentare la visibilità "up to 40%" nelle risposte generative.
Il Keyword Stuffing è l'unico metodo che ha peggiorato la visibilità (−8%): le tattiche SEO non si trasferiscono automaticamente.
L'efficacia varia per dominio: Statistics in "Law & Government" e query "Opinion"; Quotation in "History" e "People & Society".
GEO favorisce i siti a basso ranking: Cite Sources ha aumentato la visibilità del 115,1% per i siti in quinta posizione SERP.
La combinazione Fluency + Statistics ha superato qualsiasi metodo singolo di oltre il 5,5%.
Validazione su Perplexity.ai: miglioramenti fino al 37%.

Nota di sourcing: titoli di metodo, percentuali headline e frasi di prosa confermati su arXiv. La v3 indica un boost 15-30% per i metodi stilistici, contro "10-20%" di versioni precedenti — discrepanza di versione da segnalare.

Dati sul cambiamento del comportamento di ricerca

SparkToro/Datos (2024): 58,5% ricerche Google USA e 59,7% UE senza click. Per ogni 1.000 ricerche USA, solo 360 click al web aperto.
SparkToro/Similarweb (2026): 68,01% ricerche Google USA senza click nei primi 4 mesi del 2026 (+7,56 punti dal 2024).
Ahrefs (dic 2025): un AIO correla con CTR medio −58% per la pagina top.
Pew Research (lug 2025): su 68.879 ricerche reali, click su link tradizionale all'8% con AIO vs 15% senza (≈ −47%); solo l'1% clicca una fonte citata; 26% delle sessioni con AIO termina del tutto (vs 16%). Google ha contestato la metodologia.
Seer Interactive (set 2025, >25M impression): CTR organico per query con AIO −61% (1,76% → 0,61%).
Gartner (feb 2024): previsione −25% del volume di ricerca tradizionale entro il 2026 (previsione, non consuntivo).
Impatto publisher: Digital Content Next (ago 2025) cala mediano del traffico referral Google del 10%; Press Gazette/Chartbeat: −33% globale nel 2025 (−38% USA, −17% Europa). Il danno scala con la dimensione del sito.

02Meccanica

Come funzionano i motori

Tutti i motori generativi usano una forma di RAG (Retrieval-Augmented Generation): invece di affidarsi solo alla conoscenza "parametrica" (appresa in training), recuperano contenuti freschi dal web e li usano per costruire la risposta. Tesi tecnica di fondo: la pagina non è più l'unità di competizione, lo è il chunk.

ChatGPT (OpenAI): retrieval via API di scraping di terze parti (storicamente legato a Bing; Seer ha trovato 87% di overlap con i top result di Bing); query fan-out; selezione fonti che pesa autorevolezza, struttura e freschezza.
Google Gemini / AI Overviews / AI Mode: indice web proprio + Knowledge Graph + Shopping; query fan-out documentato via API; selezione che attinge anche fuori dalla top-10 (Ahrefs gen 2026: solo 38% delle citazioni dalla top-10).
Perplexity: RAG con crawler proprio (PerplexityBot); forte sensibilità alla freschezza; tipicamente 3-5 fonti per risposta; reranking ML a più livelli.
Microsoft Copilot: modello Prometheus su indice Bing; "Bing Orchestrator" che genera query interne iterative (fan-out); citazioni numerate [1][2]; primo motore a codificare la GEO nelle proprie Webmaster Guidelines (febbraio 2026).
Claude (Anthropic): retrieval via provider esterno (overlap con Brave); citazione a livello di frase; tre bot (ClaudeBot training, Claude-User fetch, Claude-SearchBot indicizzazione).

2-bis · Le tre famiglie di retrieval

Dense (bi-encoder): query e documento codificati separatamente in un singolo vettore denso (es. 768 dimensioni); la rilevanza è la cosine similarity. Velocissimo (vettori pre-calcolati + ANN), ma — come sintetizza Towards Data Science — "the model compresses all meaning into one vector before any comparison happens": query e documento non interagiscono mai a livello di token. Conseguenza GEO: un chunk con tre concetti produce un vettore "medio" che non rappresenta bene nessuno dei tre. Sparse (BM25, SPLADE): match lessicale esatto (o espanso), imbattibile su nomi propri, codici prodotto e termini tecnici — i casi in cui il dense fallisce. Late interaction (ColBERT e successori): mantiene gli embedding a livello di token e calcola la rilevanza con MaxSim. Weaviate: i metodi dense "pool token-wise embeddings into a single representation while ColBERT embeddings keep the token-wise representations in a multi-vector". Vantaggio: spiegabilità; svantaggio: storage (BEIR: ~20GB/1M doc vs 0,4GB BM25 e ~3GB dense).

Il dato che conta: gli approcci ibridi dense+sparse battono ogni metodo singolo. Uno studio singolo (gen 2026, su MS MARCO, fonte poco visibile e con baseline dense insolitamente bassa — da trattare come indicativo) riporta fino al 580% di miglioramento in Recall@10 rispetto al solo dense (13,9% → 80,8%); il principio generale è comunque confermato da letteratura peer-reviewed più solida. I motori reali combinano "significato" (dense) e "parola esatta" (sparse): il contenuto deve servire entrambi — concetti chiari e terminologia esatta.

Demo 01 · Dense vs Sparsesimulazione didattica

Query di ricerca

codice prodotto linguaggio naturale domanda how-to

Dense · semantico

—

Sparse · lessicale

—

Euristica didattica (non un vero motore): mostra perché i due approcci eccellono su query diverse. Codici e nomi propri premiano lo sparse; le query concettuali premiano il dense. I motori reali li combinano.

2-bis · Embeddings

Cosa cattura un vettore (e cosa no). Tre implicazioni operative: (1) stesso modello obbligatorio per indice e query — altrimenti i vettori vivono in spazi non allineati e la similarity è rumore; è la causa #1 di RAG rotti silenziosamente; (2) context rot — la ricerca Chroma (lug 2025, 18 modelli inclusi GPT-4.1, Claude 4, Gemini 2.5) mostra che il retrieval degrada all'aumentare della lunghezza del contesto, anche su task semplici: infilare la risposta a metà di un muro di testo la rende meno recuperabile; (3) un vettore medio non è un buon vettore — più concetti distinti in un chunk = embedding diffuso.

2-bis · Chunking

Il senso comune dice "il semantic chunking è il migliore"; i benchmark dicono il contrario, e la divergenza è istruttiva. Vecta Benchmark (feb 2026): recursive splitting a 512 token primo (69%), semantic al 54% (frammenti da ~43 token); l'autore: la conversazione sul chunking è stata "dominated by theory rather than measurement". MDPI Bioengineering (nov 2025): nel dominio clinico adaptive 87% vs 13-50% del fixed-size (p=0,001). arXiv 2506.17277 (chimica): recursive fino al +45% di precisione domain-weighted. arXiv 2512.05411 (enterprise): su documentazione ben strutturata il naive batte semantic e recursive. arXiv 2506.06339 (arabo): sentence-aware il migliore, semantic consistentemente peggiore.

Non si conciliano — ed è il punto. Nessuna strategia è universalmente ottimale; dipende da struttura del documento e tipo di query. Default robusto difendibile: recursive splitting a 400-512 token con 10-20% di overlap, quando non si hanno motivi specifici per altro. Perché curarsene anche se non controlli il chunker del motore? Perché controlli quanto è spezzabile bene la pagina: confini semantici netti (heading chiari, un'idea per sezione, risposte autosufficienti) producono chunk coerenti con qualsiasi strategia. La struttura del contenuto è il chunking che puoi controllare.

Demo 02 · Strategie di chunkinginterattiva

Testo da spezzare

Il fixed taglia a lunghezza fissa (rompe le frasi); il recursive rispetta i confini di frase; il semantic raggruppa per significato ma può frammentare troppo.

2-bis · Re-ranking

Il retrieval reale è quasi sempre a due stadi: Stadio 1 — Recall (bi-encoder/BM25/ibrido), rete larga con 20-150 candidati veloci; Stadio 2 — Precision (cross-encoder) che ri-valuta ogni coppia query-chunk insieme ([CLS] query [SEP] documento [SEP]), riordina e tiene i top 3-8. Numeri operativi: cross-encoder leggero (ms-marco-MiniLM-L-6-v2) ~50ms/20 doc; Cohere Rerank ~200ms; reranker LLM 1-3s. Guadagno tipico +5-15 punti nDCG@10 o +10-25% accuratezza. Default: top-20→50, rerank, passa top-3→8; oltre 50 candidati "adds latency without meaningfully improving recall". Implicazione GEO: il cross-encoder premia la rilevanza diretta e specifica alla query — non densità di keyword, non lunghezza, non autorità del dominio in sé. È il fondamento meccanico del perché l'answer-first funziona: non è stile, è allineamento col cross-encoder.

Dal meccanismo alla regola di markup

Fatto meccanico	Regola operativa per il contenuto
Dense comprime tutto in un vettore	Un'idea per sezione; non mescolare 3 temi in un paragrafo
Sparse premia il match esatto	Includi termini/codici/nomi esatti, non solo sinonimi
Ibrido batte i singoli metodi	Concetti chiari e terminologia precisa insieme
Context rot	Risposta in alto, non sepolta a metà pagina
Chunk autosufficienti = retrieval robusto	Ogni sezione abbia senso letta da sola
Heading chiari = confini netti	HTML semantico: `<h2>` a domanda + risposta sotto
Cross-encoder premia rilevanza diretta	Answer-first: risposta nei primi 40-60 token
Re-ranking taglia a top 3-8	Serve essere il chunk più pertinente, non solo pertinente

2-ter · Reverse-engineering per-motore

Distinzione epistemica: ciò che segue mescola fatti ufficiali (documentazione, API), analisi di reverse-engineering non confermate dai produttori e claim dei vendor. Lo segnalo caso per caso. È l'area più volatile del documento: le pipeline cambiano da un aggiornamento di modello all'altro.

ChatGPT — il tool web.run

La fonte più dettagliata è lo studio RESONEO/Meteoria (Olivier de Segonzac, maggio 2026), che ha decompilato l'app mobile, sniffato i pacchetti di rete e ricostruito il system prompt. Il motore interno si chiama web.run: prima di GPT-5.3 inviava comandi testuali compatti separati da pipe (fast|query|recency), dopo 5.3 oggetti JSON strutturati. Il tool supporta 12 operazioni (da 4 precedenti): search_query, open, find, click, screenshot, product_query e widget specializzati, più un sistema genui. Il query fan-out concatena 2-10+ round; il fan-out prodotto inedito (browse_rewritten_queries) lancia una ricerca shopping separata per ogni singolo prodotto. È ChatGPT-User (non OAI-SearchBot) a fetchare le pagine durante la conversazione; marcatori di tracking Google (strlid) negli URL prodotto rivelano un backend che si appoggia a provider terzi e a Google dietro le quinte.

Con lo switch a GPT-5.3 Instant (4 mar 2026) i domini unici citati per risposta sono scesi da 19 a 15 (−20%) — il "Bigfoot Effect": concentrazione su pochi domini autorevoli (rapporto URL-per-dominio stabile a 1,26). Reddit è l'unico dominio esentato dai limiti di parole per copyright nel system prompt ricostruito. (Reverse-engineering.) Punto strategico: lo studio distingue visibilità parametrica (ciò che il modello ha appreso in training — stabile, plasmata da copertura stampa, Wikipedia, siti autorevoli) da visibilità dinamica (ciò che recupera in tempo reale, volatile). Il legame: "il modello formula le query web puntando a fonti che già conosce. Un brand assente dalla memoria parametrica non sarà nemmeno considerato come candidato."

Avvertenza: stesso prompt su 5.2/5.3/5.4 produce fan-out, fonti e passaggi diversi. La citazione in ChatGPT non è riproducibile come un ranking Google: va testata modello per modello.

Gemini / AI Mode — fan-out documentato

A differenza di ChatGPT, qui c'è documentazione ufficiale, tramite l'API di grounding di Gemini. La risposta restituisce webSearchQueries (le query realmente eseguite — es. per "chi ha vinto Euro 2024" genera ["UEFA Euro 2024 winner", "who won euro 2024"]), groundingChunks (le fonti, con uri e title) e groundingSupports (la mappatura segmento di testo → chunk fonte, con startIndex/endIndex carattere per carattere): ogni frase della risposta è ancorata a chunk specifici. Dal technical report Gemini 2.5: Gemini 2.0 è stata "la prima famiglia di modelli addestrata a chiamare nativamente strumenti come Google Search"; Gemini 2.5 "interleaves search capabilities with internal thought processes" per query multi-hop. La ricerca è interlacciata col ragionamento, non occasionale.

Scala: a metà 2025 i modelli alimentavano ~1,5 miliardi di utenti mensili negli AI Overviews e ~400M nell'app Gemini; a fine 2025/inizio 2026 i numeri ufficiali Alphabet salgono a 2 miliardi di utenti per gli AI Overviews e 750 milioni di MAU per l'app Gemini (Q4 2025). AI Mode usa una "custom version of Gemini" con fan-out, che scompone la query in molte sotto-query parallele — il motivo per cui pagine non in top-10 vengono citate. Conseguenza GEO: ottimizzare per Gemini significa coprire l'albero di sotto-domande di un tema, non una singola keyword.

Demo 03 · Query fan-outinterattiva

La tua domanda all'AI

Una domanda viene scomposta in più sotto-query parallele; ognuna recupera fonti diverse — per questo pagine non in top-10 vengono citate, se rispondono bene a una sotto-query.

Perplexity / Sonar

RAG con crawler proprio (PerplexityBot) + fetch realtime (Perplexity-User). Sonar è il modello proprietario costruito su architetture open Llama; a livello prodotto è multi-modello e seleziona a runtime il modello migliore per modalità (search/reasoning/research). Pipeline: (1) query decomposition; (2) retrieval da indice proprio + realtime; (3) reranking a tre livelli — Layer 1 retrieval dei candidati con scoring classico, Layer 2 ranking per autorità/rilevanza, Layer 3 reranking ML che favorirebbe l'earned media da pubblicazioni Tier-1 (una citazione su TechCrunch o Forbes come segnale di autorità verificato esternamente — analisi indipendente Yeşilyurt, ago 2025, non confermata ufficialmente); (4) sintesi con citazioni inline. La citazione è un "two-step dance": inclusione nel retrieval set, poi selezione del paragrafo. Freschezza dominante: un articolo "aggiornato 2 ore fa" è stato citato il +38% del gemello identico datato di un mese; il gemello stantio raramente spariva dal retrieval set ma veniva retrocesso nella sintesi. ~780M query a maggio 2025 (+20% MoM, dichiarazione Srinivas, Bloomberg Tech).

Claude — citazione a livello di frase

Retrieval via provider esterno (analisi Profound indicano forte overlap con Brave Search) e fetch dagli URL dei risultati. La documentazione del web search e del citations tool specifica che i documenti vengono spezzati in chunk a granularità di frase: l'output restituisce blocchi cited_text, con title e url. Conseguenza: una frase ben costruita e autosufficiente è l'unità minima citabile — il caso più estremo del principio "il chunk è l'unità di competizione". Tre bot: ClaudeBot (training), Claude-User (fetch su richiesta utente), Claude-SearchBot (indicizzazione). Tutti dichiarano di rispettare robots.txt.

Microsoft Copilot — GEO in policy

Copilot è l'unico motore importante che ha codificato la GEO nella propria policy ufficiale. Microsoft descrive Prometheus come un modello che combina "the fresh and comprehensive Bing index, ranking, and answers results with the creative reasoning capabilities of … GPT models"; il Bing Orchestrator "generate[s] a set of internal queries iteratively" — il meccanismo di query fan-out interno. Le citazioni sono numerate [1][2] linkate alla pagina sorgente. La riscrittura delle Bing Webmaster Guidelines (27 feb 2026) tratta "grounding results and citations" come esito di eleggibilità separato e introduce la GEO come categoria ufficiale: NOARCHIVE impedisce l'uso del contenuto nelle risposte Copilot; NOCACHE lo limita a URL, titolo e snippet (Microsoft lo sconsiglia sulle pagine da far citare); l'attributo data-snippet controlla quale testo Bing può mostrare o citare (livello di paragrafo). Seer (6 feb 2025): l'87% delle citazioni SearchGPT coincide coi top-20 organic di Bing (vs 56% per Google) — misurazione indipendente di coincidenza; il "~92% via Bing API" è claim vendor non confermato. IndexNow notifica Bing ad ogni modifica; Google non lo supporta. L'AI Performance Report di Bing Webmaster Tools (public preview da feb 2026) mostra conteggio citazioni, URL citati e un campione delle grounding queries.

Dimensione	ChatGPT	Gemini	Perplexity	Copilot	Claude
Indice/fonte	Scraping terzi (+tracce Google)	Indice Google + KG + Shopping	Indice proprio + realtime	Bing/Prometheus	Esterno (overlap Brave)
Bot di retrieval	ChatGPT-User	Google-Extended / Search	Perplexity-User	bingbot / Bing	Claude-User / Claude-SearchBot
Fan-out	Sì (web.run, 2-10+ round)	Sì (documentato via API)	Sì (query decomposition)	Sì (Bing Orchestrator)	Sì (ricerche multiple)
Citazione	Inline, variabile per modello	frase→chunk (groundingSupports)	Inline, paragrafo	Numerata [1][2] + pannello	Inline, frase (cited_text)
Distintivo	Pochi domini autorevoli (Bigfoot)	Albero sotto-domande	Freshness + Tier-1	GEO in policy	Granularità di frase
Trasparenza	Bassa (rev-eng)	Media (API ufficiale)	Bassa-media	Alta (doc + report)	Media (doc)

03Citabilità

Cosa rende un contenuto citabile

Tattiche con supporto empirico

Statistiche e dati specifici (GEO paper: Statistics Addition +31%).
Citazioni e quotazioni di fonti (Quotation Addition +41%, Cite Sources +28%).
Freschezza (forte per Perplexity e query news/trend).
Struttura answer-first con heading a domanda e risposta diretta nei primi 40-60 token (allineamento col cross-encoder).
Autorevolezza/E-E-A-T e citazioni di terze parti; contenuto non-commodity con esperienza diretta (confermato dalla guida Google 2026).
Menzioni del brand: studio Previsible su 1,96M sessioni → il volume di ricerca del brand è il predittore più forte delle citazioni AI (correlazione 0,334), più dei backlink.

Avvertenza: claim di vendor come "data-rich citati 2,7x in più" o "FCP <0,4s = 6,7 citazioni" circolano ma non sono verificabili con fonte primaria — vedi sezione Anti-hype.

Correlazione col ranking tradizionale (dati contrastanti): Ahrefs a luglio 2025 trovava 76% di overlap tra citazioni AIO e top-10, a gennaio 2026 solo 38% (in parte per migliore rilevamento, in parte per il fan-out). Semrush: ~90% delle citazioni ChatGPT da URL fuori dalla top-20 Google. Il ranking aiuta ma non è condizione necessaria.

robots.txt per crawler AI: la strategia "blocca tutti i bot AI" del 2024 è controproducente. Distinguere bot di training (GPTBot, ClaudeBot, Google-Extended) dai bot di retrieval/search (OAI-SearchBot, ChatGPT-User, Claude-SearchBot, PerplexityBot): bloccare i secondi rimuove il sito dalle citazioni AI.

04Mercato IT/UE

Il mercato italiano ed europeo

Adozione

Eurostat 2025: uso di strumenti GenAI in Italia al 20%, sotto la media UE del 33% e lontano da Norvegia (56%) e Danimarca (48%); riflette il divario nord-sud europeo. ChatGPT in Europa: utenti attivi mensili medi da 11,2 a 41,3 milioni entro marzo 2025 (~+270%). L'Italia è stata il primo paese al mondo a bloccare temporaneamente ChatGPT (marzo 2023).

Tempistica AI Overviews in Europa

Arrivati in Italia il 26 marzo 2025 (con Austria, Belgio, Germania, Irlanda, Polonia, Portogallo, Spagna, Svizzera), ~10 mesi dopo gli USA, in italiano e su Gemini 2.0. Si attivano per query informative a coda lunga. L'AI Mode in italiano non risultava pienamente lanciato a metà 2026.

Il panorama globale: i motori AI cinesi

La frammentazione non è solo occidentale. Il mercato cinese è il secondo polo mondiale, con una competizione più affollata di quella USA. Baidu ERNIE: ERNIE 4.5 reso open-source il 30 giugno 2025 (10 varianti MoE fino a 424B parametri, licenza Apache 2.0); ERNIE Assistant a 202 milioni di MAU a dicembre 2025; nel Q4 2025 i ricavi in abbonamento dell'infrastruttura AI accelerator sono cresciuti del +143% YoY (dal +128% del Q3) e il volume di chiamate dell'AI search API +110% QoQ (comunicato e earnings call Baidu, 26 febbraio 2026). DeepSeek: modelli open-source cost-efficient che hanno scosso il mercato a inizio 2025; a metà 2025 una stima attribuiva ~34% della quota API developer a DeepSeek vs ~18% di ERNIE; integrato in Baidu Search e Zhihu. Gli altri: secondo QuestMobile (via Caixin), a marzo 2026 Doubao (ByteDance) è in testa con ~345 milioni di MAU, davanti a Qwen (Alibaba, ~166M) e DeepSeek (~127M), con Tencent Yuanbao tra i primi quattro; i MAU combinati dei principali player superano i 900 milioni.

Per un freelance italiano questi motori sono contesto, non azione quotidiana. Il punto è strutturale: la logica GEO (retrieval, grounding, citazioni, fan-out) è sostanzialmente la stessa ovunque, e la frammentazione è una tendenza globale, non un'anomalia occidentale. I conteggi MAU cinesi divergono molto tra fonti: sono stime, sempre con fonte e data.

04·BMisurazione

Testare la GEO senza ingannarsi

Questa è la sezione che separa il lavoro serio dal teatro. Tesi: la visibilità in AI search è una distribuzione, non un punteggio. Trattarla come un rank tracking di Google è l'errore metodologico di fondo da cui derivano quasi tutti i numeri inaffidabili che circolano.

Perché una misura singola è inutile (con i numeri)

Il dato più rigoroso viene dal paper "Don't Measure Once: Measuring Visibility in AI Search (GEO)" (Schulte et al., arXiv:2604.07585, 10 aprile 2026), che ha misurato 4 motori × 8 prompt × 3 campagne con 10 run ciascuno (1.216-1.726 serie per-brand). Una run singola ha un errore standard di 0,370 (CI 95% ±0,724; Table 16, Appendice J): un tasso reale del 50% può apparire ovunque tra −22% e +122% — "essentially uninformative", indistinguibile dal rumore. A 7 run l'errore standard scende a 0,081 (±0,158) e a 8 run a 0,062 (±0,121). L'overlap delle fonti tra due giorni consecutivi può cadere nel 34-42%. Un secondo paper (Sielinski, marzo 2026, arXiv:2603.08924) converge: le distribuzioni di citazione seguono una power law e il 95% dei titoli ChatGPT Shopping appare in meno del 30% delle run dello stesso prompt. Floor minimo difendibile: 10+ run per prompt.

Demo 04 · Errore standard per numero di rundati reali · Schulte 2026

Run ripetute per prompt: 1

0,370errore standard

intervallo 95%: ±0,724

Valori esatti dalla Table 16 (Appendice J) del paper. La barra rossa è l'intervallo di confidenza al 95% su un tasso reale del 50%: con 1 run può oscillare da −22% a +122%. Sposta il cursore.

Citation drift: la volatilità nel tempo

La volatilità non è solo run-to-run, è anche temporale. Drift mensile (% di domini presenti a luglio ma assenti a giugno per gli stessi prompt): 40-60% (Profound). Drift semestrale: 70-90% confrontando gennaio con luglio; BrightEdge riporta un churn del 70% dei domini citati entro sei mesi (70× volatility gap). Shock di piattaforma: la quota di citazioni Reddit in ChatGPT è crollata dal ~60% al ~10% in poche settimane a settembre 2025 (Semrush, 13 settimane); il cambio di modello del 4 marzo 2026 ha tagliato i domini citati del 20% da un giorno all'altro. Regola: misurare con finestre, non con snapshot (settimanale per le query strategiche).

Protocollo minimo difendibile

Definisci 20-30 prompt da buyer reale, non query di brand vanity ("qual è il miglior X per Y", non "parlami di [il mio brand]").
Esegui su più motori (ChatGPT, Perplexity, Google AI Overviews/AI Mode, Gemini) — la visibilità in uno non predice gli altri.
Ripeti ogni prompt 7-10 volte, distribuite su più giorni (non 10 volte nello stesso minuto).
Logga tre cose per run: se sei apparso, quale pubblicazione è stata citata, quale competitor è stato nominato al tuo posto.
Calcola intervalli di confidenza bootstrap sul tasso di detection per brand, non medie nude.
Riporta per-engine (l'aggregato cross-engine nasconde i pattern).
Per testare una modifica: misura il baseline su finestra, applica, attendi il re-crawl, misura su finestra equivalente. Confronta distribuzioni, non punti. Usa un gruppo di controllo (pagine non modificate) per separare l'effetto dal drift di sfondo.

Metriche che contano (e una da togliere)

Dalla reference di Nick Lafferty (2026) e dagli studi citati: Citation Share per engine (la metrica centrale); Time-to-First-Citation (riportato come distribuzione — mediana, P75, P90 — mai come media); Inline Brand Hyperlink Share (quota di risposte con link cliccabile, peso cresciuto dopo che il cambio ChatGPT del 7 maggio 2026 ha triplicato i referral B2B SaaS); Co-citation Rate; Citation Rank Stability (la metrica del paper Schulte che quasi tutti i cruscotti saltano). Da togliere se vendi software/servizi: lo Shopping Trigger Rate — su ~2 milioni di prompt il 79% non ha mai triggerato Shopping e solo il ~6% triggera in modo affidabile; la categoria del prompt da sola predice il trigger col 95-97% di accuratezza.

Replicare il GEO paper in proprio

Il GEO paper originale è replicabile a costo contenuto. (1) Prendi 10-20 pagine/chunk target e crea due varianti: baseline e trattata (+ statistiche citate, o + quotazioni). (2) Costruisci 30-50 query realistiche. (3) Sottoponi le query con search attiva, 7-10 run per query per variante, alternando l'ordine per evitare bias di posizione. (4) Misura il Position-Adjusted Word Count, oltre alla presenza/assenza. (5) Confronta le distribuzioni con un test non parametrico (Mann-Whitney). Aspettativa calibrata: +20-40%, non "10x", con Statistics e Quotation come leve più forti. Se vedi +300%, è quasi certamente rumore da campione troppo piccolo.

Regola pratica: se un claim GEO non dichiara quante volte ha ripetuto ogni prompt e su quale periodo, è aneddoto. Con SE 0,370 a una run, qualsiasi cifra a due decimali senza run ripetute è statisticamente sospetta.

05Diritto UE/IT

Il quadro che vincola la GEO in Europa

Questa sezione conta per un freelance italiano più di quanto sembri: le scelte di robots.txt, di licensing e di gestione dei contenuti dei clienti hanno implicazioni legali concrete sotto il diritto UE, il più stringente al mondo su AI e copyright.

Eccezione TDM e opt-out (art. 4 CDSM): il cardine giuridico

Il fondamento dell'addestramento commerciale di AI in Europa è la Direttiva (UE) 2019/790 (CDSM): l'art. 3 copre il TDM per scopi scientifici (organismi di ricerca, non l'AI commerciale); l'art. 4 copre il TDM generale (commerciale), diventato "the cornerstone of commercial AI training in the EU", pur aggiunto nelle fasi finali del processo legislativo senza valutazione d'impatto sulla GenAI. Il meccanismo chiave è l'opt-out dell'art. 4(3): il TDM è permesso di default salvo riserva espressa in modo appropriato, "ad esempio con strumenti leggibili meccanicamente" (machine-readable) per i contenuti pubblici online (Considerando 18). Il ponte con l'AI Act: l'art. 53(1)(c) obbliga i fornitori di modelli GPAI a "identificare e rispettare … le riserve di diritti espresse ai sensi dell'art. 4(3)"; il Considerando 106 sancisce un "Brussels effect" — l'obbligo si applica a qualunque fornitore immetta un modello GPAI sul mercato UE "a prescindere dalla giurisdizione in cui avvengono gli atti di addestramento". Anche un modello addestrato negli USA, se offerto in UE, deve rispettare gli opt-out europei.

Il problema irrisolto: cosa rende un opt-out "valido"

La direttiva non prescrive uno standard tecnico unico e la giurisprudenza nazionale è divergente. Kneschke v. LAION (Tribunale di Amburgo, 27 set 2024): la costruzione del dataset era coperta dall'equivalente tedesco dell'art. 3, ma con dubbi sull'art. 4 per lo sfruttamento commerciale a valle; in una pronuncia successiva si è affermato che un opt-out in "linguaggio naturale" nei ToS può qualificarsi come machine-readable. DPG Media v. HowardsHome (Tribunale di Amsterdam, fine 2024): la riserva deve essere "praticamente rilevabile ed elaborabile da sistemi automatizzati". Le due direzioni sono "markedly different" → affidarsi solo a una clausola nei termini d'uso è rischioso; serve anche un segnale tecnico (robots.txt, metadati, header). Argomento aggiuntivo (Synodinou-Vrakas, nov 2025): i dataset costruiti per scraping indiscriminato possono includere opere accessibili pubblicamente ma non "legalmente accedute", fuori dalla protezione dell'eccezione TDM.

La spinta del Parlamento UE a riformare l'opt-out

Nell'ambito della procedura di iniziativa 2025/2058(INI) "Copyright and generative AI" (commissione JURI, relatore Axel Voss), due documenti distinti: (1) lo studio JURI PE 774095 (Prof. Nicola Lucchi, 9 luglio 2025), che conclude che l'addestramento "far exceeds the scope of the current TDM exceptions"; (2) il draft report / Motion for a resolution PE775.433 (27 giugno 2025), che chiede norme più chiare, trasparenza sui dati di training e un obbligo di remunerazione. La risoluzione è stata adottata in plenaria il 10 marzo 2026 (T10-0066/2026). La maggioranza ritiene comunque non necessario un nuovo strumento legislativo "at this stage" — segno di una tensione politica irrisolta.

Il caso italiano: FIEG vs Google, DSA e il dilemma dell'opt-out

15 ottobre 2025: la FIEG deposita un reclamo formale all'AGCOM contro AI Overview e AI Mode, definendoli "traffic killer". L'accusa non è di copyright ma di violazione del DSA: configurerebbero concorrenza impropria, riduzione strutturale di visibilità e ricavi, e "un rischio sistemico per la sostenibilità economica dell'intero ecosistema dell'informazione". 29 aprile 2026 (atto distinto e successivo): all'esito di audizioni con Google, FIEG e FISC, l'AGCOM — nel ruolo di Coordinatore nazionale dei servizi digitali — decide di trasmettere alla Commissione europea, ex art. 65 DSA, una richiesta di valutazione dei servizi Google AI Overviews e AI Mode in relazione agli artt. 27, 34 e 35 DSA (rischi sistemici per pluralismo e libertà di informazione; trasparenza dei sistemi di raccomandazione). Comunicato del 30 aprile 2026; decisione assunta con il voto contrario della commissaria Elisa Giomi. È una segnalazione finalizzata all'eventuale apertura di un'indagine della Commissione — non un procedimento sanzionatorio autonomo dell'AGCOM.

Esercitare l'opt-out (bloccare i crawler AI) protegge il copyright ma rimuove il contenuto dalle risposte generative, azzerando la visibilità GEO. Gli editori chiedono di poter fare opt-out senza perdere visibilità — ma tecnicamente, oggi, le due cose sono in larga parte la stessa leva.

Per un sito SME/e-commerce (non un editore) la scelta razionale è quasi sempre non fare opt-out dai bot di retrieval (vuoi essere citato); l'opt-out dai bot di training ha costo quasi nullo in visibilità immediata. Vanno distinti: bloccare GPTBot (training) non toglie da ChatGPT Search; bloccare OAI-SearchBot/ChatGPT-User sì.

Garante Privacy e GDPR: il precedente italiano

Il Garante italiano è stato il primo regolatore al mondo a limitare ChatGPT (31 marzo 2023, Provv. 112/2023): mancanza di informativa, assenza di base giuridica per il training, carente tutela dei minori. Riattivazione il 28 aprile 2023 dopo misure correttive (informativa, diritto di opposizione anche per i non-utenti, verifica età). Sanzione del 2024 (Provv. 755): 15 milioni di euro; OpenAI fa opposizione e il Tribunale di Roma annulla la sanzione (sent. n. 4153/2026, depositata il 18 marzo 2026), dopo di che il provvedimento è stato rimosso dal sito del Garante. (Le motivazioni non risultano ancora pubbliche a metà 2026.) Il "diritto di opposizione" esteso ai non-utenti è un precedente di opt-out su base privacy parallelo a quello copyright.

Timeline operativa dell'AI Act

1 agosto 2024: entrata in vigore (Reg. UE 2024/1689).
2 agosto 2025: applicabili gli obblighi per i modelli GPAI (policy copyright e "riassunto sufficientemente dettagliato" dei dati di training); pubblicato il GPAI Code of Practice.
2 agosto 2026: piena applicabilità, inclusi gli obblighi di etichettatura dei contenuti generati da AI e dei deepfake.

Per un freelance: gli obblighi diretti ricadono sui fornitori di modelli, non su chi pubblica siti. Ma l'etichettatura dei contenuti AI-generati dei clienti e la gestione corretta di opt-out/licensing diventano parte della due diligence professionale.

06Pratica

Implicazioni operative

Cosa resta valido dalla SEO classica

Crawlability e indicizzazione (estese a Bing per ChatGPT e ai bot AI di retrieval); autorevolezza/E-E-A-T; HTML semantico e velocità; rendering server-side (molti bot AI fetchano ma non eseguono JS).

Cosa è nuovo nella GEO

Ottimizzazione a livello di chunk/passaggio (non di pagina); ampiezza topica per il query fan-out (pillar + cluster); costruzione di entità/brand; diversificazione delle superfici (YouTube, Reddit); indicizzazione su Bing.

Raccomandazioni operative in tre fasi

Fase 1 — Fondamenta tecniche (immediato): verifica l'indicizzazione su Bing Webmaster Tools (prerequisito per ChatGPT) e usa IndexNow; audita il robots.txt consentendo i bot di retrieval (OAI-SearchBot, ChatGPT-User, Claude-SearchBot, Claude-User, PerplexityBot, Perplexity-User) anche bloccando il training; rendering server-side del contenuto chiave e HTML semantico pulito.
Fase 2 — Contenuto (1-3 mesi): riscrivi le pagine top in formato answer-first (heading a domanda, risposta diretta nei primi 40-60 token); inserisci statistiche citate e quotazioni (le leve con più evidenza); aggiorna trimestralmente i contenuti chiave (freschezza, specie per Perplexity); struttura in chunk autosufficienti che coprano le sotto-domande (per il fan-out), architettura pillar + cluster — scrivendo bene, non spezzando artificialmente.
Fase 3 — Autorità e misurazione (3-6 mesi): costruisci menzioni di brand e citazioni di terze parti (G2/Trustpilot, PR digitale, YouTube, Reddit; Wikipedia per il grounding delle entità dove rilevante); implementa un tool di tracking AI (Otterly entry, Peec AI per il multilingua europeo, Profound enterprise) e monitora trend con run ripetute, non snapshot.

Soglie che cambiano le scelte

Se il traffico da AI search supera l'1-2% (oggi tipicamente <1% ma converte meglio dell'organico), aumenta l'investimento GEO.
Se l'overlap tra citazioni AI e ranking organico è basso, dai priorità a chunkability e autorevolezza.
Per l'Italia, monitora il lancio dell'AI Mode in italiano e l'evoluzione del caso FIEG-AGCOM e del quadro copyright UE.

07Anti-hype

Cosa smontare nel discorso GEO

Questa sezione isola i claim GEO che circolano come verità ma hanno evidenza debole, nulla o contraria. Criterio unico: fonte primaria o esperimento replicabile vs ripetizione tra influencer.

Google smonta 5 miti (15 maggio 2026)

Il 15 maggio 2026 Google Search Central ha pubblicato la guida ufficiale "Optimizing your website for generative AI features on Google Search" (annunciata da John Mueller). È la dichiarazione on-record più esplicita su cosa funziona per AI Overviews e AI Mode. Tesi di fondo: "AEO e GEO sono ancora SEO", perché le feature AI girano sugli stessi sistemi di ranking della Search classica. Google classifica come non necessari: (1) file llms.txt e markup speciali — "You don't need to create new machine readable files, AI text files, markup, or Markdown to appear in generative AI search"; (2) il chunking del contenuto — i sistemi "are able to understand the nuance of multiple topics on a page"; (3) le riscritture AI-specifiche; (4) le menzioni inautentiche (link-building e menzioni artificiali); (5) l'uso eccessivo di schema/structured data. Cosa fare davvero: SEO solida, contenuto non-commodity con prospettive uniche ed esperienza diretta, asset multimodali.

A rafforzare la posizione, il 5 giugno 2026 Google ha pubblicato "Google Search's guidance on using third-party SEO tools, services, and advice" e aggiornato "Do you need an SEO?", nominando esplicitamente AEO e GEO come categorie di servizio. Google legittima la disciplina ma ne restringe il perimetro — resta "ancora SEO" — e invita alla cautela verso chi promette scorciatoie o garanzie di citazione nelle risposte AI.

La tensione onesta sul chunking

Google ha ragione su un punto: non devi spezzare fisicamente la pagina in micro-file né riscrivere in "formato AI" — i suoi sistemi fanno il chunking lato loro e capiscono pagine multi-tema. Ma "non serve il chunking manuale" ≠ "la struttura non conta": la ricerca sul RAG mostra che chunk netti e autosufficienti migliorano il retrieval a parità di tutto il resto, e li ottieni scrivendo bene (heading chiari, un'idea per sezione, risposte dirette), non manipolando la struttura per il bot. Distinzione cruciale: la guida vale per Google (che gira sul ranking Search); per ChatGPT, Perplexity e Claude (pipeline RAG proprie) la struttura resta più rilevante. Generalizzare "il chunking è morto" a tutti i motori è iper-estensione. Verdetto: smetti di vendere "ottimizzazione del chunking" come servizio a sé; continua a scrivere contenuto strutturato bene.

llms.txt — il caso da manuale di hype

Una proposta di Jeremy Howard (settembre 2024), un file Markdown nella root per aiutare gli LLM a usare un sito in inferenza; nasce per la documentazione tecnica destinata a dev tool, non come leva SEO. Le prove contro: Google (Mueller, Illyes) dichiara di non usarlo e lo paragona al "keywords meta tag" obsoleto; Otterly rileva 84 richieste su 62.100 in 90 giorni (0,1%); Ahrefs (mag 2026, ~38.000 file validi su 137.210 domini) rileva che il 97% dei file non riceve alcuna richiesta; SE Ranking (~300.000 domini) non trova correlazione con le citazioni; Search Engine Land: "there is no data or evidence showing that llms.txt files boost AI inclusion." Il granello di verità: Wix (AI Search Lab, oltre 1.400 file, nov 2025) stima i file indicizzati saliti da ~30-60.000 a ~120.000 (mag 2026, picco ~200.000 ad aprile) — ma è una stima di parte non verificata (la cifra "125.000" del sottotitolo non coincide col "~120.000" del corpo) e, parole della stessa fonte, "this will not make or break your GEO strategy." Verdetto: leva di citazione AI non provata, con evidenza prevalentemente contraria. Caso d'uso legittimo e ristretto (documentazione per agenti/dev tool). Priorità realistica: bassissima.

Servire le pagine anche in Markdown — marginale, spesso hype

Conviene pubblicare una versione Markdown delle pagine per farsi citare meglio? Per i motori mainstream è marginale/situazionale, non provato, e in alcune forme è rischioso. Distinzione tecnica: la content negotiation via Accept: text/markdown sullo stesso URL è standard HTTP legittimo; i file .md a URL separati sono definiti da Google e Bing come potenziale cloaking e raddoppio del crawl budget. I crawler di ricerca (GPTBot, OAI-SearchBot, ChatGPT-User, PerplexityBot, ClaudeBot, Googlebot, Bingbot) non negoziano Markdown — lo fanno solo alcuni agenti di coding in sessione live (Claude Code, Cursor, OpenCode — test Checkly, feb 2026). Evidenza empirica di effetto nullo/non significativo: Profound (esperimento controllato, 381 pagine, gen-feb 2026) trova ~16% di lift non statisticamente significativo, trainato da outlier; Otterly trova 0% di traffico bot AI e zero citazioni ai file .md. Il vantaggio reale del Markdown è la tokenizzazione (~80% di token in meno secondo Cloudflare), ma beneficia chi converte l'HTML (Jina Reader, Firecrawl, le pipeline RAG, Claude Code via Turndown lo fanno già). Google (15 mag 2026): "You don't need to create new machine readable files, AI text files, markup, or Markdown … as Google Search itself doesn't use them"; Mueller (feb 2026) definisce convertire le pagine solo per i bot "such a stupid idea". Verdetto: utile solo per documentazione tecnica/SaaS/API consultata da agenti in tempo reale; per un sito generico conta molto di più l'HTML semantico pulito. Se lo implementi, usa content negotiation con Vary: Accept, mai file .md indicizzabili separati.

Schema/structured data — utile, ma non per il motivo che ti dicono

Il claim hype: "senza schema.org non vieni citato dall'AI". Google (maggio 2026) lo dichiara non richiesto per generare risposte AI; Pedro Dias e altri hanno mostrato che lo schema non influenza le citazioni ChatGPT. Gli studi di correlazione esistono ma sono confusi da variabili terze: i siti con schema tendono a essere anche più curati e autorevoli — la correlazione non isola lo schema come causa. Verdetto bilanciato: resta utile per i suoi scopi classici (rich result, parsing, disambiguazione di entità) e per la Search tradizionale, non come "trucco AI".

I numeri-civetta dei vendor

Percentuali precise senza fonte primaria nominata: "data-rich citati 2,7x in più", "FCP <0,4s = 6,7 citazioni medie", "heading ben organizzati = 2,8x più citate" (AirOps — quest'ultima almeno ha un dataset dichiarato di 45.000 citazioni, più difendibile). Spesso mancano metodologia, dimensione del campione, numero di run e gruppo di controllo. Alla luce del SE 0,370 a una run, qualsiasi cifra a due decimali ottenuta senza run ripetute è statisticamente sospetta. Regola pratica: se un claim non dichiara quante volte ha ripetuto ogni prompt e su quale periodo, è aneddoto.

"Il SEO è morto" — l'iper-estensione opposta

Altrettanto falsa: i dati Ahrefs/Semrush mostrano che il ranking organico tradizionale resta correlato (anche se non più condizione necessaria) con la citazione AI; gli AI Overviews girano sopra il sistema di ranking Search; la "visibilità parametrica" si costruisce con gli stessi segnali del SEO classico (autorità, copertura stampa, Wikipedia, backlink, menzioni). Google stessa intitola la sua posizione "AEO e GEO sono ancora SEO". La GEO è un'estensione del SEO, non un suo sostituto. Le fondamenta sono più importanti, non meno; ciò che cambia è il livello di competizione (chunk vs pagina), le superfici e le metriche.

Claim GEO	Verdetto	Priorità
Statistiche + citazioni di fonti	Provato	Alta
Freschezza del contenuto	Provato	Alta
Contenuto non-commodity / esperienza diretta	Confermato	Alta
Struttura answer-first	Solido	Alta
Menzioni brand > backlink	1 studio	Media
Schema per citazione AI	Sopravvalutato	Bassa
Chunking manuale	Mito (Google)	Bassa
llms.txt come leva	Non provato	Bassissima
Servire pagine in Markdown	Marginale	Bassa
Numeri-civetta "2,7x"	Aneddoto	Ignora
"Il SEO è morto"	Falso	—

Caveats di fondo. Distinguere fatti documentati da claim dei vendor: indici e numeri Pew/SparkToro/Ahrefs/Seer sono ben documentati; molti "fattori di citazione" precisi provengono da blog di vendor non verificabili. L'overlap tra citazioni AIO e top-10 varia tra studi (38% vs 76%) anche per differenze metodologiche. Le previsioni sono previsioni (il 25% di Gartner è una stima del 2024). I dettagli su web.run, fan-out e system prompt di ChatGPT derivano da analisi indipendenti (RESONEO/Meteoria, AirOps, Dejan), non da documentazione ufficiale completa, e cambiano da un modello all'altro. Le pipeline cambiano rapidamente (Gemini 3 gen 2026, switch ChatGPT 5.3 mar 2026): ogni dato ha una data di validità.