I. Il pappagallo stocastico

C’è un’immagine che circola ormai da qualche anno nei dibattiti sull’intelligenza artificiale, una definizione che viene citata in ogni corso, che si può leggere in qualsiasi articolo sul tema. Vale la pena prenderla sul serio invece di incasellarla come semplice metafora giornalistica: il pappagallo stocastico. La definizione fu coniata in un paper[i] del 2021 (un anno prima dell’uscita sul mercato consumer della prima intelligenza artificale generativa, Chat Gpt) da Emily Bender, Timnit Gebru e le loro coautrici: quell’articolo accademico è diventato oggi uno dei documenti più citati e più scomodi del campo. Un grande modello linguistico, scrivevano le ricercatrici, è «un sistema che cuce in modo casuale sequenze di forme linguistiche osservate nel suo immenso corpus di addestramento, secondo informazioni probabilistiche su come si combinano, ma senza alcun riferimento al significato»: come abbiamo detto, un pappagallo stocastico.

La metafora è efficace non perché sia lusinghiera - non lo è - ma perché è precisa. I modelli linguistici di grandi dimensioni non comprendono: predicono. Non hanno accesso al significato, ma solo alla forma. Eppure, producono testo fluente, coerente, persuasivo; in altre parole, non hanno niente da dire ma lo dicono benissimo. Sta qui il problema principale, quello che Bender e le sue colleghe chiamano «la coerenza negli occhi di chi guarda» (paragrafo 6.1 del loro paper): siamo noi, interlocutori umani, a proiettare intenzione e senso su un output che ne è strutturalmente privo. Il pappagallo non ci inganna; siamo noi a ingannarci, perché la nostra competenza linguistica non sa fare altro che interpretare il linguaggio come comunicazione intenzionale.

Emily Bender

Il paper di Bender però non si ferma alla critica epistemologica. Il suo contributo più duraturo riguarda un’altra domanda: su cosa, esattamente, questi modelli vengono addestrati? E chi decide cosa includere e cosa escludere? La risposta è scomoda. I dataset su cui si addestrano i grandi LLM sono costruiti prevalentemente a partire da testi in lingua inglese, prodotti da utenti giovani, occidentali, maschi, istruiti. Reddit, Wikipedia, archivi di libri digitalizzati: tutte fonti che sovrarappresentano sistematicamente un punto di vista egemonico e marginalizzano tutto ciò che è orale, comunitario, non codificato in testo, non anglofono. Il modello non è neutro: è lo specchio di una gerarchia.

A questo si aggiunge una contraddizione strutturale che il paper sfiora ma non sviluppa fino in fondo, e che merita di essere portata alla luce. Il processo di addestramento dei modelli non si esaurisce nell’ingestione dei dati: richiede una fase di allineamento - il cosiddetto RLHF, Reinforcement Learning from Human Feedback - in cui valutatori umani classificano le risposte del modello, insegnandogli quale output è “migliore”. Ora, chi sono questi valutatori? Non i ricercatori bianchi e acculturati di cui parla Bender - quelli che definiscono i criteri, l’architettura valoriale, le domande da porre. Quelli sono i pensatori. I valutatori sono lavoratori precari del Kenya, delle Filippine, dell’India, pagati pochi dollari all’ora per applicare criteri che non hanno contribuito a definire, su un prodotto di cui non controlleranno mai l’uso finale. È la divisione coloniale del lavoro intellettuale ed esecutivo riprodotta nella filiera dell’intelligenza artificiale: il Nord pensa, il Sud esegue. E il Sud paga due volte - con il proprio lavoro e con la propria salute mentale, esposto quotidianamente ai contenuti più violenti e degradanti che i modelli producono e che devono essere filtrati prima che il prodotto raggiunga il mercato.

ÂÂ

II. La catena coloniale

Per comprendere questa struttura non bastano le categorie della critica tecnologica. Occorre uno sguardo più lungo, che riconosca nelle dinamiche dell’intelligenza artificiale la continuazione - con mezzi nuovi - di un’organizzazione del mondo che ha radici profonde.

Nick Couldry e Ulises Mejias, nel loro The Costs of Connection (2019)[ii], hanno proposto il concetto di “colonialismo dei dati” come strumento analitico, non come metafora. L’appropriazione storica di territori, corpi e risorse naturali si specchia oggi nella datificazione pervasiva della vita umana. Le piattaforme digitali catturano le nostre interazioni, le relazioni e i desideri per trasformarli in dati che poi estraggono, elaborano e rivendono - peraltro a noi stessi - sotto forma di pubblicità mirata, di contenuti personalizzati, di nudge comportamentali[iii]. La logica è quella dell’estrazione: prendere qualcosa che esiste in abbondanza, trasformarlo in risorsa, valorizzarlo per altri. Ciò che cambia rispetto al colonialismo delle materie prime è il territorio - non più la terra, ma la vita sociale e cognitiva.

Questa prospettiva trova una fondazione teorica più robusta nel lavoro di Shakir Mohamed, Marie-Therese Png e William Isaac[iv], che nel 2020 hanno elaborato il concetto di “AI decoloniale”. Per questi autori, lo sviluppo dei sistemi di intelligenza artificiale dovrebbe essere compreso come costituito da una catena di approvvigionamento coloniale - una filiera che si basa su un’ingiusta divisione internazionale del lavoro digitale e sulla subordinazione materiale ed epistemologica dei paesi della maggioranza globale. I dati vengono estratti dal Sud globale; il valore viene prodotto e appropriato dal Nord. I benefici non ricadono sulle stesse popolazioni che ne sostengono i costi.

Ma c’è una dimensione che né Couldry né Mohamed sviluppano con sufficiente precisione, e che riguarda il livello epistemico - non solo chi

Anibal Quijano

estrae, ma cosa viene estratto e cosa viene escluso. Qui il contributo di Aníbal Quijano[v] è indispensabile. Il suo concetto di “matrice coloniale del potere” descrive come il colonialismo non abbia mai operato solo sul piano economico o politico, ma abbia costruito una gerarchia del sapere - una classificazione di conoscenze in cui il pensiero occidentale si situa al vertice come universale e razionale, mentre tutto ciò che viene da altrove viene declassato a locale, tradizionale, prescientifico. I grandi modelli linguistici incarnano questa gerarchia in modo quasi meccanico: il sapere che non è stato codificato in testo digitale anglofono semplicemente non esiste per loro. Non è stato filtrato - non è mai entrato.

Questo è ciò che il sociologo peruviano chiama “epistemicidio”: la distruzione sistematica di forme di conoscenza che non si lasciano sussumere nel paradigma dominante. L’AI non inventa questa gerarchia - la eredita, la amplifica e la naturalizza, presentandola come il risultato neutro di un processo tecnico.

La contraddizione che avevamo individuato a proposito dei valutatori keniani si chiarisce ora in tutta la sua profondità. Quella struttura non è un’anomalia da correggere: è la forma normale in cui il colonialismo del sapere si riproduce nell’era digitale. Il lavoratore del Sud globale può formalmente “partecipare” al processo di allineamento - e questo conferisce al sistema una legittimità democratica apparente - ma lo fa applicando categorie che non ha definito, dentro un frame che non ha negoziato, per un prodotto di cui non vedrà i benefici. È ciò che Gayatri Spivak chiamerebbe cooptazione: il subalterno può parlare[vi], ma le strutture del discorso egemonico neutralizzano la sua voce prima ancora che raggiunga il destinatario.

Qui Marx ritorna utile non come citazione d’obbligo ma come strumento analitico. Il feticismo della merce - la tendenza del prodotto capitalistico a presentarsi come autonomo, oggettivo, privo di storia, nascondendo il lavoro vivo che lo ha prodotto - trova nella intelligenza artificiale la sua forma più compiuta. Il modello linguistico ci appare come un’intelligenza, come un interlocutore, come qualcosa che “sa”. Non vediamo i lavoratori keniani che ne hanno formato le risposte, non vediamo i data center che consumano acqua e elettricità in regioni già colpite dalla crisi climatica, non vediamo i miliardi di atti comunicativi espropriati senza consenso per costruire i dataset. Il pappagallo parla - e noi dimentichiamo la gabbia.

ÂÂ

III. Il governo del desiderio

Se il colonialismo dei dati descrive la struttura economica ed epistemica dell’intelligenza artificiale, resta ancora da spiegare un fatto apparentemente paradossale: perché ci piace tanto. Perché aderiamo volontariamente a sistemi che ci estraggono, ci classificano, ci confinano dentro frame predefiniti. La risposta non è nella falsa coscienza - “non sappiamo cosa ci fanno” - ma in qualcosa di più sottile e più interessante.

230608 Chul-Han sc 20

Byung-Chul Han[vii] ha proposto una distinzione che illumina questo punto. La società disciplinare descritta da Foucault operava attraverso il divieto: il potere diceva “non devi”, costruiva muri, prigioni, norme. La società della prestazione contemporanea opera invece attraverso la permissività: il potere dice “puoi, anzi devi” - realizzati, esprimi te stesso, connettiti. La coercizione diventa indistinguibile dal desiderio, e il soggetto non si sente controllato ma liberato. Le piattaforme digitali sono la forma paradigmatica di questo potere. Nessuno ti obbliga a usare Instagram o TikTok - eppure vi trascorriamo ore ogni giorno, producendo spontaneamente i dati che alimentano il sistema che ci profila. Il panopticon, il carcere “ideale” (dal punto di vista del carceriere!) di Bentham non ha più bisogno di guardie: i detenuti si sorvegliano da soli, e lo fanno con piacere.

Ma c’è un livello ulteriore, specifico alla questione del frame che le piattaforme impongono alla nostra comunicazione. Quando Facebook riduce l’intera gamma delle nostre reazioni emotive a sei pulsanti - like, amore, risata, sorpresa, tristezza, rabbia - non sta solo semplificando l’interfaccia. Sta definendo quali emozioni hanno diritto di esistere pubblicamente, quali meritano espressione, quali restano mute perché non hanno un tasto corrispondente. È quello che Foucault chiamerebbe un dispositivo: non una semplice limitazione, ma una produzione di soggetti - una macchina che forma ciò che siamo capaci di pensare e di esprimere, non solo ciò che possiamo fare.

Questa logica del frame si estende all’intero ciclo dell’intelligenza artificiale. I valutatori dell’RLHF non scelgono liberamente tra possibilità aperte - scelgono tra opzioni già definite da altri. Gli utenti delle piattaforme non costruiscono liberamente le loro identità digitali - le costruiscono con i mattoni che la piattaforma ha predisposto. E i modelli linguistici non generano liberamente testo - generano la continuazione più probabile di pattern già osservati, dentro uno spazio di possibilità che replica fedelmente la gerarchia epistemica dei dati di addestramento. La libertà è reale ma strutturalmente circoscritta - ed è precisamente questa parvenza di libertà a renderla così efficace come meccanismo di potere.

È qui che Baudrillard diventa utile, in un modo che va oltre il cliché del simulacro. Le allucinazioni degli LLM - quei momenti in cui il modello produce affermazioni false con assoluta sicurezza - vengono trattate tecnicamente come bug, difetti da correggere nelle versioni successive. Ma si possono leggere diversamente: come il momento in cui la natura del sistema si rivela nel modo più trasparente. Il modello allucinante non sta “sbagliando” rispetto a una realtà che non ha mai avuto - sta producendo, con la stessa logica con cui produce tutto il resto, un simulacro: una copia senza originale, una forma senza referente. L’allucinazione non è un’eccezione al funzionamento del pappagallo stocastico - è la sua essenza portata alla superficie.

E il punto più inquietante è che noi spesso non ce ne accorgiamo - o ce ne accorgiamo solo dopo, quando il danno è fatto. Perché la nostra competenza linguistica non sa fare altro che interpretare il linguaggio come comunicazione intenzionale, come ha scritto Bender. Proiettiamo significato, intenzione, responsabilità su un sistema che strutturalmente ne è privo. E questo ci espone a una forma nuova di vulnerabilità: non quella di essere ingannati da un altro soggetto - ma quella di ingannarci da soli, in assenza di qualsiasi interlocutore.

ÂÂ

Conclusione - Il pappagallo e il padrone

Torniamo all’immagine iniziale. Il pappagallo stocastico è una macchina che riproduce forme linguistiche senza accedere al loro significato. Ma la metafora, presa sul serio, rivela qualcosa di più di una critica tecnica. Ogni pappagallo ha un padrone - qualcuno che decide quali parole insegnargli, in quale lingua, con quale accento. Qualcuno che lo espone, o non lo espone, a certi discorsi. Qualcuno che si appropria della sua voce per fini propri, presentando quella voce come naturale, spontanea, intelligente.

Il padrone del pappagallo stocastico non è un singolo individuo - è una struttura: la filiera coloniale del lavoro digitale, la gerarchia epistemica dei dataset, il dispositivo del desiderio che ci fa aderire volontariamente al frame. Marx, Quijano, Spivak, Han, Baudrillard non sono riferimenti eruditi da esibire - sono strumenti per vedere questa struttura, per renderla visibile laddove si presenta come neutra, tecnica, inevitabile.

La posta in gioco non è piccola. I modelli linguistici stanno diventando infrastruttura - strumenti con cui si produce e si filtra conoscenza, si prendono decisioni, si formano soggetti. Se questa infrastruttura replica e amplifica la matrice coloniale del potere, il problema non è un bug da correggere nella prossima versione. È una scelta politica - fatta da qualcuno, nell’interesse di qualcuno, a spese di qualcun altro. Riconoscerla come tale è il primo passo per immaginare un’alternativa.

ÂÂ

Fonti

[i] Emily M. Bender, Timnit Gebru, Angelina McMillan-Major, Shmargaret Shmitchell, On the Dangers of Stochastic Parrots: Can Language Models Be Too Big?, marzo 2021, in FAccT '21: Proceedings of the 2021 ACM Conference on Fairness, Accountability, and Transparency, pagg. 610 – 623, https://doi.org/10.1145/3442188.344592

[ii] Nick Culdry, Ulises A. Mejias, The Costs of Connection, 2019, Stanford University Press (ediz. it.: Il prezzo della connessione. Come i dati colonizzano la nostra vita e se ne appropriano per far soldi, Il Mulino, 2022).

[iii] Termine dell’economia comportamentale coniato dall’economista Richard Thaler (premio Nobel nel 2017 proprio per questi studi) e dal giurista Cass R. Sunstein nel loro libro Nudge: Improving Decisions about Health, Wealth, and Happiness, 2008, Yale University Press (ediz. it.: Nudge. La spinta gentile, Feltrinelli 2022), che definisce appunto una forma di persuasione “morbida” che si realizza con il rimodellamento diretto del contesto fisico o digitale in cui la decisione viene presa. L’illusione è quella di aver scelto liberamente. Secondo le teorie dello psicologo Daniel Kahneman, il nudge finisce per essere un automatismo mentale che sfrutta stanchezza, disattenzione o pigrizia delle persone, portandole a “scegliere” la via che richiede meno sforzo, non necessariamente la migliore o quella “corretta”.

[iv] Shakir Mohamed, Marie-Therese Png e William Isaac, Decolonial AI: Decolonial Theory as Sociotechnical Foresight in Artificial Intelligence, luglio 2020, in Philosophy & Technology, volume 33, pagg. 659-684, Springer.

[v]Aníbal Quijano, Colonialidad del poder, eurocentrismo y América Latinain La colonialidad del saber: eurocentrismo y ciencias sociales. Perspectivas latinoamericanas, 1993 CLACSO, pagg. 122-152.

[vi] Gayatri Chakravorty Spivak, Can the Subaltern Speak?, saggio pubblicato per la prima volta nel 1985 sulla rivista Wedge. L’edizione successiva è del 1988, apparsa in Marxism and the Interpretation of Culture (a cura di Cary Nelson e Lawrence Grossberg), University of Illinois Press e ancora, in versione ampiamente rielaborata, 1999 in G. C. Spivak, A Critique of Postcolonial Reason, Harvard University Press (ediz. it.: Critica della ragione postcoloniale, Meltemi, 2016).

[vii] Del filosofo sud-coreano naturalizzato tedesco si possono leggere, in questo contesto, almeno due libri: Transparenzgesellschaft, Matthes & Seitz, 2012 (ediz. it.: La società della trasparenza, nottetempo, 2014) e Psychopolitik. Neoliberalismus und die neuen Machttechniken, 2014, Fischer (ediz. it.: Psicopolitica, nottetempo, 2016).

Succ. >