Nell’epoca in cui la quantità ha soppiantato la qualità, in cui l’efficienza è diventata un dogma e la verità un’opinione soggettiva mediata da algoritmi, l’umanità rischia di precipitare in una nuova forma di ignoranza: una ignoranza automatizzata, riprodotta, sterilizzata. Non è più l’oscurantismo religioso a minacciare la conoscenza, ma il culto della macchina che impara da se stessa.
La rivoluzione dell’intelligenza artificiale generativa, esplosa a partire dal 2022 con il lancio di ChatGPT, sta producendo un effetto collaterale devastante: la contaminazione dei dati. Come la pioggia radioattiva seguita ai test nucleari del secolo scorso, i contenuti prodotti da modelli IA si sono diffusi ovunque, mimetizzandosi tra le parole scritte dall’uomo, alterando l’ambiente informativo globale.
Questa contaminazione è tutt’altro che innocua. I dati generati dalle IA, per quanto sofisticati, non sono frutto di esperienza, osservazione o responsabilità umana: sono frutto di previsioni statistiche, reiterazioni e probabilità. Quando nuovi modelli vengono addestrati su questi dati sintetici, si rompe la catena della conoscenza, come un’eco che si ripete svuotandosi a ogni rimbalzo. È il fenomeno che gli esperti chiamano model collapse: la regressione verso l’insignificanza, la perdita di senso e di verità nella ripetizione autoreferenziale dell’intelligenza.
Il problema non è solo tecnico: è politico. Perché l’accesso ai “dati puri”, non contaminati da contenuti generati da IA, diventa una nuova forma di potere. Chi possiede archivi di conoscenza autentica – testi, codice, dialoghi, letteratura, pensiero critico prodotto da esseri umani – può costruire modelli migliori, più affidabili, più performanti. Tutti gli altri saranno condannati a utilizzare intelligenze artificiali addestrate su contenuti tossici, degradati, superficiali.
Ecco che si disegna un futuro oligarchico della conoscenza: chi ha accesso ai dati incontaminati – le grandi corporation, gli apparati militari, alcuni centri di ricerca alleati ai governi – può plasmare il sapere, la memoria storica, le narrazioni ufficiali. Gli altri dovranno accontentarsi delle “fotocopie digitali” di un pensiero umano sempre più distante, inaccessibile, custodito dietro paywall, brevetti o segreti industriali.
Siamo davanti a una nuova forma di colonialismo epistemico: la privatizzazione della conoscenza e la disattivazione del pensiero critico, sostituito da interfacce amichevoli e contenuti sempre più addomesticati. Si vuole ridurre l’umanità a un popolo di utenti che chiedono alle macchine “cosa pensare”, mentre le macchine imparano da se stesse e dimenticano l’uomo.
La politica tace o si piega. Gli Stati Uniti e il Regno Unito adottano approcci deregolamentati, temendo di rallentare l’“innovazione”. L’Europa, con l’AI Act, tenta una timida regolazione, ma sempre dentro la cornice neoliberale: non toccare il profitto, limitati a minimizzare i danni.
In realtà, la posta in gioco è la democrazia cognitiva. Se non interveniamo ora per proteggere e garantire un accesso equo ai dati non contaminati, per promuovere modelli aperti, verificabili, pluralisti, rischiamo di consegnare il futuro del pensiero umano a pochi monopoli tecnocratici, che decideranno cosa è vero, cosa è ammissibile, cosa è pensabile.
Non è una guerra tra uomini e macchine. È una guerra tra i pochi che dominano la macchina e i molti che ne subiranno gli effetti.
Serve una nuova Costituente del digitale. Serve un diritto all’intelligenza non mediata. Serve un’ecologia della conoscenza. Perché la verità, per essere libera, ha bisogno di essere umana.
📚 Fonti
1. The Register – Thomas Claburn (15 giugno 2025)
“AI + ML: Il lancio di ChatGPT ha inquinato il mondo per sempre, come i primi test sulle armi atomiche”
Link diretto: https://www.theregister.com/2025/06/15/ai_model_collapse_pollution/
– Articolo che introduce l’analogia tra la contaminazione radioattiva post-1945 e l’inquinamento dei dati nell’era dell’IA generativa.
2. Shumailov, Ilia et al. (2023)
“The Curse of Recursion: Training on Generated Data Makes Models Forget”
– Paper accademico che analizza il rischio di model collapse quando i modelli di IA vengono addestrati su dati generati da altri modelli.
DOI: https://arxiv.org/abs/2305.17493
3. Maurice Chiodo et al. (2024)
“Legal Aspects of Access to Human-Generated Data and Other Essential Inputs for AI Training”
– Documento redatto da accademici del Centre for the Study of Existential Risk (University of Cambridge) e altre istituzioni europee.
[Fonte citata indirettamente su The Register; documento non ancora peer-reviewed al momento della pubblicazione]
4. Open Philanthropy – Alex Lawsen (2025)
– Osservazioni critiche sul paper di Apple riguardante il test di reasoning collapse nei modelli LLM (OpenAI, Claude, Gemini).
Fonte indiretta: citazione su The Register, articolo del 15/06/2025
5. Arctic Code Vault (GitHub/Internet Archive)
– Archivio di codice preservato prima dell’espansione dell’IA generativa, usato come esempio di “dati incontaminati”.
https://archiveprogram.github.com/arctic-vault/
6. Approfondimenti generali su “low-background steel” (acciaio a basso fondo):
– Wikipedia, scientific journals, e database storici sulla produzione di acciaio pre-1945 e il suo utilizzo nella medicina nucleare e nella fisica delle particelle.
Devi effettuare l'accesso per postare un commento.