L'AI generativa limitata a creatività amatoriale

Il dibattito sull'intelligenza artificiale generativa e le sue capacità creative si arricchisce di un contributo scientifico destinato a fare discutere: uno studio teorico pubblicato sul Journal of Creative Behaviour sostiene che i Large Language Models come ChatGPT siano matematicamente incapaci di superare la creatività di un essere umano dilettante. La ricerca, condotta da David H. Cropley dell'Università del Sud Australia, introduce un modello quantitativo per valutare oggettivamente l'output creativo delle AI, concludendo che l'architettura probabilistica su cui si basano questi sistemi impone un limite superiore invalicabile alla qualità della loro produzione. In un'epoca in cui le applicazioni di AI generativa proliferano dall'ambito artistico a quello professionale, questa analisi solleva interrogativi cruciali sull'effettiva autonomia creativa delle macchine e sul loro ruolo nell'ecosistema dell'innovazione.

Cropley ha affrontato la questione applicando la definizione standard di creatività ai meccanismi di funzionamento dei modelli linguistici. Secondo questa definizione, un prodotto creativo deve soddisfare simultaneamente due criteri: efficacia (utilità e appropriatezza rispetto allo scopo) e originalità (novità e capacità di sorprendere). Nella creatività umana di alto livello, questi due elementi coesistono: un capolavoro è insieme altamente unico e perfettamente eseguito. L'analisi si è concentrata sul meccanismo di "next-token prediction" che caratterizza i LLM, un processo trasparente e deterministico che consente una misurazione matematica impossibile quando si studiano i processi cognitivi opachi del cervello umano.

L'architettura dei Large Language Models rivela un trade-off fondamentale tra i due parametri creativi. Per produrre un output efficace, il modello deve selezionare token ad alta probabilità contestuale: se il prompt è "Il gatto si sedette sul...", la parola "tappeto" rappresenta un completamento efficace perché grammaticalmente corretto e semanticamente coerente. Tuttavia, proprio perché statisticamente probabile, questo output risulta prevedibile e quindi poco originale. Al contrario, scegliere token a bassa probabilità aumenterebbe la novità ma comprometterebbe l'efficacia: completare con "chiave inglese rossa" o "nuvola ringhiante" produrrebbe risultati sorprendenti ma privi di senso.

La modellizzazione matematica di questa relazione ha portato Cropley a identificare un limite superiore di creatività pari a 0.25 su una scala da zero a uno. Questo picco si verifica esclusivamente quando efficacia e novità sono bilanciate a livelli moderati, dimostrando che i sistemi probabilistici non possono massimizzare contemporaneamente entrambe le variabili. Il risultato contrasta con le capacità umane: creatori esperti possono combinare novità estrema ed efficacia estrema, raggiungendo punteggi significativamente superiori. Contestualizzando questo dato con il modello "Four C" della creatività—che classifica l'espressione creativa da "mini-c" (interpretativa) a "Big-C" (leggendaria)—lo studio colloca il limite dell'AI al confine tra creatività "little-c" (sforzi amatoriali quotidiani) e "Pro-c" (competenza professionale).

I Large Language Models sono strutturalmente incapaci di raggiungere livelli professionali o esperti secondo gli attuali principi di progettazione, rimanendo confinati alla creatività media umana

Le implicazioni pratiche di questa analisi sono rilevanti per l'industria tecnologica e i settori creativi. Studi empirici citati nella ricerca confermano che contenuti AI-generati—storie, soluzioni, immagini—si posizionano consistentemente tra il 40° e il 50° percentile rispetto agli output umani. Questo spiega perché l'AI generativa appaia impressionante al pubblico generalista: poiché la maggior parte delle persone produce lavoro di livello "little-c", un sistema che replica questa performance risulta convincente. Tuttavia, professionisti altamente creativi riconoscono immediatamente la natura formulaica dei contenuti AI, identificando pattern ripetitivi e mancanza di insight trasformativi.

Come sottolinea Cropley nel comunicato istituzionale, generare contenuto non equivale a essere creativi. I modelli linguistici vengono addestrati su enormi dataset esistenti e rispondono ai prompt basandosi su ciò che hanno appreso, producendo output attesi e non sorprendenti. Un autore, artista o designer esperto può occasionalmente produrre qualcosa di genuinamente originale ed efficace; un LLM non lo farà mai, generando invariabilmente risultati nella media. L'adozione massiccia di questi strumenti senza consapevolezza dei loro limiti rischia di produrre lavoro ripetitivo e standardizzato, particolarmente problematico per industrie che dipendono dall'innovazione differenziante.

Lo studio presenta alcune limitazioni metodologiche che aprono spazi per ulteriori investigazioni. Il modello utilizza un'approssimazione lineare per definire la novità come inverso dell'efficacia, semplificazione dei concetti più complessi della teoria dell'informazione. L'analisi assume inoltre modalità operative standard per i LLM—come greedy decoding o simple sampling—senza considerare ogni possibile variazione nelle strategie di prompt engineering o nell'editing collaborativo human-in-the-loop che potrebbe artificialmente migliorare il prodotto finale. Il focus rimane sull'output autonomo del sistema piuttosto che sul suo potenziale come strumento collaborativo.

Ricerche future potrebbero esplorare come diverse impostazioni di temperature—parametri che controllano la casualità delle risposte AI—possano consentire fluttuazioni in questo limite creativo. Tecniche di reinforcement learning potrebbero essere ottimizzate per privilegiare la novità senza sacrificare la coerenza, mentre studi cross-linguistici potrebbero verificare se questo limite matematico si mantiene attraverso lingue e contesti culturali differenti. Nel contesto europeo, dove l'AI Act sta definendo framework normativi per sistemi ad alto rischio, comprendere i limiti intrinseci dell'AI generativa assume rilevanza anche regolamentare: distinguere tra capacità reali e percezioni pubbliche è essenziale per politiche informate.

La conclusione di Cropley è categorica: perché l'AI raggiunga creatività di livello esperto, servirebbero architetture completamente nuove, capaci di generare idee non ancorate a pattern statistici del passato. Fino a quando tale cambio paradigmatico non avverrà nelle scienze computazionali, gli esseri umani rimangono l'unica fonte di creatività di alto livello. Questo non sminuisce l'utilità dei LLM come strumenti di supporto per compiti di routine o come acceleratori di workflow creativi, ma ridimensiona le aspettative sulla loro autonomia innovativa. Per sviluppatori e aziende tech, la sfida diventa progettare sistemi che amplificano piuttosto che sostituire la creatività umana, riconoscendo che l'expertise professionale resta, almeno per ora, un dominio distintamente umano nel panorama dell'intelligenza artificiale.

L'AI generativa limitata a creatività amatoriale

> Uno studio teorico sostiene che i Large Language Models come ChatGPT non possono superare la creatività di un dilettante a causa dei limiti della loro architettura probabilistica.