Nel dibattito sempre più acceso sugli effetti dell'intelligenza artificiale sul mercato del lavoro, un nuovo studio di Anthropic introduce una metrica originale capace di distinguere ciò che i Large Language Model possono teoricamente fare da ciò che effettivamente fanno nel mondo reale. La ricerca, firmata da Maxim Massenkoff e Peter McCrory, si inserisce in un filone di analisi economica che, dall'avvento di ChatGPT in poi, ha moltiplicato previsioni spesso contraddittorie sull'automazione occupazionale. L'elemento dirompente di questo lavoro non è tanto un allarme quanto una mappa: un framework metodologico che punta a separare il segnale dal rumore nei dati sul lavoro, ben prima che gli effetti diventino incontrovertibili.
Il cuore dell'analisi è la cosiddetta observed exposure, ovvero l'esposizione osservata, una misura che combina la capacità teorica degli LLM — stimata attraverso la metrica β di Eloundou et al. (2023), pubblicata su arXiv — con i dati reali di utilizzo della piattaforma Claude raccolti nell'Anthropic Economic Index. A differenza dei precedenti indici di esposizione puramente teorici, questa metrica pondera più pesantemente gli usi automatizzati rispetto a quelli aumentativi, e privilegia i contesti lavorativi rispetto a quelli personali. Il risultato è una fotografia più nitida di quanto l'AI stia effettivamente penetrando nel tessuto produttivo.
La distinzione tra capacità teorica e utilizzo reale è cruciale. Lo studio mostra che il 97% dei task osservati nelle sessioni di Claude rientra nelle categorie teoricamente fattibili secondo Eloundou et al. (β ≥ 0.5), eppure l'adozione effettiva rimane largamente al di sotto del potenziale: nel settore informatico e matematico, per esempio, Claude copre attualmente solo il 33% dei task teoricamente accessibili. Il divario tra area blu (potenziale teorico) e area rossa (utilizzo osservato) — così come visualizzato nei grafici dello studio — rappresenta il territorio in cui si giocherà l'evoluzione dell'automazione nei prossimi anni.
Le occupazioni più esposte secondo questa metrica includono i Computer Programmer, con una copertura del 75%, seguiti dai Customer Service Representative e dai Data Entry Keyer, al 67%. In cima alla lista troviamo professioni caratterizzate da task altamente codificabili e ripetibili, o da un'ampia presenza di flussi API automatizzati. All'estremo opposto, il 30% dei lavoratori ha copertura zero: cuochi, meccanici, bagnini, baristi — professioni con una componente fisica irriducibile che rimane, per ora, fuori dalla portata degli LLM.
Un dato demografico merita attenzione particolare. Analizzando i dati del Current Population Survey nei mesi precedenti al lancio di ChatGPT (agosto-ottobre 2022), i ricercatori hanno tracciato il profilo dei lavoratori nel quartile più esposto: rispetto al gruppo con esposizione zero, sono più probabilmente donne (+16 punti percentuali), più probabilmente bianchi (+11 pp) o asiatici (quasi il doppio), guadagnano in media il 47% in più e hanno livelli di istruzione superiori. I laureati con titolo post-laurea sono il 17,4% del gruppo più esposto contro il 4,5% di quello non esposto: una differenza quasi quadrupla. Questo profilo contraddice la narrativa secondo cui l'AI minaccia principalmente i lavori a bassa qualifica.
Sul piano delle proiezioni occupazionali, lo studio incrocia la misura di esposizione osservata con le previsioni del Bureau of Labor Statistics (BLS) per il periodo 2024-2034. Emerge una correlazione negativa: ogni aumento di 10 punti percentuali nell'esposizione osservata corrisponde a una riduzione di 0,6 punti percentuali nelle proiezioni di crescita occupazionale. La correlazione è modesta ma statisticamente rilevante, e — dato significativo dal punto di vista metodologico — non emerge invece utilizzando la sola metrica teorica di Eloundou et al., il che suggerisce che l'aggiunta dei dati reali di utilizzo aggiunge effettivo potere predittivo.
Nonostante questi segnali strutturali, i dati sul mercato del lavoro attuale non mostrano ancora un impatto sistematico sull'occupazione. L'analisi del tasso di disoccupazione tra il 2016 e oggi evidenzia che, dalla diffusione di ChatGPT in poi, il differenziale tra lavoratori ad alta e bassa esposizione è rimasto statisticamente indistinguibile da zero. Un aumento differenziale dell'ordine di 1 punto percentuale sarebbe rilevabile con questo framework: scenari come una recessione stile 2008 limitata ai colletti bianchi — con raddoppio della disoccupazione dal 3% al 6% nel quartile più esposto — sarebbero visibili nell'analisi.
Il segnale più interessante riguarda i lavoratori giovani. I ricercatori documentano una riduzione del 14% nel tasso di job-finding per i lavoratori tra i 22 e i 25 anni nelle occupazioni ad alta esposizione nel periodo post-ChatGPT, rispetto al 2022 — un risultato appena statisticamente significativo. Il tasso di ingresso mensile nelle occupazioni più esposte si è ridotto di circa mezzo punto percentuale, mentre quello nelle occupazioni meno esposte è rimasto stabile al 2%. Questo pattern è assente nei lavoratori sopra i 25 anni, e suggerisce un rallentamento nelle assunzioni di nuovi entranti piuttosto che un aumento dei licenziamenti, coerentemente con quanto riportato da Brynjolfsson, Chandar e Chen (2025) su dati ADP.
Gli autori riconoscono esplicitamente i limiti dell'analisi. La metrica β di Eloundou et al. è calibrata sulle capacità degli LLM dell'inizio del 2023 e necessita di aggiornamento rispetto ai modelli attuali. I dati di utilizzo di Claude riflettono una sola piattaforma e potrebbero non catturare l'adozione di altri sistemi come GPT-4 o Gemini nelle organizzazioni. Il dato sui giovani lavoratori, poi, risente della difficoltà di tracciare i neo-entranti nel mercato del lavoro attraverso i sondaggi, poiché chi non trova impiego può semplicemente non risultare disoccupato se non si era ancora iscritto come tale.
Il confronto storico con precedenti previsioni sull'automazione è illuminante. Lo studio ricorda che la stima di Blinder et al. (2009) sull'offshorability identificava circa un quarto dei posti di lavoro statunitensi come vulnerabili, ma un decennio dopo la maggior parte di quelle occupazioni continuava a crescere. Analogamente, il dibattito sugli effetti dei robot industriali — con studi come Graetz e Michaels (2018) e Acemoglu e Restrepo (2020) che raggiungono conclusioni opposte — e quello sullo shock commerciale con la Cina ricordano quanto sia difficile isolare l'effetto di singole forze tecnologiche in mercati del lavoro complessi e dinamici.
La vera sfida metodologica è quella controfattuale: come stabilire cosa sarebbe successo in assenza dell'AI? La risposta dello studio è costruire le fondamenta ora, prima che gli effetti siano palesi, per poter in futuro separare con maggiore affidabilità la causalità dalla correlazione. I prossimi passi indicati dai ricercatori includono l'aggiornamento continuo dei dati di utilizzo, l'analisi dei laureati recenti in discipline esposte e l'estensione del framework ad altri paesi e piattaforme. La domanda aperta più rilevante resta se il rallentamento nelle assunzioni giovanili sia un segnale precoce di ristrutturazione strutturale o una fluttuazione transitoria — e il framework presentato è, per ora, lo strumento più rigoroso disponibile per rispondere.