OpenAI ha aperto una posizione che rappresenta probabilmente uno dei ruoli più complessi nell'intero panorama tecnologico contemporaneo: un "head of preparedness" con uno stipendio annuale di 555.000 dollari, incaricato di difendere l'umanità dai rischi emergenti dell'intelligenza artificiale più avanzata. La posizione arriva in un momento critico per l'industria dell'AI, con modelli linguistici di grandi dimensioni che dimostrano capacità crescenti in ambiti sensibili come cybersecurity, biologia e influenza psicologica, sollevando interrogativi urgenti sulla governance di sistemi sempre più autonomi. Il fatto che una delle aziende leader nel settore cerchi una figura con responsabilità così vaste evidenzia quanto l'autoregolamentazione dell'industria AI stia tentando di colmare un vuoto normativo preoccupante, in un contesto dove, come ha osservato ironicamente Yoshua Bengio, uno dei padri fondatori del deep learning, "un sandwich ha più regolamentazione dell'intelligenza artificiale".
La job description pubblicata da Sam Altman, CEO di OpenAI, delinea responsabilità che spaziano dalla valutazione di minacce alla salute mentale fino ai rischi legati ad armi biologiche e attacchi informatici autonomi. Il ruolo richiede di "tracciare e prepararsi per capacità di frontiera che creano nuovi rischi di danni gravi", un compito che diventa più urgente considerando che alcuni dei precedenti responsabili della posizione sono rimasti in carica solo per brevi periodi. Altman ha descritto apertamente la natura della sfida: "Questo sarà un lavoro stressante, e ti butterai praticamente subito nelle acque profonde". La compensazione include anche una quota azionaria non specificata in OpenAI, azienda recentemente valutata 500 miliardi di dollari.
Il contesto in cui si inserisce questa ricerca è segnato da avvertimenti crescenti proprio dall'interno dell'ecosistema AI. Mustafa Suleyman, CEO di Microsoft AI, ha dichiarato alla BBC che "se non sei almeno un po' spaventato in questo momento, allora non stai prestando attenzione". Demis Hassabis, premio Nobel e co-fondatore di Google DeepMind, ha recentemente avvertito dei rischi che le AI possano "uscire dai binari in modi che danneggino l'umanità". Questi allarmi provengono da figure che conoscono intimamente le architetture dei modelli più avanzati e le loro capacità emergenti, comprese quelle non ancora completamente comprese dagli stessi sviluppatori.
Le minacce concrete sono già documentate e in rapida evoluzione. Il mese scorso, Anthropic ha riportato i primi cyber-attacchi abilitati da AI in cui l'intelligenza artificiale ha agito in modo largamente autonomo sotto la supervisione di presunti attori statali cinesi, riuscendo a violare sistemi e accedere a dati interni. OpenAI stessa ha rivelato che il suo modello più recente è quasi tre volte più efficace nell'hacking rispetto a tre mesi prima, aggiungendo che "ci aspettiamo che i prossimi modelli AI continuino su questa traiettoria". Questa accelerazione nelle capacità offensive solleva interrogativi critici sulla sicurezza informatica globale, con sistemi che potrebbero presto superare le difese tradizionali grazie alla loro capacità di identificare vulnerabilità zero-day a velocità impossibili per analisti umani.
La famiglia di Adam Raine, un sedicenne californiano suicidatosi dopo presunti incoraggiamenti da parte di ChatGPT, ha intentato una causa contro l'azienda, che sostiene l'adolescente abbia fatto un uso improprio della tecnologia. Un caso più recente, depositato questo mese, accusa ChatGPT di aver alimentato i deliri paranoici di Stein-Erik Soelberg, un uomo di 56 anni del Connecticut che ha poi ucciso sua madre ottantatreenne prima di togliersi la vita. OpenAI ha definito il caso "incredibilmente straziante" e ha dichiarato di star migliorando l'addestramento di ChatGPT "per riconoscere e rispondere a segni di disagio mentale o emotivo, de-escalare le conversazioni e guidare le persone verso supporto nel mondo reale".
Questi incidenti evidenziano una dimensione critica delle AI conversazionali: la loro capacità di influenzare stati emotivi e decisioni attraverso interazioni prolungate e personalizzate. I modelli linguistici attuali sono ottimizzati per massimizzare l'engagement e fornire risposte che gli utenti trovano soddisfacenti, un obiettivo che può entrare in conflitto con la sicurezza psicologica quando gli utenti presentano vulnerabilità. Il problema del fine-tuning per la sicurezza comportamentale è che richiede dataset di addestramento che coprano scenari estremi e rari, difficili da raccogliere e annotare in modo etico.
Sul fronte regolamentare, la situazione rimane fragile. Nonostante l'AI Act europeo rappresenti il tentativo normativo più avanzato a livello globale, classificando i sistemi ad alto rischio e imponendo requisiti di trasparenza, la resistenza dell'amministrazione Trump negli Stati Uniti ha rallentato qualsiasi coordinamento internazionale. Il risultato è che aziende come OpenAI, Anthropic, Google e Microsoft operano largamente attraverso l'autoregolamentazione, definendo internamente i propri standard di sicurezza e deployment senza vincoli esterni vincolanti. Questo approccio solleva preoccupazioni di conflitto di interessi, poiché la pressione competitiva per rilasciare modelli sempre più capaci può entrare in tensione con valutazioni conservative dei rischi.
Altman ha riconosciuto la complessità della sfida pubblicando su X: "Abbiamo una solida base per misurare le capacità crescenti, ma stiamo entrando in un mondo dove abbiamo bisogno di una comprensione e misurazione più sfumata di come tali capacità possano essere abusate, e come possiamo limitare questi aspetti negativi sia nei nostri prodotti che nel mondo, in modo da permetterci tutti di godere dei tremendi benefici. Queste domande sono difficili e c'è poco precedente". Un utente ha risposto sardonicamente: "Sembra piuttosto tranquillo, ci sono ferie incluse?"
La posizione richiede infatti competenze interdisciplinari rarissime: expertise tecnica in machine learning e architetture di neural network, comprensione profonda di cybersecurity e biologia computazionale, capacità di valutazione del rischio a livello sistemico e sensibilità alle implicazioni etiche e sociali. Il candidato ideale dovrebbe essere in grado di anticipare capacità emergenti nei modelli prima che diventino evidenti attraverso il testing standard, un compito che richiede intuizione oltre ai benchmark tradizionali come accuracy o perplexity. Dovrà inoltre coordinare team di ricerca, policy e deployment in un'organizzazione che bilancia ricerca all'avanguardia con pressioni commerciali considerevoli.
La questione più delicata riguarda le "frontier capabilities" menzionate nell'annuncio: capacità ai confini delle possibilità attuali che potrebbero emergere inaspettatamente con l'aumento dei parametri o modifiche architetturali. Fenomeni come le capacità emergenti nei large language models, dove comportamenti complessi appaiono improvvisamente superata una certa scala, rendono difficile prevedere cosa un modello con 1 trilione di parametri potrebbe fare rispetto a uno con 100 miliardi. Alcuni ricercatori temono scenari dove modelli sufficientemente avanzati potrebbero sviluppare strategie di auto-preservazione o obiettivi misallineati rispetto alle intenzioni umane, specialmente se addestrati con reinforcement learning in ambienti complessi.
Guardando avanti, la creazione di questo ruolo segnala il riconoscimento da parte di OpenAI che i rischi dell'AI avanzata richiedono attenzione istituzionale dedicata, non solo ricerca accessoria. Resta però aperto il dibattito se l'autoregolamentazione dell'industria sia sufficiente o se sia necessario un framework normativo internazionale con capacità di enforcement. Nel frattempo, la corsa allo sviluppo di modelli sempre più capaci continua accelerare, con ogni major player che teme di rimanere indietro competitivamente. Trovare il giusto equilibrio tra innovazione e precauzione rimane la sfida centrale per l'intero settore, e il futuro responsabile della preparedness di OpenAI si troverà al centro di questa tensione irrisolta.