L'inventore dell'AI ora teme i suoi pericoli

Mentre gli Stati Uniti fanno i conti con l'utilizzo dell'intelligenza artificiale per scopi criminali - l'FBI ha rivelato che due uomini sospettati di aver bombardato una clinica per la fertilità in California hanno ottenuto istruzioni per costruire ordigni esplosivi tramite AI - dall'altra parte del mondo accademico emerge una risposta inaspettata. Yoshua Bengio, uno dei padri fondatori dell'intelligenza artificiale moderna, ha lanciato un'organizzazione no-profit con un obiettivo ambizioso: creare un'AI progettata specificamente per essere più sicura e contrastare i sistemi che causano danni sociali. La coincidenza temporale tra questi due eventi non potrebbe essere più emblematica dell'epoca selvaggia che stiamo vivendo nel campo dell'intelligenza artificiale.

Il paradosso del pioniere pentito

Nel 2018, Bengio aveva ricevuto il prestigioso Premio Turing insieme ai colleghi Yann LeCun e Geoffrey Hinton per le ricerche rivoluzionarie sul deep learning pubblicate tre anni prima. Oggi, quello stesso scienziato che ha contribuito a gettare le basi dell'AI moderna si trova nella posizione paradossale di dover correre ai ripari per limitare i danni della sua stessa creazione. La sua nuova organizzazione, LawZero, sta sviluppando "Scientist AI", un modello che promette di essere "onesto e non ingannevole", incorporando principi di sicurezza fin dalla fase di progettazione.

La corsa sfrenata delle aziende tecnologiche per sviluppare sistemi AI sempre più veloci e accattivanti ha creato quello che Bengio definisce il "Far West dell'intelligenza artificiale". Ogni azienda vuole superare i concorrenti e conquistare la vetta del mercato, spesso sacrificando la sicurezza sull'altare della velocità e dell'innovazione.

Due caratteristiche per cambiare tutto

Secondo un documento preliminare pubblicato online quest'anno, Scientist AI si distinguerà dai sistemi attuali per due aspetti fondamentali. Il primo riguarda la capacità di valutare e comunicare il proprio livello di confidenza nelle risposte fornite, riducendo così il problema delle AI che danno risposte sbagliate con eccessiva sicurezza. Il secondo aspetto consiste nella capacità di spiegare il proprio ragionamento agli esseri umani, permettendo di valutare e testare l'accuratezza delle conclusioni raggiunte.

Paradossalmente, i vecchi sistemi AI avevano questa caratteristica, ma è stata sacrificata per la velocità

Curiosamente, i sistemi AI più datati possedevano già questa funzionalità esplicativa. Tuttavia, nella fretta di creare approcci più rapidi e innovativi, molti modelli moderni hanno perso la capacità di spiegare le proprie decisioni. Gli sviluppatori hanno deliberatamente rinunciato alla comprensibilità in favore delle prestazioni.

Combattere il fuoco con il fuoco

L'approccio di Bengio prevede che Scientist AI funzioni come una sorta di guardrail digitale contro le AI non sicure, monitorando altri sistemi meno affidabili e potenzialmente dannosi. Questa strategia di utilizzare un'AI per controllare altre AI potrebbe rappresentare l'unica soluzione praticabile per migliorare la sicurezza del settore. Gli esseri umani, infatti, non sono in grado di monitorare adeguatamente sistemi come ChatGPT, che gestiscono oltre un miliardo di query quotidiane.

Utilizzare un sistema di intelligenza artificiale per controllarne altri non è fantascienza, ma una pratica comune nella ricerca per confrontare e testare diversi livelli di intelligenza nei sistemi AI. Solo un'altra AI può gestire una scala di operazioni così massiccia.

Il "modello del mondo" mancante

Un elemento chiave che il team di Bengio sta aggiungendo a Scientist AI è il "modello del mondo", che dovrebbe portare certezza e spiegabilità al sistema. Proprio come gli esseri umani prendono decisioni basandosi sulla loro comprensione del mondo, anche l'AI ha bisogno di un modello simile per funzionare efficacemente.

L'assenza di un modello del mondo negli attuali sistemi AI è evidente in diversi casi. Il famoso "problema delle mani" rappresenta un esempio lampante: la maggior parte dei modelli AI odierni riesce a imitare l'aspetto delle mani ma non può replicare movimenti naturali, perché manca loro la comprensione della fisica che sta dietro questi movimenti. Un altro esempio riguarda le difficoltà di modelli come ChatGPT con gli scacchi, dove falliscono nel vincere e compiono persino mosse illegali, nonostante sistemi AI più semplici - ma dotati di un modello del "mondo" scacchistico - riescano a battere anche i migliori giocatori umani.

Ostacoli sulla strada della sicurezza

Nonostante Bengio sia sulla strada giusta, combinando modelli linguistici di grandi dimensioni con altre tecnologie AI per costruire sistemi più sicuri e affidabili, il percorso non sarà semplice. I 30 milioni di dollari di finanziamento di LawZero impallidiscono di fronte al progetto da 500 miliardi di dollari annunciato dal presidente americano Donald Trump per accelerare lo sviluppo dell'AI.

La sfida diventa ancora più ardua considerando che Scientist AI, come qualsiasi altro progetto di intelligenza artificiale, necessita di enormi quantità di dati per essere potente, e la maggior parte di questi dati è controllata dalle principali aziende tecnologiche. Rimane inoltre una domanda fondamentale: anche se Bengio riuscisse a costruire un sistema AI che fa tutto quello che promette, come riuscirà a controllare altri sistemi che potrebbero causare danni?

Tuttavia, questo progetto, sostenuto da ricercatori di talento, potrebbe innescare un movimento verso un futuro in cui l'AI aiuta davvero gli esseri umani a prosperare. Se avrà successo, potrebbe stabilire nuove aspettative per l'AI sicura, motivando ricercatori, sviluppatori e decisori politici a dare priorità alla sicurezza. Forse, se avessimo preso misure simili quando i social media sono emersi per la prima volta, avremmo oggi un ambiente online più sicuro per la salute mentale dei giovani. E magari, se Scientist AI fosse già stato operativo, avrebbe potuto impedire a persone con intenzioni dannose di accedere a informazioni pericolose attraverso sistemi di intelligenza artificiale.