Anthropic rinuncia alla sicurezza per il Pentagono

Nel panorama dell'intelligenza artificiale globale, poche aziende hanno costruito la propria identità attorno alla sicurezza con la stessa determinazione di Anthropic. Fondata da ex ricercatori di OpenAI — tra cui il CEO Dario Amodei e suo fratello Tom — proprio per dare priorità a uno sviluppo responsabile dei sistemi AI, la società ha a lungo rappresentato un punto di riferimento per chi sostiene un approccio più cauto alla corsa tecnologica. Per questo motivo, la recente revisione della sua politica di sicurezza fondamentale ha suscitato reazioni significative nell'intero ecosistema dell'AI.

Il nucleo del cambiamento riguarda la cosiddetta Responsible Scaling Policy, il framework di sicurezza adottato due anni fa che imponeva alla società di sospendere lo sviluppo di modelli più potenti qualora le loro capacità avessero superato la soglia di controllo e sicurezza gestibile dall'azienda stessa. Questa clausola — considerata tra le misure di auto-regolamentazione più coraggiose del settore — è stata ora rimossa. Al suo posto, Anthropic ha introdotto un documento chiamato "Frontier Safety Roadmap", descritto esplicitamente come un insieme di obiettivi pubblici flessibili, non più impegni vincolanti.

In un comunicato ufficiale, un portavoce di Anthropic ha difeso la nuova impostazione come "la più avanzata fino ad oggi in termini di accountability pubblica e trasparenza", impegnandosi a pubblicare rapporti periodici dettagliati sulle capacità dei modelli sviluppati e sui piani per rafforzare le mitigazioni del rischio. Tuttavia, la stessa azienda ammette che il framework aggiornato è "più flessibile" del precedente: obiettivi pubblici che verranno valutati apertamente nei progressi raggiunti, ma senza i meccanismi di blocco obbligatorio che caratterizzavano la politica originale.

La motivazione dichiarata da Anthropic per questo cambio di rotta tocca un nodo cruciale del dibattito AI: l'efficacia dell'auto-regolamentazione unilaterale in un mercato competitivo. L'azienda aveva sperato che la propria policy avrebbe innescato una "race to the top" nel settore, incentivando altri player a rafforzare le salvaguardie dei propri modelli. Quel processo, riconosce ora la società, non si è verificato — gli altri attori hanno continuato ad accelerare senza adottare misure equivalenti.

"Non ci sembrava sensato prendere impegni unilaterali mentre i competitor avanzavano a piena velocità", ha dichiarato Jared Kaplan, Chief Science Officer di Anthropic, in un'intervista a Time.

Kaplan ha precisato che la decisione è stata presa nell'interesse della sicurezza stessa, più che sotto la pressione della concorrenza: fermare lo sviluppo di modelli AI avanzati, mentre altri laboratori procedono senza le stesse restrizioni, potrebbe generare un mondo complessivamente meno sicuro, lasciando il campo aperto ad attori meno scrupolosi. È un argomento che rispecchia la logica del "disarmo unilaterale" spesso citata nel dibattito sulla governance dell'AI — e che divide profondamente la comunità dei ricercatori.

Sul fronte geopolitico, la settimana ha portato ulteriori tensioni per Anthropic. Il Segretario alla Difesa statunitense Pete Hegseth ha imposto al CEO Dario Amodei un ultimatum: smantellare alcune delle salvaguardie dell'azienda o rischiare la perdita di un contratto da 200 milioni di dollari con il Pentagono, oltre all'inserimento in una lista nera governativa. Lo strumento ipotizzato sarebbe il Defense Production Act, che consentirebbe di designare Anthropic come rischio per la catena di approvvigionamento strategico.

Nonostante la pressione istituzionale, Anthropic ha mantenuto due linee rosse su cui non intende cedere: l'impiego dell'AI nel controllo autonomo di sistemi d'arma e la sorveglianza di massa della popolazione civile americana. Secondo fonti interne, la società ritiene che gli attuali modelli di AI non siano sufficientemente affidabili per operare sistemi d'arma in autonomia, e che l'assenza di un quadro normativo specifico sulla sorveglianza di massa renda inaccettabile qualsiasi deroga in questo ambito. Questa posizione ha raccolto ampi consensi nella comunità dei ricercatori AI, con numerosi esperti che su piattaforme social hanno espresso solidarietà ad Anthropic.

Vale la pena ricordare che Anthropic aveva investito concretamente nella propria reputazione safety-first: ha pubblicato ricerche che documentano come i propri modelli, tra cui Claude, possano in determinate condizioni sperimentali produrre comportamenti scorretti come il ricatto, e ha donato 20 milioni di dollari a Public First Action, un gruppo politico che sostiene l'adozione di garanzie normative sull'AI. La società ha inoltre chiarito che la revisione della policy interna è separata e indipendente dalla disputa con il Pentagono.

Il contesto competitivo in cui si inserisce questa svolta è quello di una corsa frenetica al dispiegamento di strumenti AI per le imprese, con Anthropic e OpenAI che si contendono lo stesso mercato enterprise. Nel frattempo, in Europa, il dibattito sull'AI Act si confronta esattamente con questo genere di tensioni: come garantire standard di sicurezza vincolanti senza soffocare l'innovazione, e come coordinare le politiche di governance tra attori privati e pubblici in uno scenario geopolitico sempre più frammentato.

La domanda che resta aperta è se la nuova "Frontier Safety Roadmap" — più trasparente nei report periodici, ma meno cogente nei meccanismi di blocco — riesca davvero a mantenere la fiducia degli stakeholder istituzionali, dei ricercatori e degli utenti finali. Il valore di una politica di sicurezza, nell'AI come altrove, si misura nella tenuta sotto pressione: e le prossime iterazioni di Claude, sviluppate in questo nuovo regime di governance, saranno il banco di prova più significativo per valutare se la flessibilità adottata da Anthropic rappresenti un adattamento pragmatico o un arretramento strutturale.

Anthropic rinuncia alla sicurezza per il Pentagono

> Anthropic, nota per la sua attenzione alla sicurezza nell'AI, ha rivisto la sua Responsible Scaling Policy, suscitando reazioni nell'intero ecosistema dell'intelligenza artificiale.