GPT-5.4: OpenAI punta sugli agenti autonomi

OpenAI continua a spingere i confini dell'intelligenza artificiale agenziale con il lancio di GPT-5.4, un modello che segna un passaggio significativo verso sistemi AI capaci di operare autonomamente su computer reali. In un panorama sempre più affollato di agenti AI — da Anthropic a Google DeepMind, passando per le numerose startup europee che competono nello stesso spazio — questa release introduce capacità native di computer use che posizionano OpenAI come protagonista nella corsa verso l'automazione agenziale complessa. La posta in gioco non è solo tecnologica: si tratta di definire come gli esseri umani delegheranno compiti digitali a sistemi automatizzati nei prossimi anni.

Il tratto più distintivo di GPT-5.4 è proprio la sua capacità nativa di interagire con un computer come farebbe un operatore umano: il modello è in grado di generare codice per controllare applicazioni, emettere comandi da tastiera e mouse in risposta a screenshot, e navigare tra browser e software in modo autonomo. Questo lo rende, di fatto, il primo modello di OpenAI a integrare il computer use direttamente nell'architettura, senza ricorrere a layer esterni o tool separati. Per sviluppatori e aziende che cercano di automatizzare flussi di lavoro complessi — dalla gestione di fogli di calcolo alla compilazione di presentazioni aziendali — questa caratteristica apre scenari applicativi concreti e immediatamente fruibili.

Sul fronte della riduzione delle allucinazioni — ovvero la tendenza dei modelli LLM a generare affermazioni false con apparente sicurezza — OpenAI dichiara che GPT-5.4 rappresenta il proprio modello più accurato dal punto di vista fattuale: le singole affermazioni errate sarebbero il 33% meno frequenti rispetto a GPT-5.2. Si tratta di un miglioramento quantificabile in un'area critica per l'adozione aziendale, dove l'affidabilità dell'output è spesso il fattore discriminante tra uno strumento utile e uno potenzialmente dannoso. Il modello mostra anche capacità avanzate nel recupero di informazioni distribuite su più fonti, con una ricerca persistente su più round interrogativi particolarmente efficace nelle cosiddette domande "needle-in-a-haystack", quelle che richiedono di identificare un'informazione specifica in un corpus vasto e eterogeneo.

Parallelamente al modello base, OpenAI rilascia GPT-5.4 Thinking, la variante con capacità di ragionamento esteso orientata agli utenti ChatGPT. Questo modello — che sarà disponibile per gli abbonati Plus, Team e Pro — è progettato per esporre una traccia del proprio processo di inferenza su query complesse, rendendo visibile il percorso logico che porta alla risposta finale. Una funzionalità particolarmente rilevante è la possibilità di interrompere e riorientare il modello durante l'elaborazione stessa, senza necessità di ricominciare l'intera sessione: un approccio che riduce la frizione nel prompt engineering iterativo e che avvicina l'interazione con l'AI a un vero dialogo collaborativo.

GPT-5.4 segna il debutto del computer use nativo in OpenAI: il modello può emettere comandi da tastiera e mouse, con affermazioni errate ridotte del 33% rispetto a GPT-5.2.

La funzione di steering mid-response di GPT-5.4 Thinking è già disponibile nella web app di ChatGPT e su Android, mentre il rilascio per iOS è atteso a breve. Per quanto riguarda l'ecosistema enterprise, OpenAI propone anche una variante GPT-5.4 Pro destinata a utenti ChatGPT Enterprise ed Edu, oltre che all'API, posizionata come soluzione per le attività computazionalmente più intensive. La distribuzione attraverso le API apre inoltre la porta a integrazioni personalizzate da parte di sviluppatori terzi, che potranno sfruttare le capacità di computer use in pipeline agentic proprie.

Il modello si inserisce in una traiettoria evolutiva ben definita nel settore: dopo il lancio di ChatGPT Agent e la proliferazione di strumenti analoghi come Operator — anch'esso di OpenAI — e i competitor di casa Google e Anthropic, l'industria si sta muovendo con decisione verso reti di agenti AI capaci di completare job complessi in autonomia, dalla ricerca di prodotti online all'esecuzione di sequenze operative multi-step all'interno di software aziendali. GPT-5.4 aggiunge a questo scenario la capacità di chiamare tool e API con maggiore precisione ed efficienza rispetto alle versioni precedenti, un aspetto cruciale per la costruzione di workflow agenziali affidabili.

Dal punto di vista della governance e della sicurezza, l'estensione delle capacità operative degli agenti AI solleva interrogativi che il quadro normativo europeo, incluso l'AI Act, dovrà affrontare con crescente urgenza: sistemi in grado di agire autonomamente su un computer accedono potenzialmente a dati sensibili, possono modificare documenti e interagire con servizi esterni, configurandosi come sistemi ad alto rischio in determinati contesti professionali. La trasparenza del processo decisionale — di cui GPT-5.4 Thinking offre un segnale, con la sua traccia ragionativa esplicita — è uno dei requisiti chiave che regolatori e aziende dovranno negoziare nei prossimi mesi.

La domanda che rimane aperta per ricercatori e osservatori del settore riguarda la scalabilità e l'affidabilità di queste capacità agenziali in scenari ad alta complessità e bassa strutturazione: quanto può spingersi un modello come GPT-5.4 prima di richiedere supervisione umana? E come si misureranno le performance di sistema — non solo del singolo modello — quando agenti multipli cooperano su task distribuiti? Le prossime versioni, e i benchmark che emergeranno nelle conferenze come NeurIPS e ICML, daranno risposte più precise a una sfida che è già, a tutti gli effetti, al centro del dibattito tecnico globale sull'AI.

GPT-5.4: OpenAI punta sugli agenti autonomi

> OpenAI lancia GPT-5.4, un modello con capacità native di computer use che segna un passo verso sistemi AI in grado di operare autonomamente su macchine reali.