Gemini 3 inaugura una nuova era dell'intelligenza AI

Google alza significativamente l'asticella nella corsa globale agli AI model più avanzati con il lancio di Gemini 3, un sistema che l'azienda di Mountain View definisce come il suo modello più intelligente mai sviluppato. L'annuncio, che arriva a quasi due anni dall'avvio dell'iniziativa Gemini, rappresenta un salto generazionale nell'integrazione tra capacità di reasoning avanzato, comprensione multimodale e performance agentic, tre dimensioni che il CEO Sundar Pichai identifica come i pilastri della strategia AI del gruppo. Con oltre 2 miliardi di utenti mensili per AI Overviews e 650 milioni per l'app Gemini, Google accelera l'implementazione del nuovo modello attraverso l'intero ecosistema di prodotti, dall'integrazione nativa in Search fino alle piattaforme di sviluppo professionale.

Dal punto di vista delle prestazioni, Gemini 3 Pro stabilisce nuovi standard nei benchmark di riferimento del settore, conquistando la vetta della LMArena Leaderboard con un punteggio Elo di 1501. Il modello dimostra capacità di reasoning a livello PhD raggiungendo il 37,5% su Humanity's Last Exam senza utilizzo di tool esterni e il 91,9% su GPQA Diamond, benchmark che testano la comprensione profonda di concetti scientifici complessi. Particolarmente significativo il risultato del 23,4% su MathArena Apex, che certifica un nuovo stato dell'arte nella risoluzione di problemi matematici avanzati per i frontier model.

L'architettura multimodale nativa di Gemini 3 rappresenta uno dei suoi principali punti di forza tecnologici. Il modello raggiunge l'81% su MMMU-Pro e l'87,6% su Video-MMMU, dimostrando capacità senza precedenti nell'elaborazione integrata di testo, immagini, video, audio e codice. Questa multimodalità avanzata si traduce in applicazioni pratiche che vanno dalla decifrazione e traduzione di ricette manoscritte in lingue diverse alla generazione di visualizzazioni scientifiche ad alta fedeltà tramite codice, sfruttando una context window di 1 milione di token che permette di processare documenti estremamente lunghi e complessi.

Google introduce parallelamente Gemini 3 Deep Think, una modalità di reasoning potenziato che spinge ulteriormente le prestazioni del sistema su problemi di particolare complessità. Nei test interni, Deep Think raggiunge il 41% su Humanity's Last Exam e il 93,8% su GPQA Diamond, superando le già notevoli performance della versione Pro. Il risultato più impressionante riguarda però l'inedito 45,1% ottenuto su ARC-AGI-2 con esecuzione di codice, un benchmark che misura la capacità dei modelli di affrontare sfide completamente nuove, avvicinandosi al concetto di intelligenza artificiale generale.

Gemini 3 Pro conquista la vetta della LMArena Leaderboard con 1501 Elo, stabilendo nuovi record su benchmark matematici e multimodali con prestazioni da livello PhD

Sul fronte delle capacità agentic e di coding, Gemini 3 si posiziona come il modello più performante mai sviluppato da Google per queste applicazioni. Con 1487 Elo su WebDev Arena e il 76,2% su SWE-bench Verified, il sistema dimostra abilità avanzate nella generazione zero-shot di interfacce web interattive e nella gestione autonoma di task di sviluppo software complessi. Il 54,2% ottenuto su Terminal-Bench 2.0 certifica inoltre le capacità di tool use del modello nell'operare su sistemi via terminale, un prerequisito fondamentale per applicazioni agentic avanzate.

L'ecosistema di sviluppo si arricchisce di Google Antigravity, una nuova piattaforma agent-first che reimmagina radicalmente l'esperienza di sviluppo sfruttando le capacità di reasoning, tool use e coding agentico di Gemini 3. A differenza dei tradizionali IDE assistiti da AI, Antigravity eleva gli agenti a una superficie dedicata con accesso diretto a editor, terminale e browser, permettendo loro di pianificare ed eseguire autonomamente task software end-to-end mentre validano il proprio codice. La piattaforma integra anche il nuovo Gemini 2.5 Computer Use per il controllo del browser e Nano Banana (Gemini 2.5 Image) per l'editing delle immagini, configurandosi come un ambiente completo per lo sviluppo assistito da AI.

Le capacità di planning a lungo termine rappresentano un altro breakthrough significativo. Su Vending-Bench 2, che simula la gestione di un business di distributori automatici per un anno completo, Gemini 3 Pro mantiene consistency nell'utilizzo di tool e nel decision-making generando ritorni economici significativamente superiori rispetto ad altri frontier model, senza drift dal task assegnato. Questa caratteristica si traduce in applicazioni pratiche attraverso Gemini Agent, disponibile per gli abbonati Google AI Ultra, che può gestire workflow multi-step complessi come la prenotazione di servizi locali o l'organizzazione automatica della casella email, mantenendo sempre il controllo e la supervisione dell'utente.

Dal punto di vista dell'implementazione, Google adotta una strategia di distribuzione capillare. Gemini 3 Pro è disponibile da oggi nell'app Gemini, in AI Mode in Search con nuove esperienze di UI generativa dinamica, per gli sviluppatori attraverso Google AI Studio, Vertex AI, Gemini CLI e piattaforme terze come Cursor, GitHub, JetBrains, Replit. Questa integrazione rappresenta la prima volta che Google rilascia un modello Gemini in Search dal primo giorno di lancio, segnalando un cambio di strategia verso un'implementazione più aggressiva delle proprie tecnologie AI nei prodotti consumer.

Sul fronte della sicurezza e della valutazione responsabile, Gemini 3 ha completato il più comprehensivo set di safety evaluation mai condotto su un modello Google AI. Il sistema mostra ridotta sycophancy, maggiore resistenza ai prompt injection e protezioni migliorate contro misuse via cyberattack. Google ha collaborato con esperti di dominio di livello mondiale, fornito accesso anticipato a enti come l'UK AISI e ottenuto valutazioni indipendenti da Apollo, Vaultis e Dreadnode, nel rispetto del proprio Frontier Safety Framework. Il modello raggiunge inoltre il 72,1% su SimpleQA Verified, un benchmark che misura l'accuratezza fattuale, affrontando così uno dei problemi storici dei large language model: le hallucination.

Gemini 3 Deep Think mode seguirà un percorso di rilascio più prudente, con ulteriori valutazioni di sicurezza e input da safety tester prima della disponibilità per gli abbonati Google AI Ultra nelle prossime settimane. Google anticipa inoltre il rilascio di modelli aggiuntivi nella serie Gemini 3, suggerendo un approccio modulare con varianti specializzate per casi d'uso specifici, seguendo la strategia già adottata con le versioni 2.0 e 2.5. Con 13 milioni di developer che hanno già utilizzato i modelli generativi Google e oltre il 70% dei clienti Cloud che adottano le sue soluzioni AI, l'azienda punta a consolidare la propria posizione nel competitivo mercato dei foundation model, sfidando direttamente GPT-4, Claude di Anthropic e i modelli open source della famiglia LLaMA.

Gemini 3 inaugura una nuova era dell'intelligenza AI

> Google presenta Gemini 3, il suo modello AI più avanzato con capacità di reasoning, comprensione multimodale e performance agentic migliorate.