Meta ha annunciato il lancio di Llama 3, l'ultima generazione del suo modello di linguaggio a grande scala (LLM) open source. Questo nuovo modello promette di stabilire nuovi standard nel settore, superando le performance di modelli precedenti come il GPT-3.5 in contesti d'uso reali.
Llama 3 è il risultato di oltre due anni di sviluppo, caratterizzato da un investimento significativo nella raccolta di dati di alta qualità e nell'ottimizzazione dell'architettura del modello. I modelli iniziali rilasciati hanno una capacità di 8 miliardi e 70 miliardi di parametri, ma sono previsti modelli ancora più grandi, fino a oltre 400 miliardi di parametri, nei prossimi mesi.
Meta ha rivelato che il suo modello istruito su 70 miliardi di parametri ha superato altri LLM di dimensioni simili in termini di performance in valutazioni umane, dimostrandosi particolarmente efficace in scenari che includono la programmazione, il ragionamento e la scrittura creativa.
In aggiunta, l'azienda punta su un approccio "open by default" per favorire uno sviluppo AI aperto e trasparente, rendendo Llama 3 disponibile su tutte le maggiori piattaforme cloud e ai produttori di hardware.
Inoltre, con l'introduzione di una suite rinnovata di strumenti per la sicurezza AI, Meta si impegna per lo sviluppo responsabile dell'intelligenza artificiale. Questo include strumenti per la classificazione dei rischi e la valutazione del potenziale uso improprio, nonché un nuovo componente per il filtraggio delle suggestioni di codice insicuro.
Nonostante le implicazioni positive, esperti del settore sollevano dubbi sull'effettiva motivazione di Meta a perseguire un approccio aperto per il "bene della società". Tuttavia, l'iniziativa è vista come un importante passo avanti verso modelli LLM aperti e accessibili.