Le principali caratteristiche di questi modelli includono:
- Supporto per contesti fino a 128.000 token (attualmente 32.000 su vLLM)
- Pattern di attenzione a finestra scorrevole interlacciata per Ministral 8B, per un'inferenza più rapida ed efficiente in termini di memoria
- Elevate prestazioni in vari benchmark, superando modelli simili come Gemma 2 2B e Llama 3
Casi d'uso e applicazioni
I Ministraux sono stati sviluppati per rispondere alla crescente domanda di inferenza locale e privacy-first in applicazioni critiche come:- Traduzione su dispositivo
- Assistenti intelligenti offline
- Analisi dati locale
- Robotica autonoma
Questi modelli possono anche fungere da intermediari efficienti per la chiamata di funzioni in flussi di lavoro agentivi multi-step, se utilizzati in combinazione con modelli linguistici più grandi come Mistral Large.
Prestazioni e confronti
Mistral AI ha condotto valutazioni approfondite dei nuovi modelli, confrontandoli con alternative come Gemma 2 e Llama 3. I risultati mostrano che:- Ministral 3B supera Mistral 7B in molti benchmark, nonostante le dimensioni inferiori
- Ministral 8B stabilisce nuovi standard di prestazione nella sua categoria
Le versioni "Instruct" di entrambi i modelli mostrano miglioramenti significativi in diverse categorie di valutazione rispetto ai concorrenti.
Disponibilità e prezzi
Entrambi i modelli sono disponibili da subito attraverso l'API di Mistral AI:- Ministral 8B: $0.1 per milione di token (input e output)
- Ministral 3B: $0.04 per milione di token (input e output)
I pesi del modello Ministral 8B Instruct sono disponibili per uso di ricerca. Per l'uso commerciale e l'implementazione autonoma, Mistral AI offre licenze specifiche e assistenza per la quantizzazione senza perdita di prestazioni.
L'azienda ha dichiarato: "Non vediamo l'ora che proviate les Ministraux e ci forniate feedback", sottolineando il rapido progresso compiuto nell'ultimo anno nel campo dei modelli AI di frontiera.