C:\AIBAY\MENU> _
[X]
┌──────────────┐ └──────────────┘

DeepSeek svela Janus: il futuro è multimodale

DeepSeek svela Janus: il futuro è multimodale

> DeepSeek lancia Janus Pro-7B: il nuovo modello multimodale supera DALL-E 3 di OpenAI, ampliando le frontiere dell'intelligenza artificiale generativa.

Un nuovo modello di intelligenza artificiale multimodale chiamato Janus Pro-7B è stato lanciato dalla startup cinese DeepSeek. Il sistema, che integra elaborazione di testo e immagini, si pone come competitor di DALL-E 3 di OpenAI e Stable Diffusion di Stability AI nel campo della generazione di contenuti visivi.

Janus Pro-7B rappresenta un significativo passo avanti per DeepSeek, che recentemente aveva già fatto parlare di sé con il modello R1. L'architettura del nuovo sistema si basa su un transformer unificato, disponibile in versioni da 1 e 7 miliardi di parametri. Il modello è stato addestrato su un dataset di 90 milioni di campioni, di cui 72 milioni sintetici.

Tra le caratteristiche tecniche chiave, Janus Pro-7B può elaborare immagini con risoluzione fino a 768x768 pixel. La startup ha adottato un approccio open-source, rendendo il codice disponibile su GitHub e Hugging Face.

Il modello ha superato DALL-E 3 in alcuni benchmark.

Nei test comparativi, Janus Pro-7B ha mostrato prestazioni competitive. Ha superato DALL-E 3 nei benchmark GenEval e DPG-Bench, producendo output visivi di alta qualità. In diversi scenari, il modello cinese ha eguagliato o superato le capacità di Stable Diffusion.

Il lancio di Janus Pro-7B si inserisce in un contesto di rapida evoluzione dell'intelligenza artificiale generativa, con le aziende impegnate in una corsa all'innovazione. La mossa di DeepSeek potrebbe avere ripercussioni sul mercato, come già accaduto con il precedente modello R1 che aveva influenzato le quotazioni di NVIDIA.