SenseTime lancia SenseNova 5.5, il primo modello AI multimodale in tempo reale della Cina

SenseTime, azienda cinese leader nel settore dell'intelligenza artificiale, ha presentato SenseNova 5.5, una versione potenziata del suo modello di linguaggio di grandi dimensioni (LLM). La novità più rilevante è SenseNova 5o, descritto come il primo modello multimodale in tempo reale della Cina.

SenseNova 5o rappresenta un notevole passo avanti nell'interazione uomo-macchina, offrendo capacità paragonabili alle funzionalità di interazione in streaming di GPT-4o. Questo progresso consente agli utenti di interagire con il modello in modo simile a una conversazione con una persona reale, rendendolo particolarmente adatto per applicazioni di conversazione in tempo reale e riconoscimento vocale.

Secondo quanto affermato da SenseTime, il suo ultimo modello supera i concorrenti in diversi benchmark:

Surclassa GPT-4o in 5 metriche chiave su 8
Mostra un miglioramento del 30% nelle prestazioni complessive rispetto al predecessore SenseNova 5.0
Offre migliori capacità di ragionamento matematico, padronanza dell'inglese e abilità nel seguire comandi

Democratizzazione dell'accesso all'IA avanzata

Per rendere l'IA avanzata più accessibile, SenseTime ha introdotto un modello di grandi dimensioni economico per dispositivi edge. Questa innovazione riduce il costo per dispositivo a soli 9,90 RMB (circa 1,36 dollari) all'anno, potenzialmente accelerando l'adozione su larga scala in vari dispositivi IoT.

L'azienda ha anche lanciato il "Progetto $0 Go", un pacchetto gratuito per le imprese che migrano dalla piattaforma OpenAI. L'iniziativa include un pacchetto da 50 milioni di token e servizi di consulenza per la migrazione delle API, con l'obiettivo di abbassare le barriere d'ingresso per le aziende che desiderano sfruttare le capacità di SenseNova.

Miglioramenti nelle prestazioni e nuove applicazioni

SenseTime ha presentato SenseChat Lite-5.5, che vanta una riduzione del 40% nel tempo di inferenza rispetto al predecessore, ora di soli 0,19 secondi. La velocità di inferenza è aumentata del 15%, raggiungendo 90,2 parole al secondo.

Tra le nuove applicazioni introdotte c'è Vimi, un generatore di video con avatar IA controllabile. Questo strumento può creare brevi clip video con un preciso controllo su espressioni facciali e movimenti della parte superiore del corpo a partire da una singola foto.

L'azienda ha anche aggiornato la sua serie SenseTime Raccoon di strumenti di produttività basati sull'IA:

Code Raccoon ora offre una velocità di risposta cinque volte superiore e una precisione di codifica migliorata del 10%
Office Raccoon è stato ampliato per includere una pagina web rivolta ai consumatori e una versione mini-app per WeChat

Impatto su vari settori

La tecnologia di modelli di grandi dimensioni di SenseTime sta già avendo un impatto significativo in diversi settori:

Finanza: migliora l'efficienza in conformità, marketing e ricerca sugli investimenti
Agricoltura: aiuta a ridurre l'uso di materiali del 20% aumentando al contempo le rese del 15%
Turismo culturale: aumenta notevolmente l'efficienza nella pianificazione dei viaggi e nelle prenotazioni

Con oltre 3.000 clienti governativi e aziendali che già utilizzano SenseNova in settori come tecnologia, sanità, finanza e programmazione, SenseTime sta consolidando la sua posizione come attore chiave nel campo dell'IA.

Questi sviluppi dimostrano il rapido progresso delle aziende tecnologiche cinesi nel campo dell'intelligenza artificiale, sfidando sempre più da vicino i concorrenti occidentali in termini di capacità e innovazione.