C:\AIBAY\MENU> _
[X]
┌──────────────┐ └──────────────┘

Sesame: l'assistente vocale che ti farà impazzire

Sesame: l'assistente vocale che ti farà impazzire

> Dalla mente che ha guidato Oculus VR: una nuova visione tech si svela.

La rivoluzione dell'intelligenza artificiale vocale sembra finalmente aver trovato una voce capace di superare quella sensazione di artificiosità che caratterizza la maggior parte degli assistenti digitali. Mentre Alexa di Amazon continua a ricevere ordini di "stare zitta" e Gemini fatica a mantenere conversazioni fluide, una nuova startup guidata da Brendan Iribe, co-fondatore di Oculus VR, ha presentato "Maya", un'interfaccia vocale che per la prima volta riesce a creare un'esperienza conversazionale quasi naturale, eliminando quei ritardi e incomprensioni che rendono frustrante l'interazione con la maggior parte degli assistenti virtuali.

Quando parlare con l'IA diventa finalmente naturale

Chi utilizza regolarmente assistenti vocali conosce bene i limiti attuali: tempi di risposta lenti, incapacità di gestire interruzioni e una rigidità comunicativa che spinge molti utenti a preferire l'interazione testuale. Maya sembra però aver trovato una soluzione a questi problemi, offrendo un'esperienza che si avvicina notevolmente a quella di una conversazione umana. Le pause naturali, la capacità di adattarsi rapidamente ai cambiamenti di direzione nel discorso e la fluidità con cui integra nuovi elementi nella conversazione rappresentano un salto qualitativo significativo rispetto alle tecnologie precedenti.

Durante i test, l'assistente ha dimostrato di saper gestire richieste complesse e improvvise modifiche di scenario, come l'inserimento di sé stessa in un'avventura fantasy che stava narrando, trasformandosi senza esitazione in un ingegnere gnomo di nome Maya intento a progettare trappole per difendere un castello da invasori Orchi. Nonostante qualche occasionale risposta tipica da chatbot, l'esperienza complessiva risulta sorprendentemente coinvolgente.

Sesame: un nuovo capitolo nella storia della realtà aumentata

Dietro a Maya c'è Sesame, azienda che esce oggi dal suo periodo di sviluppo riservato con un finanziamento non divulgato da parte di importanti società di venture capital come Andreessen Horowitz, Spark Capital e Matrix Partners, tutti investitori che avevano già creduto nel progetto Oculus VR. A guidare l'azienda troviamo un team di esperti di tecnologie immersive: oltre a Iribe, ex CEO di Oculus, figurano Ankit Kumar, ex CTO e co-fondatore di Ubiquity6, e Ryan Brown, ex direttore dell'ingegneria di ricerca presso Meta Reality Labs.

L'IA conversazionale sembra finalmente pronta a uscire dagli schermi e accompagnarci nella vita quotidiana.

Ma l'ambizione di Sesame va oltre la semplice interfaccia vocale. L'azienda ha infatti annunciato lo sviluppo di occhiali AI progettati per essere indossati tutto il giorno, capaci di offrire audio di alta qualità e accesso immediato a un assistente in grado di osservare e interpretare il mondo insieme all'utente. Per ora sono state condivise solo alcune immagini di quelli che sembrano prototipi iniziali, ma la visione è chiara: portare l'assistente virtuale fuori dagli smartphone e integrarlo nella nostra percezione quotidiana della realtà.

Un modello aperto verso il futuro del linguaggio

La tecnologia alla base di Maya non resterà un giardino chiuso. Sesame ha pubblicato un documento tecnico che descrive il proprio modello e il dataset utilizzato, composto da circa un milione di ore di "audio pubblicamente disponibile". L'azienda ha inoltre dichiarato l'intenzione di rilasciare i propri modelli come open source e di espandere le capacità linguistiche oltre l'inglese, con l'obiettivo di supportare più di 20 lingue "nei prossimi mesi".

Questa apertura rappresenta un approccio interessante in un settore spesso caratterizzato da tecnologie proprietarie e inaccessibili. La possibilità per sviluppatori e ricercatori di accedere e modificare i modelli di Sesame potrebbe accelerare notevolmente l'evoluzione delle interfacce vocali conversazionali.

Verso il superamento della "uncanny valley" vocale

Il termine "uncanny valley" (valle perturbante) è stato coniato per descrivere quella sensazione di disagio che proviamo di fronte a robot o rappresentazioni digitali quasi-umane ma non abbastanza realistiche. Nella comunicazione vocale con l'IA, questa sensazione si manifesta nelle pause innaturali, nelle intonazioni meccaniche e nell'incapacità di gestire le sfumature della conversazione umana.

Maya sembra aver fatto progressi significativi nel superare questo problema, creando un'esperienza che, pur non essendo indistinguibile da quella umana, risulta sufficientemente fluida e naturale da non generare quel senso di straniamento tipico delle interazioni con assistenti vocali. Come sottolinea Sesame nel suo blog, l'obiettivo è proprio "attraversare la valle perturbante della conversazione vocale" – un traguardo che, stando alle prime impressioni, sembra decisamente più vicino.

Nel panorama italiano, dove l'adozione degli assistenti vocali è in crescita ma ancora limitata rispetto al mercato anglosassone, tecnologie come Maya potrebbero rappresentare la svolta necessaria per superare le resistenze culturali verso questi strumenti, trasformandoli da semplici curiosità tecnologiche a compagni digitali veramente utili nella vita quotidiana. La vera sfida sarà vedere se questa naturalezza conversazionale potrà essere mantenuta anche quando il modello verrà adattato alla nostra lingua, con le sue particolari sfumature ed espressività.