Usare l'intelligenza artificiale per decifrare i guaiti dei cani

Usare l'intelligenza artificiale per decifrare i guaiti dei cani

> Ti è mai capitato di desiderare di comprendere cosa il tuo cane sta cercando di dirti? I ricercatori dell'Università del Michigan stanno esplorando le potenzialità dell'Intelligenza Artificiale, sviluppando strumenti in grado di identificare se il latrato di un cane esprime giocosità o aggressività.

Un nuovo strumento di intelligenza artificiale sviluppato all'Università del Michigan è in grado di distinguere l'abbaio giocoso da quello aggressivo dei cani. Inoltre, può identificare altre caratteristiche dell'animale come l'età, il sesso e la razza. Questo avanzamento è il risultato di una collaborazione con l'Instituto Nacional de Astrofisica, Optica y Electronica (INAOE) in Puebla, Messico, e i risultati sono stati presentati alla Joint International Conference on Computational Linguistics, Language Resources and Evaluation.

Il modello, originariamente allenato su discorsi umani, apre nuove possibilità per analizzare e comprendere le comunicazioni animali senza partire da zero. "Abbiamo utilizzato modelli di elaborazione della voce già formati sul linguaggio umano per iniziare a comprendere le sfumature degli abbai dei cani," ha dichiarato Rada Mihalcea, professore di informatica e ingegneria e direttore del Laboratorio di AI dell'Università del Michigan.

Una delle principali sfide nell'analizzare le vocalizzazioni animali è la mancanza di dati pubblicamente disponibili. Artem Abzaliev, studente di dottorato e autore principali dello studio, sottolinea la difficoltà nel raccogliere tali dati, che devono essere registrati passivamente in natura o con il permesso dei proprietari degli animali domestici.

Grazie a una collaborazione con Humberto Pérez-Espinosa dell'INAOE, è stato possibile raccogliere un dataset di vocalizzazioni di 74 cani di varie razze, età e sesso. Il team ha utilizzato questo dataset per modificare un modello di machine learning, noto come Wav2Vec2, originalmente allenato sui dati di discorsi umani.

I risultati sono stati sorprendenti: Wav2Vec2 ha non solo superato altre sfide di classificazione, ma ha anche mostrato performance migliori rispetto ad altri modelli specificatamente allenati sui dati di abbai dei cani, con un'accuratezza che raggiunge il 70%.

Questo è il primo caso di tecniche ottimizzate per il discorso umano applicate con successo alla decodifica della comunicazione animale. "I nostri risultati dimostrano che i suoni e i pattern derivati dal linguaggio umano possono servire come base per analizzare e comprendere i pattern acustici di altri suoni, come le vocalizzazioni animali," aggiunge Mihalcea.

L'implicazione di questo studio va oltre la comprensione delle comunicazioni animali, potenzialmente beneficiando biologi, etologi e migliorando il benessere animale. Comprendere le sfumature delle vocalizzazioni canine potrebbe migliorare in modo significativo come gli umani interpretano e rispondono ai bisogni emotivi e fisici dei cani, migliorando così la loro cura e prevenendo situazioni potenzialmente pericolose.

Per ulteriori informazioni, si può consultare lo studio di Artem Abzaliev et al, "Towards Dog Bark Decoding: Leveraging Human Speech Processing for Automated Bark Classification," pubblicato sul server di preprint arXiv. DOI: 10.48550/arxiv.2404.18739

Logo AiBay