Accordo Microsoft-editore: dati AI senza consenso

Accordo Microsoft-editore: dati AI senza consenso

> Accordo Microsoft-Informa: accesso a contenuti avanzati e dati, possibile uso di IA su libri e riviste accademiche di Taylor & Francis. Esplorazione di nuove applicazioni.

Una notizia ha scosso il mondo accademico negli ultimi giorni: Informa, una multinazionale britannica proprietaria della casa editrice Taylor & Francis, ha stretto un accordo con Microsoft per fornire accesso ai contenuti di apprendimento avanzato e ai dati, oltre a esplorare applicazioni di intelligenza artificiale. Tuttavia, sembra che gli autori dei contenuti non siano stati informati né consultati riguardo a questo accordo.

L'annuncio è stato fatto da Informa in un aggiornamento commerciale a maggio, in cui si parlava di una partnership per "esplorare applicazioni di IA esperte". Dato che Taylor & Francis pubblica una vasta gamma di libri e riviste accademiche e tecniche, è probabile che i dati in questione includano proprio questi contenuti.

Secondo quanto riportato la scorsa settimana, gli autori non solo non sono stati informati dell'accordo, ma non hanno avuto nemmeno l'opportunità di rifiutare la partecipazione. Inoltre, sembra che non riceveranno alcun compenso economico da questa operazione.

I dettagli dell'accordo Informa-Microsoft

L'aggiornamento di Informa ha evidenziato quattro aree chiave dell'accordo con Microsoft:

  • Aumentare la produttività interna di Informa
  • Sviluppare uno strumento automatizzato per le citazioni
  • Creare un software di assistenza alla ricerca basato sull'IA
  • Fornire a Microsoft l'accesso ai dati per "migliorare la rilevanza e le prestazioni dei sistemi di IA"

Per l'accesso iniziale ai dati, Informa riceverà oltre 8 milioni di sterline (circa 15,5 milioni di dollari australiani), seguiti da pagamenti ricorrenti di importo non specificato per i successivi tre anni.

Anche se non si conosce esattamente come Microsoft intenda utilizzare questi dati, è probabile che i contenuti di libri e articoli accademici verranno aggiunti ai dati di addestramento di modelli di IA generativa simili a ChatGPT.

Gli accademici sono solo l'ultimo gruppo di "creatori di contenuti" a risentirsi per l'utilizzo del proprio lavoro da parte dei modelli di IA generativa.

Le implicazioni per gli autori accademici

Questa situazione solleva importanti questioni sul diritto d'autore e sulla proprietà intellettuale nel contesto dell'intelligenza artificiale. La maggior parte degli accademici non riceve compensi diretti per la pubblicazione di articoli su riviste scientifiche, considerata parte integrante del loro lavoro di ricerca.

Tuttavia, quando un articolo viene accettato per la pubblicazione, gli autori firmano solitamente un accordo che può includere la cessione dei diritti d'autore all'editore. Questo potrebbe permettere all'editore di sub-licenziare il contenuto a terze parti, come le aziende di IA, senza ulteriore consenso dell'autore.

La necessità di maggiore consapevolezza

Questa vicenda sottolinea l'importanza per gli autori accademici di essere pienamente consapevoli dei termini contrattuali degli accordi di pubblicazione che firmano. In particolare, alla luce della tendenza degli editori a stringere accordi con aziende di IA generativa, è fondamentale esaminare attentamente le politiche degli editori in materia di IA.

Negli Stati Uniti è stata recentemente introdotta una soluzione di licenza collettiva standard per l'uso di contenuti nei sistemi IA interni, che stabilisce diritti e remunerazioni per i titolari del copyright. È probabile che licenze simili per l'uso di contenuti per sistemi di IA entreranno presto nel mercato australiano e di altri paesi.

Questioni etiche più ampie

Gli accordi tra editori accademici e aziende di IA hanno sollevato preoccupazioni più ampie tra molti accademici. Ci si chiede se sia eticamente accettabile ridurre la ricerca accademica a semplice contenuto per il data mining dell'IA. Non ci sono risposte chiare sulle implicazioni etiche e morali di tali pratiche.

Questa situazione solleva importanti interrogativi sul futuro della pubblicazione accademica e sul ruolo dell'IA nella ricerca scientifica. È evidente che sarà necessario un ampio dibattito per trovare un equilibrio tra l'innovazione tecnologica e la tutela dei diritti e del lavoro degli autori accademici.


La collaborazione tra Informa e Microsoft nel campo dell'intelligenza artificiale si inserisce in un contesto più ampio di evoluzione tecnologica che sta rivoluzionando il mondo editoriale e accademico. Le origini di questa trasformazione risalgono agli albori dell'era digitale, quando le prime pubblicazioni scientifiche online iniziarono a diffondersi negli anni '90.

Già nel 1991, il fisico Paul Ginsparg fondò arXiv, un archivio online per preprint di articoli scientifici, segnando l'inizio di una nuova era per la diffusione della conoscenza accademica. Da allora, il panorama dell'editoria scientifica ha subito profondi cambiamenti, con l'avvento dell'open access e la crescente digitalizzazione dei contenuti.

Un aspetto curioso di questa evoluzione riguarda il modo in cui gli editori accademici si sono adattati alle nuove tecnologie. Ad esempio, Elsevier, uno dei più grandi editori scientifici al mondo, ha progressivamente trasformato il suo modello di business, passando dalla semplice pubblicazione di riviste alla fornitura di servizi di analisi dei dati e strumenti di ricerca basati sull'intelligenza artificiale.

La conoscenza è di due tipi: o conosciamo un soggetto noi stessi, o sappiamo dove possiamo trovare informazioni su di esso.

Questa citazione di Samuel Johnson, scrittore e critico letterario del XVIII secolo, assume oggi un nuovo significato alla luce delle potenzialità offerte dall'IA nel campo della ricerca accademica.

Un altro aspetto interessante riguarda l'impatto dell'IA sulla peer review, il processo di revisione degli articoli scientifici da parte di esperti del settore. Alcune riviste stanno sperimentando l'uso di algoritmi di IA per effettuare una prima scrematura degli articoli sottomessi, sollevando interrogativi sulla qualità e l'obiettività di questo approccio.

È importante notare che l'utilizzo dell'IA nell'editoria accademica non è un fenomeno isolato, ma si inserisce in un trend più ampio di digitalizzazione della conoscenza. Progetti come Google Books, avviato nel 2004, hanno già digitalizzato milioni di libri, inclusi molti testi accademici, rendendo disponibile una vasta mole di dati per l'addestramento di modelli di IA.

Un aspetto poco noto di questa trasformazione riguarda l'impatto sulla conservazione del sapere a lungo termine. Mentre i libri cartacei possono durare secoli, i formati digitali e le piattaforme tecnologiche evolvono rapidamente, ponendo sfide significative per l'archiviazione e l'accesso futuro ai contenuti accademici.

In conclusione, l'accordo tra Informa e Microsoft rappresenta solo l'ultimo capitolo di una lunga storia di innovazione tecnologica nel mondo accademico. Mentre offre opportunità senza precedenti per l'avanzamento della ricerca e la diffusione della conoscenza, solleva anche importanti questioni etiche e pratiche che la comunità scientifica dovrà affrontare nei prossimi anni.

Logo AiBay