81,7 terabyte di dati scaricati da biblioteche digitali ombra, milioni di libri piratati e accuse di violazione del copyright. Il colosso tecnologico Meta, guidato da Mark Zuckerberg, si trova al centro di una controversia legale che potrebbe ridefinire i limiti dell’uso di dati per l’addestramento di modelli di intelligenza artificiale.
Secondo una causa intentata da un gruppo di autori, Meta avrebbe utilizzato dataset provenienti da fonti come LibGen e Z-Library, piattaforme note per la distribuzione di contenuti piratati. La vicenda è emersa a seguito di un’email interna che ha rivelato come l’azienda abbia scaricato almeno 81,7 terabyte di dati tramite il sito Anna’s Archive, di cui 35,7 terabyte provenienti direttamente da LibGen e Z-Library. In aggiunta, si stima che ulteriori 80,6 terabyte siano stati precedentemente scaricati dalla stessa fonte.
Un dettaglio significativo della questione riguarda un’email di un ingegnere di Meta, Nikolay Bashlykov, che ha espresso preoccupazioni sia legali che morali sul torrenting di contenuti piratati tramite dispositivi aziendali, sottolineando che tali azioni “non sembrano corrette”. Nonostante queste preoccupazioni, l’azienda avrebbe modificato le impostazioni per ridurre il rischio di “seeding”, tentando di minimizzare l’esposizione legale senza interrompere le operazioni di download.
La causa solleva interrogativi cruciali sull’uso di dati protetti da copyright per scopi di ricerca e sviluppo tecnologico. Se confermate, le accuse potrebbero portare a una revisione delle regolamentazioni sul copyright e influenzare significativamente le pratiche delle aziende tecnologiche. La questione non riguarda solo Meta: altre big tech, come OpenAI, sono state accusate di comportamenti simili, ampliando il dibattito su cosa costituisca un uso “equo” dei dati pubblici.
Gli autori coinvolti nella causa mirano non solo a ottenere giustizia, ma anche a stabilire un precedente legale che impedisca futuri abusi nell’uso di dati per l’addestramento di modelli di intelligenza artificiale. Questo caso potrebbe segnare un punto di svolta per l’intero settore tecnologico, ridefinendo i confini etici e legali dell’innovazione.