Abstract
Il giudice federale Vince Chhabria ha stabilito che l’uso di libri protetti da copyright da parte di Meta per addestrare i suoi modelli linguistici rientra nel fair use, almeno nel caso esaminato. L’ordinanza del 25 giugno 2025 respinge le accuse di tredici autori statunitensi, evidenziando che, sebbene l’addestramento sia commercialmente orientato, l’uso è trasformativo e non ha generato danni economici dimostrabili. Tuttavia, il giudice sottolinea che la decisione non legittima in generale l’uso non autorizzato di opere protette: è una vittoria tecnica, legata alla debolezza delle prove fornite dai ricorrenti. Una sentenza che, pur salvando Meta (per ora), lascia aperto il dibattito su diritto d’autore e intelligenza artificiale.
Meta scarica, addestra e vince
Nel giugno 2025, il giudice federale Vince Chhabria ha stabilito che Meta non ha violato il copyright quando ha usato libri di autori noti, scaricati da shadow libraries, per addestrare i suoi modelli di intelligenza artificiale. Il caso è stato promosso da tredici autori statunitensi che accusavano l’azienda di aver copiato le loro opere senza permesso per costruire LLaMA, la famiglia di modelli linguistici sviluppata da Meta.
Tutto comincia nel 2022, quando Meta tenta — senza successo — di negoziare licenze legittime con editori e detentori dei diritti. Di fronte alle difficoltà, e dopo un’escalation che coinvolge direttamente anche Mark Zuckerberg, l’azienda cambia approccio: scarica direttamente milioni di libri da archivi pirata come Library Genesis (LibGen) e, successivamente, Anna’s Archive, che aggrega diverse shadow libraries tra cui anche Z-Library. Inizialmente Meta valuta se i contenuti abbiano valore per il training, ma già nella primavera del 2023 decide di usarli come base dati per addestrare LLaMA, abbandonando del tutto i tentativi di licenza.
A promuovere l’azione legale sono tredici autori: Richard Kadrey, Sarah Silverman, Christopher Golden, Christopher Moore, Andrew Sean Greer, Lauren Groff, Mary Bly, Jonathan Lethem, Rachel Louise Snyder, Roxane Gay, Ayelet Waldman, Junot Díaz e David Henry Hwang. Il loro obiettivo, idealmente, è rappresentare tutti gli autori le cui opere sono state utilizzate per addestrare LLaMA.
I ricorrenti chiedono un risarcimento e la condanna dell’uso non autorizzato delle loro opere. Meta, dal canto suo, non nega di averle scaricate e utilizzate, ma rivendica l’intera operazione come fair use: un uso trasformativo, funzionale allo sviluppo tecnologico. Ma qual è il ruolo delle c.d. shadow libraries?
Il ruolo delle “shadow libraries”
Per reperire testi su larga scala, Meta ha attinto alle shadow libraries: archivi digitali non ufficiali che distribuiscono gratuitamente opere, spesso coperte da copyright. Le più note sono LibGen, Anna’s Archive e Z-Library. Come ha precisato il giudice Chhabria, “una shadow library è un archivio online che offre libri, articoli accademici, musica o film per il download gratuito, indipendentemente dal fatto che quel materiale sia protetto da copyright.”
Falliti i negoziati con gli editori, nella primavera del 2023 Meta ha deciso di utilizzare direttamente quei contenuti per addestrare i propri modelli linguistici.
Questa scelta non è stata improvvisata: documenti interni mostrano che l’uso di libri digitali era considerato strategico per migliorare la memoria e la coerenza linguistica dei modelli. I testi scaricati sono stati inclusi nei dataset di training, insieme a contenuti pubblici e semi-strutturati. Meta ha impiegato il protocollo BitTorrent per velocizzare i download, consapevole del rischio di leeching e seeding, ossia la possibile rimessa in circolazione automatica dei dati.
I querelanti hanno parlato di “pirateria deliberata”, ma il giudice non ha condiviso questa etichetta. Anzi, ha chiarito che l’uso di fonti non autorizzate non è di per sé sufficiente a escludere il fair use. In sostanza, ciò che conta non è da dove provengano i dati, ma come vengono utilizzati: il fulcro dell’analisi resta se l’uso, nel suo complesso, sia lecito secondo i criteri del diritto statunitense.
I four factors nel caso Kadrey et al. v. Meta Platforms, Inc.
Il giudice Vince Chhabria, nella sua ordinanza del 25 giugno 2025 (Kadrey et al. v. Meta Platforms, Inc., Case No. 3:23-cv-03417-VC, U.S. District Court, Northern District of California), applica il test del fair use previsto dalla Sezione 107 del Copyright Act (17 U.S. Code § 107), che impone di valutare quattro criteri:
- lo scopo e il carattere dell’uso,
- la natura dell’opera,
- la quantità e sostanzialità del materiale usato,
- l’effetto sul mercato dell’opera.
A differenza del collega Alsup nel caso Bartz v. Anthropic, Chhabria non si limita a constatare la natura trasformativa dell’uso: entra nel merito dei rischi economici e della qualità delle prove offerte dalle parti. E proprio lì, qualcosa si spezza.
Sul primo fattore, lo scopo e la natura dell’uso, la corte riconosce che Meta ha usato i libri con finalità nuove: non per essere letti, ma per addestrare un sistema capace di rispondere a comandi, generare testi, scrivere codice, tradurre, riformulare. Il fine è quindi trasformativo. È vero che Meta è un’azienda a scopo di lucro, ma questo — sottolinea il giudice — non è sufficiente per escludere il fair use se l’uso apporta un beneficio informativo, tecnico o creativo. Anche il fatto che i libri siano stati scaricati da shadow libraries non si rivela determinante: ciò che conta, ribadisce, è come vengono usati quei contenuti, non solo da dove provengono.
Il secondo fattore gioca a favore degli autori: le opere coinvolte sono romanzi, memorie, saggi, testi originali e creativi. Chhabria lo riconosce apertamente, ma ammette che, nella giurisprudenza americana, questo fattore raramente è decisivo se gli altri pendono dalla parte dell’uso.
Il terzo fattore, sulla quantità di materiale copiato, è controverso. Meta ha copiato le opere per intero, ma il giudice non si scandalizza. Ricorda che i modelli linguistici funzionano meglio se alimentati con testi lunghi e coerenti, e che l’uso integrale può essere giustificato se serve a migliorare la qualità del training. Come nel caso Google Books, ciò che importa non è quanto si copia, ma quanto di quel materiale diventa accessibile al pubblico. E qui — dicono le prove — LLaMA non restituisce in output segmenti significativi delle opere originali.
Il quarto fattore, l’effetto sul mercato, è il più delicato. La legge americana lo considera “the single most important factor”. Ed è proprio su questo terreno che il destino del caso si decide. Ma a sorpresa, non nel modo in cui gli autori speravano.
La colpa è degli autori?
Nel sistema giuridico statunitense, quando un’azienda come Meta invoca il fair use, è lei a dover dimostrare che l’uso è legittimo. Ma sul quarto fattore — l’effetto sul mercato — anche i querelanti hanno un compito decisivo: indicare quale mercato sarebbe stato danneggiato e con quali prove concrete. Ed è proprio qui che, secondo il giudice Chhabria, gli autori hanno fallito.
Nel corso del procedimento, i ricorrenti hanno sostenuto due ipotesi principali di danno: che LLaMA sia in grado di “rigurgitare” passaggi delle loro opere, e che l’uso non autorizzato dei testi abbia compromesso un ipotetico mercato delle licenze per il training IA. Ma su entrambi i fronti, il giudice ha riscontrato argomentazioni deboli e prive di supporto empirico.
Quanto alla prima tesi, le prove dimostrano che nessun modello Meta è stato in grado di riprodurre più di 50 parole consecutive tratte da uno qualsiasi dei testi, nemmeno in condizioni di prompting artificiale spinto. La corte conclude che questa limitata capacità non configura un rischio commerciale concreto né una forma di concorrenza illegittima. Quanto alla seconda tesi — la perdita di un presunto mercato delle licenze — il giudice è netto: non si può parlare di danno economico se il mercato in questione non esiste. Gli autori non avevano mai concesso licenze per usi di addestramento né proposto strutture per farlo. La giurisprudenza americana, ribadisce Chhabria, è chiara: il diritto d’autore non garantisce la possibilità di monetizzare ogni uso futuro immaginabile dell’opera.
Eppure, una strada più solida c’era. I querelanti avrebbero potuto tentare di dimostrare che, grazie all’uso delle loro opere, Meta ha costruito uno strumento capace di generare contenuti concorrenti, tali da saturare il mercato editoriale — anche senza copiare direttamente — e da ridurre il valore economico delle opere originali. Una tesi tutt’altro che infondata, ma che nel materiale depositato appare solo accennata: nessun dato, nessuna analisi dei mercati di riferimento, nessuna correlazione tra l’output generato e la categoria dei libri coinvolti.
E così, con una formula che suona tanto come un rimprovero quanto come una sentenza, il giudice conclude:
“Ma i ricorrenti non hanno presentato alcuna prova significativa riguardo alla diluizione del mercato. In assenza di tali prove e alla luce delle evidenze fornite da Meta, il quarto fattore può solo pendere a favore di Meta. Pertanto, sulla base di questo fascicolo, Meta ha diritto al giudizio sommario in merito alla sua difesa di fair use rispetto alla contestazione secondo cui la copia dei libri di questi ricorrenti per l’addestramento dei modelli LLM costituirebbe una violazione.” (U.S. District Court, N.D. California, Kadrey et al. v. Meta Platforms, Inc., ord. 25 giugno 2025)
Una decisione che, pur corretta sul piano formale, lascia un inevitabile senso di frustrazione. Il giudice ha richiesto una prova empirica e processuale di un cambiamento che è sotto gli occhi di tutti, ma che — per sua natura — sfugge ancora alle griglie tradizionali del diritto. Ciò che gli autori non sono riusciti a dimostrare a livello documentale, il mercato editoriale lo sta già vivendo: un’erosione silenziosa, diffusa, algoritmica (approfondisci anche l’approccio in EU: Intelligenza Artificiale: il silenzioso sfruttamento delle opere degli autori. – Canella Camaiora).
Questa appare come una sconfitta del diritto: non tanto nel merito del caso, quanto nella sua capacità di riconoscere tempestivamente le trasformazioni strutturali in atto. Con un’aggravante: la prova dei danni arrecati al settore potrebbe arrivare troppo tardi, quando ormai il cambiamento epocale si sarà compiuto e il danno sarà divenuto irreversibile — indipendentemente dalla sua dimostrabilità in giudizio.
© Canella Camaiora S.t.A. S.r.l. - Tutti i diritti riservati.
Data di pubblicazione: 4 Luglio 2025
Ultimo aggiornamento: 7 Luglio 2025
È consentita la riproduzione testuale dell’articolo, anche a fini commerciali, nei limiti del 15% della sua totalità a condizione che venga indicata chiaramente la fonte. In caso di riproduzione online, deve essere inserito un link all’articolo originale. La riproduzione o la parafrasi non autorizzata e senza indicazione della fonte sarà perseguita legalmente.

Arlo Canella
Managing & founding partner, avvocato del Foro di Milano e cassazionista, responsabile formazione e ricerca indipendente dello Studio CC®.