
Un juez federal le ha ordenado a OpenAI que revele las comunicaciones internas que explican por qué eliminó dos conjuntos de datos masivos de libros pirateados. Esta sentencia podría revelar si la compañía creó sus productos a sabiendas con trabajos creativos robados. Para los cineastas cuyo contenido pudo haber sido extraído sin permiso, este caso sienta un precedente legal crucial sobre las prácticas de entrenamiento de la IA.
La sentencia de noviembre de 2025 de la magistrada estadounidense Ona T. Wang exige a OpenAI que entregue los mensajes de Slack y las comunicaciones de sus abogados explicando por qué destruyó los conjuntos de datos “Libros1” y “Libros2”, que contienen más de 100.000 libros descargados de la biblioteca pirata LibGen. La decisión llega apenas unos meses después de que su competidor Anthropic resolviera demandas similares por una cifra récord de 1.500 millones de dólares, como informamos en nuestra cobertura del ajuste de cuentas por derechos de autor de Sora 2.
Si bien este caso involucra texto, el principio legal es importante para todos los creadores: los tribunales están determinando que obtener contenido protegido por derechos de autor de fuentes piratas constituye una “infracción inherente e irremediable”, independientemente del uso posterior. El mismo marco se aplica a películas, cinematografía y efectos visuales extraídos de sitios de torrents o plataformas piratas.

Lo que el tribunal obliga a OpenAI a revelar
El fallo del juez Wang se centra en los conjuntos de datos que un empleado de OpenAI descargó de Library Genesis en 2018 y que posteriormente eliminó en 2022, un año antes de que se presentaran demandas. Estos son los únicos conjuntos de datos de entrenamiento que OpenAI ha eliminado.
La empresa ahora debe presentar comunicaciones de los canales de Slack denominados “project-clear” y “excise-libgen” donde los empleados debatieron sobre la eliminación. OpenAI inicialmente alegó que los conjuntos de datos se eliminaron “debido a la falta de uso”, pero luego intentó retractarse de esa declaración y hacer valer el privilegio abogado-cliente. El tribunal rechazó este enfoque, al considerar que OpenAI renunció a su privilegio al presentar alegaciones incoherentes.
Si las comunicaciones revelan que la empresa sabía que estaba utilizando material pirateado, la indemnización por daños y perjuicios aumenta de $30.000 a $150.000 dólares por obra. Con cientos de miles de obras potencialmente involucradas, la exposición financiera alcanza miles de millones.

Por qué los cineastas deberían prestar atención
El acuerdo con Anthropic valida la teoría legal que ahora se dirige contra OpenAI. En septiembre de 2025, Anthropic pagó 1.500 millones de dólares después de que un juez dictaminara que la descarga de 7 millones de libros pirateados convertía todo uso posterior en una infracción. El abogado principal lo calificó como “la mayor recuperación de derechos de autor informada públicamente de la historia”.
Los estudios de Hollywood han presentado sus propias demandas. Como ya informamos cuando Disney y NBCUniversal demandaron a Midjourney, las principales compañías de entretenimiento califican a los generadores de imágenes de IA como “un pozo sin fondo de plagio”. En noviembre de 2025, Disney y Warner Bros. Discovery demandaron conjuntamente a la empresa china de inteligencia artificial MiniMax por su herramienta de vídeo Hailuo AI.
Para los directores de fotografía, la pregunta no es solo si la IA puede reproducir sus tomas específicas; Se trata de si la empresa de IA adquirió legalmente el material del que aprendió. Los tribunales responden cada vez más negativamente.
El panorama legal se está orientando hacia los creadores
Varios avances favorecen a los creadores de contenido. Un tribunal alemán emitió la primera sentencia europea contra OpenAI en noviembre de 2025 por reproducir letras de canciones. La Oficina de Derechos de Autor de Estados Unidos determinó que los argumentos que sostienen que el entrenamiento de IA es “inherentemente transformador” son erróneos. Por otro lado, el caso Andersen contra Stability AI que se celebrará a juicio en septiembre de 2026, podría establecer que los modelos de IA que contienen datos de entrenamiento sin licencia son en sí mismos obras infractoras.
Esto es importante para la elección práctica de herramientas. Algunas empresas están respondiendo licenciando su contenido correctamente. Como señalamos en nuestra cobertura del modelo Marey de Moonvalley, la IA “comercialmente segura” entrenada con material con licencia está surgiendo como una alternativa a las herramientas legalmente cuestionables. El nuevo curso en video sobre IA ética de Drew Geraci en MZed aborda estas preocupaciones.
OpenAI ha apelado la decisión sobre el descubrimiento de pruebas y ha solicitado suspender su aplicación. El litigio consolidado tiene como fecha límite febrero de 2026, y no se espera una decisión final sobre el uso legítimo hasta el verano boreal de 2026.
El caso OpenAI ayudará a determinar si los cineastas tienen un recurso real cuando su trabajo se utiliza para entrenar IA sin permiso. Como comenté en mi presentación en la BILD Expo sobre flujos de trabajo de IA, la IA generativa se ha entrenado con conjuntos de datos masivos de obras protegidas por derechos de autor, y ninguno de nosotros dio su permiso.
¿Has descubierto tu cinematografía en conjuntos de datos o resultados de entrenamiento de IA? ¡Cuéntanos tu experiencia en los comentarios!





































