La Guerra de Derechos de Autor de la IA se ha Vuelto Real – Le ordenan a OpenAI revelar las pruebas eliminadas

Diciembre 02, 2025

La Guerra de Derechos de Autor de la IA se ha Vuelto Real - Le ordenan a OpenAI revelar las pruebas eliminadas

por Nino LeitnerDiciembre 02, 2025

Un juez federal le ha ordenado a OpenAI que revele las comunicaciones internas que explican por qué eliminó dos conjuntos de datos masivos de libros pirateados. Esta sentencia podría revelar si la compañía creó sus productos a sabiendas con trabajos creativos robados. Para los cineastas cuyo contenido pudo haber sido extraído sin permiso, este caso sienta un precedente legal crucial sobre las prácticas de entrenamiento de la IA.

La sentencia de noviembre de 2025 de la magistrada estadounidense Ona T. Wang exige a OpenAI que entregue los mensajes de Slack y las comunicaciones de sus abogados explicando por qué destruyó los conjuntos de datos “Libros1” y “Libros2”, que contienen más de 100.000 libros descargados de la biblioteca pirata LibGen. La decisión llega apenas unos meses después de que su competidor Anthropic resolviera demandas similares por una cifra récord de 1.500 millones de dólares, como informamos en nuestra cobertura del ajuste de cuentas por derechos de autor de Sora 2.

Si bien este caso involucra texto, el principio legal es importante para todos los creadores: los tribunales están determinando que obtener contenido protegido por derechos de autor de fuentes piratas constituye una “infracción inherente e irremediable”, independientemente del uso posterior. El mismo marco se aplica a películas, cinematografía y efectos visuales extraídos de sitios de torrents o plataformas piratas.

Sam Altman, en su intervención en TED. Crédito de la imagen: Steve Jurvetson, licencia CC BY 2.0

Lo que el tribunal obliga a OpenAI a revelar

El fallo del juez Wang se centra en los conjuntos de datos que un empleado de OpenAI descargó de Library Genesis en 2018 y que posteriormente eliminó en 2022, un año antes de que se presentaran demandas. Estos son los únicos conjuntos de datos de entrenamiento que OpenAI ha eliminado.

La empresa ahora debe presentar comunicaciones de los canales de Slack denominados “project-clear” y “excise-libgen” donde los empleados debatieron sobre la eliminación. OpenAI inicialmente alegó que los conjuntos de datos se eliminaron “debido a la falta de uso”, pero luego intentó retractarse de esa declaración y hacer valer el privilegio abogado-cliente. El tribunal rechazó este enfoque, al considerar que OpenAI renunció a su privilegio al presentar alegaciones incoherentes.

Si las comunicaciones revelan que la empresa sabía que estaba utilizando material pirateado, la indemnización por daños y perjuicios aumenta de $30.000 a $150.000 dólares por obra. Con cientos de miles de obras potencialmente involucradas, la exposición financiera alcanza miles de millones.

El canal de Slack “libre de proyectos”. Crédito de la ilustración: CineD

Por qué los cineastas deberían prestar atención

El acuerdo con Anthropic valida la teoría legal que ahora se dirige contra OpenAI. En septiembre de 2025, Anthropic pagó 1.500 millones de dólares después de que un juez dictaminara que la descarga de 7 millones de libros pirateados convertía todo uso posterior en una infracción. El abogado principal lo calificó como “la mayor recuperación de derechos de autor informada públicamente de la historia”.

Los estudios de Hollywood han presentado sus propias demandas. Como ya informamos cuando Disney y NBCUniversal demandaron a Midjourney, las principales compañías de entretenimiento califican a los generadores de imágenes de IA como “un pozo sin fondo de plagio”. En noviembre de 2025, Disney y Warner Bros. Discovery demandaron conjuntamente a la empresa china de inteligencia artificial MiniMax por su herramienta de vídeo Hailuo AI.

Para los directores de fotografía, la pregunta no es solo si la IA puede reproducir sus tomas específicas; Se trata de si la empresa de IA adquirió legalmente el material del que aprendió. Los tribunales responden cada vez más negativamente.

El panorama legal se está orientando hacia los creadores

Varios avances favorecen a los creadores de contenido. Un tribunal alemán emitió la primera sentencia europea contra OpenAI en noviembre de 2025 por reproducir letras de canciones. La Oficina de Derechos de Autor de Estados Unidos determinó que los argumentos que sostienen que el entrenamiento de IA es “inherentemente transformador” son erróneos. Por otro lado, el caso Andersen contra Stability AI que se celebrará a juicio en septiembre de 2026, podría establecer que los modelos de IA que contienen datos de entrenamiento sin licencia son en sí mismos obras infractoras.

Esto es importante para la elección práctica de herramientas. Algunas empresas están respondiendo licenciando su contenido correctamente. Como señalamos en nuestra cobertura del modelo Marey de Moonvalley, la IA “comercialmente segura” entrenada con material con licencia está surgiendo como una alternativa a las herramientas legalmente cuestionables. El nuevo curso en video sobre IA ética de Drew Geraci en MZed aborda estas preocupaciones.

OpenAI ha apelado la decisión sobre el descubrimiento de pruebas y ha solicitado suspender su aplicación. El litigio consolidado tiene como fecha límite febrero de 2026, y no se espera una decisión final sobre el uso legítimo hasta el verano boreal de 2026.

El caso OpenAI ayudará a determinar si los cineastas tienen un recurso real cuando su trabajo se utiliza para entrenar IA sin permiso. Como comenté en mi presentación en la BILD Expo sobre flujos de trabajo de IA, la IA generativa se ha entrenado con conjuntos de datos masivos de obras protegidas por derechos de autor, y ninguno de nosotros dio su permiso.

¿Has descubierto tu cinematografía en conjuntos de datos o resultados de entrenamiento de IA? ¡Cuéntanos tu experiencia en los comentarios!