OpenAI está generando tensión entre varias industrias y una de las más críticas hacia cómo entrenan a sus herramientas es la de las noticias, la cual ganó un importante aliado en Estados Unidos. Se trata del Centro de Periodismo de Investigación (CIR, por sus siglas en inglés), que demandó tanto a la startup como a Microsoft por presunta infracción de derechos de autor. De acuerdo con la demanda que se presentó ante el Distrito Sur de Nueva York, OpenAI “copió, utilizó, resumió y mostró el valioso contenido del CIR sin su permiso, autorización y ninguna compensación para el Centro”. Esta demanda es importante, porque apoya a una serie de medios de comunicación que decidieron ir en contra de la manera en que se está entrenando la tecnología, como el New York Daily News, el Chicago Tribune y el New York Times.
Y es que desde noviembre de 2022, mes en que se lanzó ChatGPT, el sistema se ha basado en información publicada en la web para generar sus respuestas hacia los usuarios. Cuando se trata de preguntas sobre la actualidad, el sistema se suele basar en fragmentos de noticias. Sin embargo, desde el CIR señalan que “cuando llenaron sus cursos de formación con obras periodísticas, los demandados tenían una opción: respetar dichas obras o no y eligieron esto último. Monika Bauerlein, directora ejecutiva y vocera de la organización en este caso, señaló que OpenAI y Microsoft han absorbido sus historias para “hacer su producto más poderoso, pero nunca pidieron permiso ni ofrecieron compensación, a diferencia de otras organizaciones licencian nuestro material”. También señaló que el chatbot está programado para no reconocer ni respetar los derechos de autor y que los daños legales son de al menos 750 dólares por obra infringida y 2,500 dólares por la violación a la Ley de Derechos de Autor. La empresa respondió a este caso diciendo que sigue trabajando en colaboración con la industria de las noticias, por medio de asociaciones con medios para mostrar su contenido en sus productos, incluidos resúmenes, citas y atribuciones con la finalidad de dirigir a los usuarios a los artículos originales. “Un componente de las asociaciones es la capacidad de aprovechar el contenido de los editores mediante diversas técnicas de aprendizaje automático y capacitación para ayudarnos a optimizar la visualización de ese contenido y hacerlo más útil para los usuarios”, dijo la empresa. Muestra de esto es la reciente alianza que la empresa anunció con la revista Time, a través de la cual podrá acceder durante “varios años” a artículos actuales y de archivo de más de 100 años de historia del medio. Hasta ahora, OpenAI ha firmado diferentes contratos con empresas de medios, como el New York Post, The Wall Street Journal, Vox Media, el Financial Times o Associated Press, además de plataformas de discusión, como Reddit, para entrenar sus modelos de IA y hacerlos tanto más precisos en la información que dan como naturales en el lenguaje que usan.
]]>