OpenAI usará los datos de Reddit para entrenar su IA

Hace unos días, OpenAI mostró una tecnología capaz de interactuar con los usuarios en tiempo real en conversaciones. Ahora, esa herramienta podría ir más lejos, gracias a un acuerdo que la empresa alcanzó con la plataforma de discusión, Reddit, a partir del cual usará sus datos para entrenar sus grandes modelos de lenguaje. De acuerdo con un comunicado, tras este acuerdo, Reddit le dará acceso a OpenAI a “contenido único, estructurado y en tiempo real” de Reddit, lo que permitirá que sus productos de IA “comprendan mejor” ese contenido. Reddit, al ser un foro en donde las personas discuten de manera natural temas, permitirá que la tecnología de OpenAI, como ChatGPT cada vez se haga más capaz en el procesamiento de lenguaje natural y, por lo tanto, tener conversaciones más apegadas a la realidad.

¿Cuánto vale el acuerdo entre OpenAI y Reddit?

Durante la reunión con sus inversionistas en marzo pasado, el CEO de Reddit, Steve Huffman, señaló que la paradoja del momento en torno al boom de la IA es que si bien hay más contenido escrito por máquinas, el contenido proveniente de personas reales es más valioso “y tenemos casi dos décadas de conversación auténtica”. Esta postura deja entrever el valor que la empresa le adjudica a la información que generan sus usuarios y cómo esta puede influir en el desarrollo de las últimas herramientas de Inteligencia Artificial generativa. “Reddit se ha convertido en uno de los archivos abiertos más grandes de conversaciones humanas auténticas, relevantes y actualizadas de internet. Incluirlo en ChatGPT mantiene nuestra creencia de una red conectada, que ayuda a las personas a encontrar lo que buscan y a encontrar una comunidad”, comentó Huffman sobre el acuerdo. Ninguna de las empresas reveló los términos financieros del acuerdo y tampoco dieron detalles sobre cuáles serán los datos que se utilizarán para el entrenamiento de los modelos de IA. Sin embargo, otras alianzas han demostrado el alto valor de los datos de Reddit. En los datos que presentó para su Oferta Pública Inicial, la plataforma reveló que tiene contratos con empresas para licenciar sus datos, incluido Google, el cual tiene un valor superior a los 200 millones de dólares. Y es que cuenta con más de 1,000 millones de publicaciones y más de 16,000 millones de comentarios, los cuales son bastante atractivos para las empresas de IA generativa que quieren hacer experiencias mucho más cercanas a la experiencia humana. Si bien las acciones de la compañía subieron un 11% luego de que se diera a conocer el acuerdo con OpenAI, la plataforma ha sido criticada por los usuarios, quienes no aprueban que se utilicen sus conversaciones, pero también por el hecho de que Sam Altman, CEO de OpenAI, tiene una participación del 8.7% en Reddit. Esta cifra lo convierte en el tercer accionista más grande de la empresa e incluso sigue siendo miembro de la junta directiva. No obstante, las dos partes comunicaron que la asociación fue aprobada por “la junta directiva independiente”.

]]>

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *