Agencias, Ciudad de México.- OpenAI ha anunciado Data Partnerships, un programa destinado a empresas y organizaciones que busquen producir conjuntos de datos tanto públicos como privados para entrenar conjuntamente con la firma tecnológica modelos de Inteligencia Artificial (IA).
La compañía ha reconocido que la IA moderna aprende habilidades y aspectos al darle sentido a los datos con los que se entrena, de modo que busca que estos modelos “comprendan en profundidad todos los temas, industrias, culturas e idiomas”, para lo cual, se necesita un conjunto de datos de capacitación “lo más amplio posible”.
Solo de esa manera y con la colaboración con otros socios -ya trabaja, por ejemplo, con el Gobierno de Islandia y la asociación Free Law Project-, las organizaciones podrán beneficiarse de modelos que les resulten de mayor utilidad, ya que incluirán contenido que les resulte de interés.
Announcing OpenAI Data Partnerships — help steer the future of AI by collaborating on public and private datasets with us. https://t.co/4tbi5SZ6sS
— OpenAI (@OpenAI) November 9, 2023
Data Partnerships es un programa que OpenAI pone a disposición de las empresas para entrenar conjuntamente modelos de aprendizaje automático, ya sea con datos públicos o privados. De ahí que la iniciativa tenga por objetivo trabajar con cualquier modalidad de entrada, ya sea texto, imágenes, audio o vídeo, de los que busca “datos que expresen la intención humana” en cualquier idioma, tema o formato, según un comunicado.
“No buscamos conjuntos de datos con información sensible o personal, o información que pertenezca a un tercero”, ha matizado en este escrito, donde ha indicado que trabajará conjuntamente con las empresas interesadas para estos procesos, a fin de eliminar este tipo de datos.
La compañía ha explicado que esta iniciativa está abierta a dos formatos de asociación. Por un lado, con archivo de código abierto, para el que busca socios que le ayuden a crear un conjunto de datos de código abierto y públicos para entrenar modelos de lenguaje.
Por otra parte, las compañías pueden formar parte de este programa de OpenAI con conjuntos de datos privados para entrenar modelos de IA patentados, incluidos los básicos y los personalizados.
En este sentido, OpenAI ha reconocido que esta es la opción más adecuada para las organizaciones que deseen mantener sus datos privados pero que necesitaran que sus modelos de IA pudieran comprender mejor su dominio.
Looking to tailor #AI models to your industry? @OpenAI has launched OpenAI Data Partnerships, and are seeking "large-scale datasets that reflect human society and that are not already easily accessible online to the public today."https://t.co/qXwljYNL62
— itsabout.ai (@itsaboutai) November 20, 2023