Diferentes países de Latinoamérica están colaborando en el desarrollo de Latam GPT, un modelo de inteligencia artificial (IA) propio. El anuncio se ha producido en la reciente Cumbre de Acción sobre la IA celebrada en París como un paso estratégico para fortalecer la capacidad de innovación y reforzar la competitividad de la región en este ámbito. Este modelo de lenguaje de gran tamaño (LLM, por sus siglas en inglés) se lanzará oficialmente el próximo mes de junio con el objetivo de reflejar con precisión la historia y cultura de Latinoamérica.
Respaldo de España y Estados Unidos
El proyecto, impulsado por el Centro Nacional de Inteligencia Artificial (Cenia) de Chile, cuenta con el apoyo de más de 30 instituciones americanas y en su desarrollo trabajan más de 60 especialistas en inteligencia artificial. En esta iniciativa, que cuenta con el respaldo de instituciones de España y Estados Unidos, participan Chile, México, Argentina, Colombia, Ecuador, Perú y Uruguay.
Latam GPT se comenzó a crear en 2023
El trabajo conjunto de universidades, bibliotecas, organizaciones de la sociedad civil y otras instituciones, que comenzó a desarrollarse en febrero de 2023, ha servido para disponer «de más de 8 terabytes (TB) de información en texto plano, que equivale a millones de libros» y «es comparable» a la actividad del modelo de OpenAI ChatGPT 3.5, informa Cenia. Así, de momento, Latam GPT está en disposición de procesar 50 billones de parámetros, lo que significa que dispone de funciones de raciocinio, de realizar traducciones más reales o de hacer asociaciones.
Posicionando Latinoamérica
Este modelo de IA no se ha concebido para competir con las grandes tecnológicas. Su finalidad es posicionar a Latinoamérica en el contexto de los avances de la IA y contar con un sistema compatible con los dialectos, historia y cultura de la región. Se trata de evitar, como ha manifestado Álvaro Soto, director de Cenia, los problemas que tienen los actuales LLM debido al «conocimiento limitado que tienen sobre la región». Por su parte, Aisén Etcheverry, máxima responsable del Ministerio de Ciencia, Tecnología, Conocimiento e Innovación (CTCI) de Chile, organismo que coordina el apoyo regional, ha declarado: «Cuando hablamos de IA, ésta tiene que proyectar el mundo que somos, su diversidad. Y, en el caso de Latinoamérica, no solo hablar español o portugués, sino entender nuestra idiosincrasia».
Modelo abierto con licencias
Latam GPT se ha concebido como un modelo abierto, por lo que, en su momento, su código fuente estará disponible de forma pública «a través de licencias que van a permitir su uso, modificación y distribución sin excesivas restricciones», recoge la Agencia de Noticias Científicas de la UNQ. Del mismo modo, según esta agencia, cuando se lance el proyecto, «se entregará un conjunto de datos entrenado para crear aplicaciones adaptadas a las necesidades de cada país».
Inversión millonaria
Cenia ha invertido unos 550.000 dólares en el proyecto, la mitad de ellos aportados por la Corporación Andina de Fomento. Asimismo, la universidad chilena de Tarapacá (UTA) tiene previsto invertir 10 millones de dólares en dos fases destinados a crear el Centro de Supercomputación, del que ya ha ejecutado la mitad del presupuesto y ha servido para acelerar el proceso de entrenamiento del modelo.
Entrenamiento cooperativo
En este momento, Latam GPT continúa su fase de entrenamiento y desde su página web, en el apartado Recursos, invita al público en general a participar en el proceso. Para hacerlo, hay que solicitar una clave de acceso por correo electrónico, indicando el país de procedencia o al que se quiere representar. Una vez aceptados, se puede contribuir al entrenamiento del sistema enviando textos en español sobre cuestiones relativas a Latinoamérica que reflejen los diferentes modos lingüísticos de cada país. «No es necesario que todas las preguntas sean formales o con ortografía perfecta. Ambos tipos de escritura se valoran y se emplean para optimizar el sistema», recoge Wired.
Fuentes: Cenia, Agencia de Noticias Científicas UNQ, Latam GPT (web), Wired