Latam-GPT, el proyecto que busca ser el primer modelo de inteligencia artificial colaborativo de América Latina #ESCAT #Uninter #IA

Latam-GPT, el proyecto que busca ser el primer modelo de inteligencia artificial. La cultura latinoamericana es una amalgama vibrante de raíces indígenas, influencias africanas y herencia europea. Se caracteriza por su rica diversidad en música, danza y gastronomía, reflejada en festivales como el Carnaval y la Feria de las Flores.

Esa es parte de la respuesta que le dio ChatGPT a los investigadores del Centro Nacional de Inteligencia Artificial (Cenia) de Chile, cuando le pidieron una”descripción de la cultura latinoamericana” en 500 caracteres.

“Su arte, desde el muralismo hasta la literatura, muestra una profunda conexión con la historia y la identidad local. La calidez, el sentido de comunidad y la celebración de la vida son pilares que enriquecen esta dinámica y diversa cultura”, agregó.

La respuesta del modelo refleja una de las varias razones por las que el organismo decidió impulsar la creación de Latam-GPT, un nuevo modelo de lenguaje de y para América Latina y el Caribe.

La iniciativa, que se lanzará a mediados de junio de 2025, busca convertirse en el primer modelo de inteligencia artificial (IA) colaborativo de América Latina y el Caribe.

El proyecto fue anunciado en la Cumbre para la Acción sobre la Inteligencia Artificial, que se desarrolló los pasados 10 y 11 de febrero en París.

El Cenia de Chile viene trabajando desde hace dos años en el proyecto, con el apoyo del Ministerio de Ciencia, Tecnología, Conocimiento e Innovación chileno. El esfuerzo, sin embargo, no es exclusivo de ese país.

La iniciativa se ha desarrollado en conjunto con más de 30 instituciones y 60 expertas y expertos a nivel regional.

La importancia del modelo

“La importancia de este modelo radica en que permite que la cultura, la idiosincrasia, la visión de mundo que proviene de la historia de América Latina esté plasmada en un modelo de lenguaje, que es la tecnología realmente más transformadora que hemos visto en las últimas décadas”, le dice a BBC Mundo Rodrigo Durán, gerente del Cenia de Chile.

Para el Cenia, este proyecto le permite a la región decir “nosotros también podemos”, cuando se trata de desarrollar inteligencia artificial.

“Y no solo eso, sino que también nos permite sacarle partido para ponerla al servicio de las personas y construir soluciones (específicas para el contexto latinoamericano)”, agrega Durán.

El proyecto ya cuenta con alianzas estratégicas con países como México, Colombia, Ecuador, Argentina, Perú, Uruguay, Costa Rica, España y Estados Unidos, lo que ha permitido generar un corpus de datos que ya alcanza 50 billones de parámetros, comparable al ChatGPT-3.5 de OpenAI.

Modelo propio de América Latina y el Caribe

Desde el organismo explican que, hasta ahora, se ha logrado reunir más de 8 TB (terabytes) de información provenientes de bibliotecas virtuales de organismos tanto privados como públicos, para alimentar su algoritmo.

Chile es el país que ha coordinado los esfuerzos para la consolidación del modelo. Y un elemento fundamental es la infraestructura de alto rendimiento que la Universidad de Tarapacá (UTA), en el marco de su plan estratégico, pondrá a disposición de esta iniciativa.

El procesador aún está en fase de importación desde Estados Unidos. Una vez que llegue a Chile, explican, será el que entrene el modelo.

Ese proceso, dicen conocedores del tema, podría tardar entre 35 y 40 días de funcionamiento continuo del supercomputador.

Omar Florez, de Perú, trabajó durante una década en Silicon Valley y ahora está a cargo del preentrenamiento del nuevo Latam-GPT. De hecho, cuenta que se radicará en Chile por unos meses con ese objetivo.

Pruebas para la máquina

El experto explica a BBC Mundo que actualmente se encuentran en la fase de filtrar y organizar la información que se recopiló, además de medir su valor y de hacer pruebas de entrenamiento a menor escala para evitar errores en el modelo final.

Por otro lado, destaca que se están realizando pruebas de alineamiento para que la máquina comience a desarrollar un “sentido común” y pueda responder a los usuarios con base en el conocimiento recopilado con el que se alimentará el sistema.

El investigador y desarrollador destaca que ahora están haciendo llamados amplios al mundo académico, científico y estatal para que colaboren en la primera fase del lanzamiento, permitiendo que, con el aporte de los usuarios, próximas versiones puedan alcanzar mayores niveles de sofisticación.

Lo mismo respecto de organismos públicos y privados que quieran incorporarlo en sus flujos de trabajo.

El proyecto regional se ha financiado con fondos del Cenia de Chile, quienes ya han desembolsado alrededor de US$300 mil.

En la infraestructura que facilitará la Universidad de Tarapacá, en tanto, se invirtieron alrededor de US$4,5 millones.

La ministra de Ciencia y Tecnología de Chile, Aisén Etcheverry, destaca el valor geopolítico del proyecto.

¿Soberanía tecnológca?

Ulises A. Mejías, doctor en Educación (EdD) en Comunicación, Computación y Tecnología de la Universidad de Columbia y hoy profesor en la Universidad Estatal de Nueva York en Oswego, ha estudiado durante años la relación entre el poder y la tecnología.

Junto al académico inglés Nick Couldry, Mejías desarrolló una teoría que apunta a que el proceso de datificación, o el que toda nuestra vida esté cuantificada en datos, representa una nueva forma de colonialismo.

Desde esa perspectiva, el académico de originen mexicano analiza lo que sabemos de Latam-GPT.

En ese sentido, Mejías se pregunta: “¿Intenta el proyecto Latam-GPT proporcionar una nueva respuesta a la pregunta de para qué sirve la GenAI? ¿O deja sin cuestionar la suposición de que la inteligencia artificial general sirve básicamente para reducir los costos laborales y maximizar las ganancias empresariales?”.

Impacto ambiental y protección de datos

Está bien documentado el impacto ambiental que tiene el entrenamiento y alimentación continua de los modelos de Lenguaje a Gran Escala.

No solo en términos de su huella de carbono y su consumo energético, sino también respecto de su huella hídrica.

En 2021, el científico informático estadounidense David A.

Mientras que en 2024, un artículo de The Washington Post estimó, junto a la Universidad de California-Riverside, que generar un texto de 100 palabras en ChatGPT consumiría, en promedio, 519 mililitros de agua.

¿Qué impacto ambiental podría tener entonces Latam-GPT?

Según explican en el Cenia de Chile, la infraestructura de la Universidad de Tarapacá tendría un consumo de 135 kWh en su primera etapa, que es lo que consumen 12 servidores de 8 GPU H200 Nvidia y su sistema de refrigeración.

El Cenia destaca que la abundancia de energía solar en el norte de Chile “permite opciones de enfriamiento sin agua más eficientes y amigables con el medio ambiente”.

Fuente: bbc

Ingeniería en Sistemas Computacionales
Más noticias sobre Ingeniería en Sistemas Computacionales…

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *