MarIA, el sistema de Inteligencia Artificial de lengua española, ya resume y genera textos

202

Después de cinco meses de su lanzamiento, el primer sistema de Inteligencia Artificial (IA) masivo y experto en comprender y escribir en lengua española MarIA empezó a resumir y generar textos.

El proyecto se especializa en comprender y escribir en español, y actualmente ha avanzado en su desarrollo. Su nueva versión permite resumir escritos existentes y crear nuevos a partir de titulares o de palabras.

MarIA ha sido creado en el Barcelona Supercomputing Center y se ha entrenado con más de 135 mil millones de palabras del archivo web de la Biblioteca Nacional de España. Además, es impulsado por la Secretaría de Estado de Digitalización e Inteligencia Artificial (SEDIA) del país.

El proyecto está disponible en forma de código abierto para que desarrolladores, compañías, investigadores y la sociedad puedan utilizarlo. Y se enmarca en los Proyectos Estratégicos para la Recuperación y Transformación Económica (PERTE) para el desarrollo de la economía digital en español.

Por el volumen y capacidades de MarIA, la lengua española se sitúa en el tercer puesto de los idiomas que disponen de modelos masivos de acceso abierto, después del inglés y el mandarín.

“Con proyectos como MarIA, que se se incorporará al PERTE, damos pasos firmes hacia una Inteligencia Artificial que piense en español, lo que multiplicará las oportunidades económicas para las empresas y la industria tecnológica española”, señaló la Secretaria de Estado de Digitalización e Inteligencia Artificial, Carme Artigas.

MarIA se ha construido a partir del patrimonio documental digital de la Biblioteca Nacional de España, que rastrea y archiva las webs elaboradas en español, además se ha entrenado con el superordenador MareNostrum 4.

La primera versión de MarIA fue elaborada con RoBERTa, una tecnología que crea modelos de lenguaje con “codificadores”, que generan una interpretación y sirven para clasificar documentos o responder tests.

De acuerdo con el Ministerio de Asuntos Económicos y Transformación Digital, la nueva tecnología ha sido creada con GPT-2, una tecnología avanzada que crea decodificadores para generar nuevos textos.