La IA generativa como aliada para preservar y difundir las lenguas indígenas
Un informe elaborado por LLYC en colaboración con BID Lab, el brazo de innovación y venture capital del Grupo Banco Interamericano de Desarrollo, y Microsoft, analiza a fondo el desempeño de la inteligencia artificial generativa en siete lenguas indígenas y revela importantes oportunidades en términos de calidad, comprensión y representación cultural.
El estudio plantea 21 estrategias para avanzar hacia una IA inclusiva, con acciones centradas en tres frentes: incremento de datos disponibles en lenguas originarias, desarrollo de tecnologías habilitadoras y fortalecimiento de su presencia en el entorno digital.
En Colombia, 70 lenguas, incluyendo el castellano, 65 son lenguas indígenas, 2 criollas (palenquero de San Basilio y la de las islas de San Andrés y Providencia – creole), la romaní o romaníes del pueblo Room – Gitano y la lengua de señas colombiana. Sin embargo, el 40 % de estas lenguas están en peligro de extinción, lo cual pone en riesgo la pérdida de conocimientos, culturas y formas de ver el mundo.
Bogotá julio de 2025. La inteligencia artificial (IA) generativa representa una gran oportunidad para reducir el aislamiento digital de las comunidades indígenas y dar mayor visibilidad a sus pueblos y culturas. Es una de las principales conclusiones que recoge el informe “El desempeño de la inteligencia artificial en el uso de lenguas indígenas americanas”, elaborado por LLYC, la firma global de Marketing y Corporate Affairs, en colaboración con BID Lab, el brazo de innovación y venture capital del Grupo Banco Interamericano de Desarrollo, y Microsoft. La publicación visibiliza la situación actual y propone una serie de recomendaciones prácticas orientadas a fomentar una inteligencia artificial más inclusiva y culturalmente representativa.
Para incrementar la integración de lenguas indígenas en el ecosistema digital, el documento propone 21 estrategias centradas tanto en incrementar los datos disponibles en estas lenguas como en el desarrollo de tecnologías habilitadoras. Fomentar en colaboración con las comunidades indicadas la conversación digital en lenguas indígenas, dar visibilidad a sus influencers, proteger plataformas y archivos digitales de tradiciones, y desarrollar tecnologías de traducción y voz son algunas de las más destacadas. De esa manera, tales estrategias ayudarían a entrenar los modelos de IA de una manera que mejoren su performance en estas lenguas.
La IA puede ser una poderosa herramienta para preservar, compartir y revitalizar tradiciones culturales e idiomáticas, así como para reducir brechas derivadas del analfabetismo o el monolingüismo en zonas aisladas. Sin embargo, para que las comunidades indígenas puedan beneficiarse plenamente de las posibilidades de desarrollo y empleo que ofrece la IA, es fundamental mejorar la eficacia en la interacción en sus lenguas originarias. De no ser así, existe el riesgo de que se amplíen las brechas digitales y sociales.
Actualmente, los modelos más conocidos de IA generativa muestran un desempeño desigual al interactuar en lenguas indígenas. En el 54% de los casos, las preguntas formuladas en estos idiomas reciben respuestas aparentemente correctas, mismas que pueden ser hasta cuatro veces más breves que las generadas en español ante preguntas equivalentes y con una calidad inferior en expresión (2,4 sobre 10) y comprensión (2,3 sobre 10). Además, el informe también detecta un elevado sesgo cultural en los sistemas de inteligencia artificial, que tienden a ofrecer respuestas desviadas hacia referentes occidentales, incluso cuando se formulan preguntas en lenguas indígenas.
A través del informe, se destaca la importancia de la colaboración entre programas gubernamentales, iniciativas de grandes empresas tecnológicas (Big Tech), ONGs y marcas de consumo para impulsar mejoras en el rendimiento de la IA en lenguas indígenas. Asimismo, se confirma una alta correlación (91%) entre el volumen de contenido digital disponible en una lengua y la calidad de la IA en la misma.
“Para que la inteligencia artificial sea verdaderamente inclusiva a nivel global, debe comprender y adaptarse a los distintos contextos lingüísticos y culturales. Este estudio representa un punto de partida fundamental para avanzar en la representación de las lenguas indígenas en las tecnologías del futuro”, agrega Adolfo Corujo, Partner & Marketing Solutions CEO de LLYC.
Por su parte, Daniel Korn, director de Políticas e Innovación en IA para Microsoft Américas, asegura: “Nuestros clientes a nivel mundial exigen relevancia lingüística y cultural en los productos y servicios basados en IA que ofrecemos. En Microsoft, nuestro objetivo es poner a las personas primero. Nos comprometemos a abordar, en colaboración con gobiernos, académicos, sociedad civil y organizaciones multilaterales, como el BID, las brechas indicadas para lograr dicha meta”.
“Desde BID Lab, a través del programa fAIr LAC, promovemos el desarrollo de soluciones de inteligencia artificial que respondan a los contextos reales de América Latina y el Caribe. Este estudio nos permite identificar brechas y oportunidades para avanzar hacia tecnologías más accesibles y relevantes para nuestras comunidades”, concluye César Buenadicha, Jefe a.i de la División de Ecosystem Building y Acceleration de BID Lab.
Este tipo de alianzas resulta fundamental para países como Colombia, donde, según datos de la ONIC, el 40 % de las lenguas presentes están en peligro de extinción, poniendo en riesgo la preservación de valiosos conocimientos ancestrales, culturas singulares y diversas cosmovisiones. La inteligencia artificial generativa emerge como una herramienta clave para promover, proteger y revitalizar estos saberes y tradiciones, asegurando su continuidad tanto en el entorno digital como en el tejido social del país. En Colombia se hablan 70 lenguas: el castellano y 69 lenguas maternas, de las cuales 65 son indígenas, 2 criollas (el palenquero de San Basilio y el creole de las islas de San Andrés y Providencia), la lengua romaní del pueblo Room – Gitano y la lengua de señas colombiana.
Accede a la publicación completa en este enlace.