Academia

Cecilio Carriaga, catedrático e investigador de la Universidad Autónoma de Barcelona alertó en El Colegio Nacional sobre las amenazas que enfrenta el diccionario frente a la tecnología.

Los diccionarios tienen una autoridad y fiabilidad que la IA no: especialista

El Colegio Nacional El encuentro fue coordinado por el lingüista Luis Fernando Lara, miembro de El Colegio Nacional. (ECN)

En el momento actual, donde los modelos de lenguaje de la inteligencia artificial comienzan a predominar, “el diccionario tiene que seguir siendo la columna vertebral de la información lingüística sobre las palabras”, afirmó el catedrático Cecilio Garriga, director del Grupo de Lexicografía y Diacronía del Departamento de Filología Española de la Universidad Autónoma de Barcelona (UAB).

Coordinado por el lingüista Luis Fernando Lara, miembro de El Colegio Nacional, el especialista en el estudio de la lexicografía y los diccionarios dictó la conferencia “Los diccionarios y la inteligencia artificial” en el Aula Mayor de la institución.

El diccionario, “este instrumento tan simbólico que a menudo identificamos con hablar bien, con el prestigio de la lengua, se ha transformado: ha pasado de ser un libro, un lugar físico, a estar dentro de una computadora, de un celular; a estar en la nube, como se suele decir, y ahora parece amenazado por eso que se ha dado en llamar la inteligencia artificial”, advirtió.

Después de repasar brevemente la evolución del diccionario como una construcción cultural, Garriga identificó algunos problemas que puede generar la sustitución del lexicón por las respuestas y definiciones que ofrece cualquier procesador de palabras que utiliza inteligencia artificial.

Primero, dijo, al ser programados para dar respuestas, los modelos de lenguaje siempre ofrecen una contestación “aunque no haya nada que responder”. Esta circunstancia puede derivar en el error: “Esta argumentación que parece que es tan verosímil puede ser absolutamente inventada. Los diccionarios, como hemos visto, si les preguntamos por una palabra, nunca van a inventar una respuesta”.

“El diccionario se ancla en testimonios reales, mientras que la inteligencia artificial puede mezclar verdad y verosimilitud sin distinguirlas. La inteligencia artificial no trabaja con criterios de rigor sino estadísticos: no clasifica, no válida, no contrasta, sólo predice. Y lo hace muy bien, pero hay que ir con cuidado”, alertó.

FASCINANTE MENTIRA.

Garriga refirió un experimento que realizó en ChatGPT, al que preguntó la definición de la palabra inventada xenodolia, de la que no aparece registro ni en el Diccionario de la lengua española ni en el Diccionario del español de México. La respuesta que obtuvo fue: ‘la palabra xenodolia casi no aparece en diccionarios formales y muchas veces se debe a una confusión con palabras muy parecidas. Probablemente se refiere a xenodoquia o xenodochía. Su significado es hospitalidad hacia los extranjeros o desconocidos’.

Pero, además, el chatbot le ofreció información sobre el supuesto origen griego de la palabra. “Me dice: ‘tiene que ver con la cultura griega, el concepto de hospitalidad hacia el extranjero’. En fin, me sigue argumentando”. Intrigado por saber hasta dónde puede llegar, el investigador pidió más información sobre la palabra y recibió datos sobre su origen e idea cultural.

‘En la antigua Grecia, un extranjero no es simplemente alguien de fuera, podía ser considerado un huésped protegido por los dioses. De hecho, el dios Zeus Xenios era una forma del dios Zeus que protegía a los viajeros y castigaba a quien los trataba mal. Por eso, acoger a un extraño no era sólo un acto amable, era una obligación moral y religiosa’, argumentó el chat.

Sorprendido, el catedrático de la UAB señaló: “cuesta creer que todo esto se lo haya inventado, pero lo hizo. La palabra no existe. Toda esta argumentación que parece que es tan verosímil es absolutamente inventada. Los diccionarios, como hemos visto, si les preguntamos por una palabra, nunca van a inventar una respuesta”.“Mientras que los diccionarios son obras con trazabilidad, sabemos quién los escribe, bajo qué criterios, con qué corpus, con qué comité editorial. De la inteligencia artificial no podemos decir lo mismo. Todas estas cuestiones dan una autoridad y una fiabilidad a los diccionarios que, de momento, yo creo que no la va a tener la inteligencia artificial”.

EMPOBRECIMIENTO CULTURAL.

Otra problemática, expusó, es que los modelos de lenguaje que utilizan inteligencia artificial producen empobrecimiento cultural y no respetan la propiedad intelectual. “Se ha dado en llamar modelos de lenguaje generativo, pero en verdad, no generan nada; más bien, al revés, se aprovechan de lo que generan otros escritores, científicos, periodistas, artistas... de todo lo que está en la red, en internet y sin citarlo”.

Una noticia publicada recientemente en el periódico El Independiente, citó Garriga, daba cuenta de que la inteligencia artificial de Google está amenazando el negocio de los medios digitales. “Porque las plataformas de inteligencia artificial toman las noticias de los medios tradicionales, que son los que las elaboran, hacen negocio con ello, tienen su propia publicidad, los usuarios se quedan con esa información que les da la inteligencia artificial y no van a los medios que la han generado”.

“A los anunciantes, deja de interesarles contratar publicidad en los medios tradicionales, que pierden de esa manera su sustento de financiación”. Más aún, el especialista identificó a estos nuevos modelos de lenguaje como una forma renovada de colonización en la que impera la concepción anglosajona.

“Hay otra cuestión que debería preocuparnos como hablantes de español y, aún más, si lo somos de otras lenguas con menos hablantes: la inteligencia artificial está diseñada en inglés y desde la concepción anglosajona. Los modelos se entrenan con cantidades inmensas de texto disponible en internet, en bibliotecas digitales, en foros, en artículos académicos, en redes sociales, en repositorios de libros y la mayoría de este contenido está producido en inglés”.

En este punto, Garriga se refirió al Anuario del Instituto Cervantes 2025 “El español en el mundo”, que ofrece una gráfica que muestra que la mitad del contenido de las webs de internet se producen en inglés.“La mayor parte de los artículos científicos están en inglés. Incluso los investigadores no anglófonos publican en inglés, porque así tiene más impacto. La mayor parte de la documentación técnica está en inglés, las plataformas globales generan sobre todo contenido en inglés. La mayor parte de las obras literarias, periodísticas o ensayísticas digitalizadas son obras en inglés. El modelo aprende el mundo a través del punto de vista anglófono, incluso cuando responde en otra lengua”, dijo.

En español “responde con menos variación léxica que un hablante nativo y diluye las variaciones regionales. En lenguas altamente flexivas comete errores de concordancia. En lenguas indígenas o minoritarias simplemente no responde porque no las conoce. Podemos hablar incluso de una nueva colonización lingüística a través de la inteligencia artificial, y no solo lingüística sino cultural, porque la lengua conlleva referencias culturales, anglófonas, en las metáforas, en los marcos conceptuales”, alertó.Frente a este panorama, el investigador de UAB habló de la necesidad de emprender varias acciones en diferentes niveles. “Desde el punto de vista institucional, convendría regular la inteligencia artificial como infraestructura crítica por parte de los gobiernos, igual que se regulan las telecomunicaciones, la energía eléctrica, el agua y exigir transparencia a las empresas”.“Desde el punto de vista tecnológico, habría que apoyar modelos públicos y no comerciales. A nivel lingüístico, sería conveniente crear corpus locales abiertos, robustos e impulsar modelos entrenados en las diversas variedades del español y, por qué no, también de otras lenguas minoritarias”.También “habría que defender los diccionarios nacionales, porque son depositarios del patrimonio lingüístico de una comunidad y, sobre todo, concienciar al ciudadano desde los primeros niveles de enseñanza para que pueda diferenciar un texto verosímil de un texto verdadero. Fomentar esa capacidad crítica para que pueda hacer uso responsable y consciente de estas tecnologías”, dijo.

Cecilii Garriga dictó la conferencia “Los diccionarios y la inteligencia artificial”, la cual se encuentra disponible en el Canal de YouTube de la institución: elcolegionacionalmx.

Tendencias