Luis de la Fuente Valentín y Joaquín Manuel González Cabrera
Esperanza (nombre ficticio) se encuentra en la consulta de la psicóloga para tener su primera sesión. No se trata de la habitual sala de espera con una mesa baja de cristal en el centro y algunas revistas de moda desperdigadas. En esta hay portátiles para los pacientes que, haciendo honor a su condición, esperan su turno con paciencia. Mientras tanto escriben un breve relato sobre su relación con amigos, familia o compañeros de trabajo.
Instantes después de terminar de escribir el suyo, Esperanza es llamada a consulta. La psicóloga le atiende sujetando un informe detallado de su caso.
“¡Cómo puede ser, si es la primera vez que vengo y todavía no he abierto la boca!”, piensa Esperanza, sorprendida.
El informe ha sido generado con técnicas de procesamiento de lenguaje natural. Han analizado los patrones lingüísticos contenidos en el relato recién escrito y elaborado un diagnóstico que servirá como punto de partida a la psicóloga.
Patrones lingüísticos
Lo anterior es una descripción imaginaria de algo que podría ser una realidad en un futuro no excesivamente lejano. ¿Podría la inteligencia artificial interpretar nuestros comportamientos hasta tal punto?
Antes de responder estas preguntas, atendamos la siguiente: ¿Existen patrones lingüísticos que muestren correlación con los trastornos mentales o con problemas del comportamiento?
Como prefacio, quizás debamos recordar una noticia reciente: el descubrimiento de una obra de Lope de Vega gracias a la inteligencia artificial. En la investigación que llevó a cabo tal hallazgo, se entrenó un sistema de aprendizaje automático para reconocer los usos léxicos de hasta 350 dramaturgos, y resultó que la obra titulada La francesa Laura muestra un léxico que se alinea estrechamente con el estilo propio del “fénix de los ingenios”.
Además del valor literario del hallazgo, la investigación nos pone sobre la pista de un concepto realmente interesante: existen patrones lingüísticos que se pueden asociar a personas concretas, y que pueden detectarse automáticamente.
Sintomatología y lenguaje
Sobre esto, el lector puede formularse nuevas preguntas: ¿Existen patrones que puedan asociarse a rasgos de la personalidad?, ¿y patrones que puedan asociarse a trastornos de ansiedad generalizada?, ¿se puede detectar la ansiedad a través de algún tipo de patrón lingüístico?
Actualmente hay evidencias de una relación estadísticamente significativa entre la sintomatología asociada a la ansiedad y el lenguaje utilizado. Un ejemplo claro es el predominio de pronombres de primera persona y de palabras negativas en diversas patologías mentales o psicológicas. Los autores del estudio que enlazamos parten de textos en inglés de menos de 500 palabras extraídos de foros de internet sobre salud mental, y consiguen encontrar una diferencia significativa en el uso de tales pronombres.
La clasificación automática permite, con un conjunto de muestras debidamente etiquetadas, entrenar a una red neuronal para que reconozca los patrones que hacen que un texto reciba una u otra etiqueta. Esta técnica de clasificación de patrones, basada en la técnica de aprendizaje profundo (un modelo de arquitectura conocido como transformers, la misma arquitectura que utiliza el famoso ChatGPT), tiene una capacidad predictiva muy alta.
Como contrapartida, también es elevada la falta de explicabilidad de esta técnica. Dada una predicción, el sistema no ofrece información de por qué tomó dicha decisión. Huelga decir lo importante de la explicación que debe acompañar a un diagnóstico sobre salud mental.
Tipos de palabras y emoción
Por otra parte, si en lugar de clasificar patrones lo que hacemos es entrenar en la extracción de características tiene un valor predictivo menor, pero una mejor explicabilidad.
Dado un texto, se pueden cuantificar elementos como la complejidad de las oraciones formuladas o de las palabras utilizadas, la frecuencia de uso de determinados tipos de palabras (pronombres, adverbios, adjetivos), el estilo narrativo (voz pasiva o activa) o incluso se puede analizar la emoción primaria que predomina en el texto analizado, o el campo semántico al que pertenece.
Uso en investigación y detección
Son muchos los retos por abordar en este campo. El primero de ellos pasa por una detección más precisa de los diferentes trastornos. Es decir, ahora mismo existe la posibilidad de detectar si un paciente padece un trastorno relacionado con la salud mental, pero actualmente no es posible distinguir de cuál desorden estaríamos hablando.
Todavía no sabemos si esta detección precisa es posible o no. En cualquier caso, la investigación pasará por cumplir otro de los retos pendientes: la recopilación de corpus de datos completos y confiables.
Gran parte de los trabajos existentes en la actualidad utilizan textos extraídos de diferentes fuentes de internet, ya sean redes sociales, foros especializados o servicios más específicos. No siempre está claro quién es el autor de cada texto y, como tal, es difícil (mejor dicho, imposible) conocer la realidad mental de dicha persona.
Sin una fuente de datos confiable (y las redes sociales no lo son), siempre se podrá poner en entredicho la validez de los datos y de los resultados. Debemos trabajar, por tanto, en métodos de captura de datos sólidos y confiables, alineados con las necesidades de investigación de cada caso.
El reto de la explicabilidad
Aunque existen aproximaciones más o menos útiles, las técnicas actuales de clasificación automática no aportan una relación de motivos por los cuáles se ha asignado tal o cual etiqueta a cada caso. Sin una buena colección de argumentos, es difícil que cualquier facultativo vaya a sentirse cómodo con un diagnóstico tan delicado.
Es por tanto de carácter imperativo abordar este reto de la explicabilidad, dotando a las herramientas de inteligencia artificial de la capacidad de aportar explicaciones a las decisiones tomadas.
Es posible que, conjugando técnicas de clasificación y extracción de características podamos resolver estos retos y, quien sabe, quizá el relato imaginario de la sala de espera se vuelva una realidad en los próximos años.
Luis de la Fuente Valentín, profesor del Máster Universitario en Análisis y Visualización de Datos Masivos, UNIR – Universidad Internacional de La Rioja y Joaquín Manuel González Cabrera, docente e investigador principal del Grupo Ciberpsicología, UNIR – Universidad Internacional de La Rioja
Publicado originalmente en The Conversation. Lea el original.