Un reciente estudio se abre paso para desarrollar y optimizar nuevos sistemas de comunicación aumentativos y alternativos (SAACs) de alta tecnología por medio de la Inteligencia Artificial (IA). El objetivo es incluir a personas con dificultades en la comunicación mediante el habla, y quienes están a cargo del trabajo son científicos del Consejo Nacional de Investigaciones Científicas y Técnicas (Conicet).
SAACs de Alta Tecnología
Se trata de sistemas de comunicación basados en pictogramas y teclados virtuales por medio de los cuales los distintos usuarios con dificultades en el habla pueden transmitir mensajes. El proyecto fue uno de los seleccionados en la segunda edición de la convocatoria Soluciones Innovadoras para Desafíos de Software, organizada por el Ministerio de Ciencia, Tecnología e Innovación y la Fundación Sadosky en 2023.
Matías Núñez, líder del proyecto de investigación, detalló que su interés era "incorporar machine learning (aprendizaje automático) con procesamiento de lenguaje natural a la interface de comunicación desarrollada por Neufitech, con el objetivo concreto de hacerla más ágil y mejorar la calidad de vida de la gente que los usa como única forma de comunicación".
Neufitech es una empresa de la ciudad de Bahía Blanca que desarrolla SAACs y otros productos de alta tecnología vinculados a la evaluación neuropsicológica, y su interfaz de comunicación consiste en un detector de movimiento ocular y un software que toma esos movimientos y los traduce a la posición de un cursor en una pantalla.
El funcionamiento
Los usuarios eligen las diferentes palabras para escribir y, en este caso, esas palabras o conjunto de palabras están representadas por pictogramas (signos pictóricos que pueden entenderse sin texto ni explicaciones adicionales).
Por otra parte, esto es traducido a un sintetizador de voz opcional para pasar del sonido a lo escrito. El sistema basado en pictogramas se adecúa a cada persona y la idea para mejorar el enfoque inicial fue crear un predictor de pictogramas con el objetivo de acelerar este proceso.
Este proceso "lleva un tiempo de espera que hace lenta la comunicación y nuestra tarea inicial fue acelerar este proceso para mejorar la interacción del usuario con la interfaz y mejorar su comunicación", explicó Núñez. Asimismo, indicó que la idea en la segunda parte del proyecto es aplicar modelos de lenguaje de gran tamaño, large language models (LLM), combinado con modelos de imágenes.
"El ejemplo más popular de un LLM es ChatGPT una aplicación de chatbot de IA, pero en nuestro caso nos enfocamos al uso de modelos de lenguaje de código abierto", agregó.
Asimismo, comentó que los usuarios del sistema "podrían ampliar su interacción, expresividad y lo que pueden hacer con la computadora, no sólo como predictor de pictogramas sino también como herramienta de creatividad".
"Para una persona inmovilizada que solo puede comunicarse a través del movimiento de sus ojos, estas nuevas funcionalidades podrían ser un gran cambio de calidad de vida", sentenció. Así, en esta segunda etapa se agregan nuevas funcionalidades al sistema para potenciar las capacidades de expresión de las personas.
"La articulación del sistema científico tecnológico con diversos actores de la sociedad permite potenciar proyectos de innovación y desarrollo, promoviendo y brindando respuesta a las problemáticas sociales puntuales", precisó el Conicet en un comunicado.
Y agregó que este desarrollo es "uno de los ejemplos que muestra la transferencia en el marco de proyectos asociativos del sector público al privado".
Fuente: Télam.