Sistemas de diálogo multimodal basados en inteligencia artificial capaces de reconocer emociones
por Luis Bravo*,Ciro Rodríguez*,Pedro Hidalgo y César Angulo Facultad de Ingeniería de Sistemas e Informática, Universidad Nacional Mayor de San Marcos (UNMSM), Lima 15081, Perú
Introducción
En el contexto actual, el uso de tecnologías en aplicaciones para sistemas de diálogo con computadoras, como los asistentes virtuales basados en inteligencia artificial (IA), continúa creciendo rápidamente [ 1 ]. Además, se espera que esta interacción incorpore el reconocimiento de emociones en sistemas de diálogo multimodal [ 2 ], aumentando así el nivel de satisfacción del usuario [ 3 ].
El problema abordado en este trabajo es la identificación de cómo la inteligencia artificial puede contribuir a los sistemas de diálogo multimodal con reconocimiento de emociones entre el usuario y el ordenador [ 4 , 5 , 6 , 7 ].
La importancia de este artículo radica en determinar la relación entre la inteligencia artificial y el diálogo multimodal afectivo. Además, identificará lagunas en la investigación existente y propondrá posibles soluciones para futuras investigaciones.
Este estudio de investigación contribuirá a mantener un diálogo más humanizado y lograr la satisfacción del usuario a través de múltiples entradas físicas y fisiológicas, logrando integrar datos subjetivos en el diálogo entre usuarios y asistentes virtuales [ 8 , 9 ].
Este estudio de revisión sistemática tiene como objetivo explorar y analizar posibles aplicaciones basadas en IA para sistemas de diálogo multimodal [ 10 ] que incorporan reconocimiento de emociones [ 11 , 12 , 13 ].
Diversos estudios y enfoques han abordado cuestiones relacionadas con los sistemas de diálogo multimodal y el reconocimiento de emociones de forma aislada. La entrada de datos físicos de estos sistemas es muy variada y generalmente incluye sonido, visión y texto [ 14 , 15 ]. Para la entrada de datos fisiológicos, los investigadores han considerado las señales electroencefalográficas [ 16 , 17 , 18 ] y de tomografía electrónica [ 19 , 20 , 21 ] como las más representativas.
Los modelos que se han utilizado en las diferentes investigaciones se han basado generalmente en redes neuronales convolucionales (CNNs) [ 22 , 23 ] y sus variantes [ 24 , 25 ]. Además, se han utilizado Long Short-Term Memory (LSTM) [ 2 , 26 , 27 ], GRU [ 28 , 29 , 30 ], y BERT [ 31 , 32 , 33 ].
Las limitaciones encontradas en la investigación existente se deben al uso de fuentes de datos o conjuntos de datos limitados en el proceso de entrenamiento de los modelos [ 26 , 34 , 35 , 36 , 37 ] y la integración de modelos de diálogo con reconocimiento de emociones [ 38 , 39 , 40 ].
Este estudio de revisión sistemática identificará los desafíos y oportunidades asociados con la inteligencia artificial y proporcionará una hoja de ruta para la investigación y el desarrollo futuros.
Este estudio se centrará en analizar diversas aplicaciones y modelos basados en inteligencia artificial para un sistema de diálogo multimodal con reconocimiento de emociones, identificando las arquitecturas propuestas y limitaciones [ 41 , 42 , 43 ].
Esta investigación es novedosa debido a la limitada información sobre el tema de estudio. Gran parte de la investigación se ha centrado en el reconocimiento de emociones, el análisis de sentimientos y el diálogo con asistentes virtuales, pero los sistemas de diálogo afectivo multimodal basados en inteligencia artificial aún se encuentran en sus etapas iniciales [ 14 , 44 , 45 ]. Además, esta revisión sistemática contribuirá al análisis de los modelos propuestos por investigadores en estudios previos [ 13 , 46 ].
Este artículo se ha dividido en varias secciones para explicar mejor el tema de esta revisión sistemática de la literatura. La Introducción explica brevemente el problema y la importancia del tema de investigación. En Materiales y Métodos, se explica el proceso de búsqueda de información. En Resultados, se discuten las diferentes tecnologías, modelos y conjuntos de datos considerados en la búsqueda de información. La Discusión aborda la interpretación de los resultados.
Para leer el articulo completo lo puede encontrar en: https://www.mdpi.com/2414-4088/9/3/28
Estimado amigo lector, de haber gustado este artículo, me encantaría recibir tus comentarios, y de requerir más información favor de contactarme.
Agradecimiento al Equipo UNMSM, Doctorandos Luis Bravo, Cesar Angulo, Pedro Hidalgo
Discusión del Tema: Profesor Doctor Ciro Rodriguez UNMSM