TIC    Robótica

Investigadores vascos logran que un robot humanoide haga gestos espontáneos al hablar

Es capaz de aprender a generar en tiempo real nuevos movimientos más naturales que los automatizados

11 ABR. 2019
5 minutos
Igor Rodriguez, autor principal del trabajo, junto a un robot humanoide. / INNOVADORES

Que el robot se comporte de la manera más parecida posible a una persona, con el fin de mejorar la intereacción entre ellos. El habla juega un papel fundamental en ello, así como los gestos espontáneos que se realizan al hablar, ya que refuerzan el significado de las palabras y reflejan sentimientos mediante gesticulaciones no orales. Para ello el grupo de investigación RSAIT de la UPV/EHU han conseguido que estos “tengan una expresión corporal más natural al hablar“, según han publicado en un artículo.

Estos investigadores han utilizado para generar estos movimientos nuevos redes Generative Adversarial Networks (GAN), con el fin de que “el robot aprenda“ y así han verificado, mediante análisis estadísticos, que es capaz de “realizar movimientos más naturales y espontáneos que con otros sistemas“. 

“Hasta ahora, cuando hacíamos hablar al robot, este reproducía aleatoriamente movimientos que se habían grabado previamente; tenía una espontaneidad muy limitada, por lo que decidimos crear movimientos nuevos, es decir, que el robot aprendiera de datos o movimientos que poseíamos, y fuera capaz de crear movimientos nuevos al hablar”, ha explicado Igor Rodriguez, investigador  del grupo de investigación de Robótica y Sistemas Autónomos de la Facultad de Informática de la UPV/EHU.

Se han utilizado redes neuronales profundas GAN para intensificar el grado de espontaneidad. Igor Rodriguez, autor principal del trabajo, subraya que este tipo de redes “se utilizan especialmente con imágenes, música y voz, para generar imágenes, música y voces nuevas“ y el equipo las ha empleado para producir movimientos nuevos. “Este tipo de redes GAN aprenden de datos y, después, son capaces de imitarlos, es decir, son capaces de generar cosas nuevas, muy parecidas, pero nuevas”.

Rodriguez detalla que GAN está compuesta de dos redes: “una es generativa y la otra discriminativa“. “Mientras la generativa intenta generar cosas, la discriminativa, dado que cuenta con el conocimiento proporcionado por datos reales, es capaz de discernir si lo que se ha generado es real o no“. Estas redes van evolucionando y, finalmente, la red generativa aprende a producir movimientos nuevos: “Hemos integrado el modelo de esta red generativa en la arquitectura de nuestro robot, para que al hablar genere nuevos movimientos en tiempo real”.

El equipo de investigación ha comparado el sistema de generación de movimientos desarrollado con otras aproximaciones generativas, para medir cuantitativamente su idoneidad. En dicha comparativa, han analizado la naturalidad de los movimientos realizados por el robot, mediante diferentes parámetros estadísticos: vibración de los movimientos, longitud, etc. Los resultados han puesto de manifiesto que los movimientos generados con las redes GAN son “más naturales, no vibran mucho, y el robot realiza movimientos armónicos, sin grandes alteraciones”, añade el investigador. Así, han publicado algunos vídeos en los que se muestra la naturalidad del comportamiento del robot.

Rodriguez ha puntualizado que este sistema puede ser empleado en otro tipo de robots: “En el caso de tener que utilizar este sistema en otro tipo de robot, tendríamos que recabar datos de sus movimientos y volver a entrenar la red”. En esta investigación han trabajado en torno al habla del robot, pero "este sistema también puede utilizarse para que el robot aprenda otro tipo de movimientos”. En opinión del investigador, se trata de un pequeño avance en el campo de la robótica social.