TIC    Robótica

El brazo robótico que resuelve el cubo de Rubik con una sola mano

El secreto está en su entrenamiento con redes neuronales y en el aprendizaje por refuerzo pese a las barreras físicas

17 OCT. 2019
3 minutos

Este brazo robótico de una sola mano no es un nuevo desarrollo, la innovación llega de la mano de su software, que ha pasado por un entrenamiento con redes neuronales para realizar tareas de manipulación más complejas, como la resolución de un cubo de Rubik, manipulándolo con su única mano.

Para lograrlo han utilizado una técnica llamada Automatic Domain Randomization (ADR) que permite que las redes entrenadas solo en simulación puedan transferir ese conocimiento a un robot real, explica el equipo de investigación de OpenAI, especializado en crear sistemas para la inteligencia artificial general.

En la actualidad, tanto la percepción como la habilidad de la manipulación son los puntos débiles de los robots, en el caso del cubo de Rubik sería lograr girar sus filas al coincidir tanto la gran cantidad de variantes que adquiere el problema como la habilidad para manipularlo sin que se caiga.

Para ello, esta técnica ADR se ha combinado con herramientas de aprendizaje por refuerzo enfocadas no solo a tareas virtuales, sino también a ejercicios ‘físicos’ para adquirir una “destreza sin precedentes”.

En este punto el desafío ha sido generar los entornos de entrenamiento, para lo que se ha tenido que recopilar datos sobre la fricción, la elasticidad y el dinamismo. Todos “increíblemente complejos” de medir y modelar.

Así, primero una red neuronal ha tenido que aprender a resolver el cubo de Rubik, conforme mejora su rendimiento en esta tarea, “aumenta automáticamente la cantidad de aleatorización del dominio”. Al incrementarse la dificultad, la red neuronal aprende a generar nuevos entornos cada vez más aleatorios, mientras sigue aprendiendo y generando nuevos entornos. Es lo que llama el metaaprendizaje, o “aprender a aprender”

En los pasos sucesivos de este proceso, se pone a prueba a la mano robótica y al propio sistema, incluyendo ligeras “perturbaciones” que pueden existir en el mundo real y físico: ¿Y si le ponemos un guante de goma a la mano? ¿y si un peluche toca el cubo mientras lo está intentando resolver? ¿Y si lo tapamos? El sistema es “sorprendentemente robusto” y suele tener éxito en su resolución, aunque no con la máxima eficiencia, reconocen los investigadores.