I + D    Robótica

La inteligencia artificial ya puede identificar un objeto sin haberlo visto antes

Investigadores de CSAIL del MIT desarrollan este sistema de visión artificial que acercará la robótica al humano

03 OCT. 2018
4 minutos

La visión computacional es la habilidad de las máquinas para 'ver' objetos o imágenes y así comprender algo sobre ellos. Ha llegado hasta el punto de que un iPhone puede desbloquearse sólo con mirarlo. Pero, eso sí, para saber qué está mirando antes ha tenido que ver antes esa información. Ya no. Investigadores del CSAIL del MIT han desarrollado un sistema de visión artificial que permite identificar objetos sin haberlos visto antes. Un gran paso que acerca la robótica al humano. 

Las personas, con la ayuda de nuestros ojos, podemos movernos por nuestro entorno con más o menos destreza y habilidad, unas cualidades que los robots están poco a poco aprendiendo, pero aún con dificultades. Una prueba de estos avances son los cobots (robots colaborativos) y los que trabajan en las líneas de ensamblaje de las factorías.

Así, el trabajo de los investigadores del Laboratorio de Ciencias de la Computación e Inteligencia Artificial (CSAIL, por sus siglas en inglés) del MIT permite a los robots inspeccionar objetos aleatorios y poder llegar comprenderlos lo suficiente para lograr que ejecuten tareas sin haberlas visto nunca antes.

Este sistema, llamado Dense Object Nets (DON), considera los objetos como una colección de puntos que funciona como una especie de mapa de ruta visual. Este enfoque permite a los robots comprender y manipular mejor los elementos del entorno e, incluso, recoger un objeto específico entre otros muchos de similares características. ¿Te imaginas lo que esto puede hacer con los robots que trabajan en grandes almacenes de logística como, por ejemplo, los de Amazon?

“Con los algoritmos que existen en la actualidad, por ejemplo, no podríamos pedirle a un robot que coja una taza por el asa, ya que este objeto, la taza, podría estar en diferentes posiciones (tumbada, de lado…)”, explica el estudiante de doctorado Lucas Manuelli, que ha trabajado junto Pete Florence (también estudiante de doctorado) y el profesor del MIT Russ Tedrake.

Otro de los avances de este trabajo de investigación es lograr que este sistema DON se “autosupervise”, es decir que no necesita de ninguna anotación humana. Para ello, el equipo  ha entrenado al sistema para ver los objetos como una serie de puntos que conforman una serie de coordenadas más grande. A continuación, DON puede asignar diferentes puntos juntos para visualizar la forma 3D de un objeto.

Esta ejecución del mapa de coordenadas funciona de forma similar a como “se cosen” las fotos panorámicas a partir de múltiples fotos consecutivas. Después de este entrenamiento, si una persona especifica un punto concreto en un objeto, el robot puede tomar una foto de ese objeto e identificar y combinar puntos para poder recoger el objeto en ese punto específico.

Los investigadores siguen trabajando para mejorar DON, para lograr que ejecute tareas específicas con una comprensión más profunda de los objetos, como aprender a agarrar un objeto y moverlo con el objetivo final de limpiar un escritorio.