Entrevistas    AMAZON

Vogels (CTO de Amazon): “Los asistentes de voz deben tener emoción”

Aunque duda si personalidad. El CTO de Amazon, Werner Vogels, habla con INNOVADORES sobre el futuro de la inteligencia artificial. No ve 'hype'. Todo es cuestión de ciencia. Y de conversación

20 MAY. 2018
15 minutos
El CTO de Amazon, Werner Vogels, tras su charla en AWS Summit Madrid. / Vicent Bosch

Es el director de tecnología de una de las compañías más innovadoras del mundo (su posición varía entre los cinco primeros puestos según el ranking que se mire). A primera hora de la mañana aterrizaba en Madrid su vuelo desde Estocolmo y a las 10 horas ya caminaba sobre el escenario, hablando de la nube, de machine learning y de analítica de datos con la misma ilusión que un niño que estrena zapatos. Werner Vogels saca un hueco entre conferencias, reuniones y talleres para atender a INNOVADORES y contagiarnos de su optimismo por el futuro, en especial, por la inteligencia artificial. «No es ciencia ficción, es una cuestión de informática». Les presentamos al CTO de Amazon.

La primera pregunta era obligatoria. En unas semanas donde la inteligencia artificial se ha convertido en protagonista absoluta de la tecnología, ¿no estaremos corriendo el riesgo de caer en el hype? "Tenemos decenas de miles de compañías que ya están trabajando con machine learning [aprendizaje automático] en AWS", contesta Vogels, quien precisamente ha hecho una parada en España para participar en el AWS Summit Madrid.

"Los datos, y su análisis, se están convirtiendo en el core del negocio de cualquier compañía"

El directivo asume un rol más didáctico y explica que la analítica de datos se puede llevar a cabo desde tres enfoques. Uno, el más tradicional, consiste en mirar atrás para elaborar informes del pasado. El segundo es en tiempo real y responde a la pregunta de qué está pasando ahora mismo. "Y luego está mirar al futuro", dice. "El problema es que no somos buenos en eso". "Lo mejor que podemos hacer es tomar los datos del pasado para intentar predecir el futuro y eso es el machine learning", añade.

Aunque reconoce que la inteligencia artificial es un campo mucho más grande, se muestra convencido de que la herramienta que ganará en popularidad será el aprendizaje automático. ¿Por qué? Vogels explica que el "gran impacto" del cloud en el mundo de los negocios ha sido que hoy en día "todo el mundo tiene acceso a las mismas funciones". Se refiere a los servicios en la nube, el almacenamiento o las herramientas de análisis. "Ya no hay ninguna compañía que utilice las tecnologías de la información como una diferencia competitiva porque todas tienen acceso a las mismas herramientas", analiza.

Ante ese nivel de estandarización, ¿cómo puede entonces una empresa desmarcarse del resto? "La verdadera diferencia entre ellas son los datos que tienen, cómo pueden usarlos y combinarlos para fidelizar a más clientes, construir nuevos productos, ser más eficientes o tener mayor control sobre su cadena de suministro", comenta. "Los datos, y su análisis, se están convirtiendo en el core del negocio de cualquier compañía", concluye Vogels.

Esta información es, al fin y al cabo, la razón de ser de la inteligencia artificial, proceda de las fuentes que sean, desde las más tradicionales a aquellas que más se acercan a los humanos. "Cada vez estamos procesando mejor ese tipo de datos como son la voz, el vídeo o las fotografías", señala. "Hoy, las capacidades de la nube nos permiten hacer reconocimiento de imágenes en tiempo real, cuando hace tres o cuatro años era impensable". Cita como caso de éxito el supermercado sin cajas Go de Amazon. Poder llevarnos a casa todo lo que queramos sin hacer cola es simplemente cuestión, dice, de analítica de vídeo y machine learning.

El reto del GDPR

A menos de una semana de que entre en vigor el nuevo Reglamento General de Protección de Datos (GDPR) -el próximo día 25-, Vogels no sólo siente que su empresa está preparada para una normativa más exigente, sino que podría decirse que hasta está entusiasmado. "Todos nuestros servicios están listos", asegura. "No hemos creado nuestras herramientas enfocándonos en el GDPR, sino en la seguridad de nuestros clientes". Por ejemplo, comenta que han creado un set de herramientas de automatización que pueden ayudar a las empresas a llevar la seguridad "incluso a un nivel superior" que el marcado por la nueva regulación.

"No hemos creado nuestras herramientas enfocándonos en el GDPR, sino en la seguridad de nuestros clientes"

"Estamos felices, siempre es bueno ver que la regulación se centra en proteger a los clientes", subraya. "El objetivo de Amazon es ser una compañía centrada en el cliente y tratamos de replicar eso también a AWS, ayudar a nuestros clientes significa protegerles y proteger sus negocios", comenta. Por ello asegura que el GDPR es una "oportunidad" para "reeducar" a las empresas en las bondades de sus herramientas de seguridad y todo lo que pueden llegar a hacer con ellas. Les facilitará, por ejemplo, tareas que llevan tiempo intentando motivarles como a dar el paso de encriptar todos sus datos. "Si lo hacen, serán los únicos que decidan quién tiene acceso a su información".

La protagonista, la voz

La empresa de Vogels es una de las abanderadas de las interfaces máquina-humano intuitivas. «La pantallas, el teclado y el ratón no son un canal natural de comunicación», argumenta a INNOVADORES. "Hablar, sin embargo, es una experiencia verdaderamente humana", agrega. De ahí que el CTO de Amazon defienda la voz como medio para que las personas se relacionen con los dispositivos. No es extraño, por tanto, que uno de los productos estrella de su compañía esté basado en el lenguaje natural, Alexa.

Todo un cambio de paradigma. "Si tienes un asistente de voz en casa, ya no hará falta que uses el teléfono para hacer preguntas", indica. "Por ejemplo, si estás cocinando y quieres saber cuántos mililitros caben en una taza, no tienes que lavarte las manos y buscarlo en el móvil, le preguntas directamente a Alexa. Así de simple".

Pero el verdadero potencial que esconde la voz para Vogels no es otro que la democratización de la tecnología. "Si introducimos interfaces más humanas en los sistemas digitales, entonces más gente los usará, no simplemente los nativos digitales", afirma. Se refiere a personas mayores y niños, quienes puede que "no sean tan buenos" escribiendo en un teclado (ya sea táctil o no). También incluye a personas sin recursos, que quizás ni siquiera tengan un smartphone o una tableta.

"La interacción por voz es algo muy emocional y la emoción debe formar parte de ella"

Estos asistentes de voz todavía están en sus etapas iniciales de desarrollo y tienen por delante retos importantes que superar. "La interacción humana es bastante compleja", dice Vogels. "Algunas empresas pueden querer tener un tipo de interacción diferente con sus clientes, por ejemplo, a través de otras voces o distintas emociones", comenta. Amazon Polly, una herramienta para convertir texto en voz, ya permite hacer anotaciones sobre la entonación en las palabras que la máquina va a decir. ¿Por ejemplo? Si una parte se tiene que susurrar u otra debe ser más agresiva.

"La interacción por voz es algo muy emocional y la emoción debe formar parte de ella", razona el CTO de Amazon, quien puntualiza que "se tiene que hacer mucho trabajo en psicología no sólo para el comando de voz, sino para toda la conversación". "Algunas de estas voces puede que sean muy seguras de sí mismas. ¿Eso es personalidad? No lo sé", añade.

Un siguiente nivel se produce cuando resulta imposible distinguir si el interlocutor es una máquina o un humano. Precisamente, hace unos días Google presentó al mundo Duplex, un sistema de inteligencia artificial que automatiza las conversaciones telefónicas hasta el punto en que no se puede identificar si es un robot o una persona. Le preguntamos a Vogels, quien mantiene su corrección y sencillamente contesta: "Cuando hablas con Alexa, sabes que lo estás haciendo con una máquina y no con un humano".

"Creo que definitivamente es bueno decirle a los clientes que están hablando con un sistema automático", dice. "Alexa está integrada en tantos dispositivos, en casa, en la nevera, en el coche; y todo el mundo sabe que no es un humano". Y quita hierro al asunto introduciendo una anécdota: en Estados Unidos ya nadie llama a su hija Alexa... con una casa es suficiente.

El modelo en el edge Sobre el edge computing, Vogels señala que mientras el dataset y el entrenamiento de los datos seguirá haciéndose en la nube, los modelos (pequeñas piezas de software) sí que se computarán en el extremo de la red.
Abrir las cortinas del hotel Wynn Vogels destaca los avances de los asistentes de voz también en los negocios. Habla de dos niveles: uno más básico en que se manejan datos públicos de la empresa y otro con información privada. Por ejemplo, señala cómo el hotel Wynn de Las Vegas usa Alexa en cientos de habitaciones para abrir las cortinas, encender la televisión o pedir comida con comandos de voz.