No, Google Duplex no pasó la prueba de Turing por Peter Voss

“La demostración de IA dúplex de Google acaba de pasar la prueba de Turing”

No estoy seguro si el titular de este artículo refleja una exageración fuera de control o una ignorancia extrema. O ambos.

Ciertamente, la demostración de Google se ve muy impresionante, pero ¿pasar la prueba de Turing?

El Test de Turing requiere que tengas una en curso, de flujo libre conversación sobre ninguna tema, y ​​no ser capaz de decir que está conversando con una computadora.

El sistema Duplex de Google no puede hacer eso en absoluto.

De las propias notas de lanzamiento de Google: “…no espere poder hacerle al agente cualquier pregunta aleatoria que se le ocurra. Duplex solo puede llevar a cabo conversaciones naturales después de haber sido profundamente entrenado en dichos dominios. No puede llevar a cabo conversaciones generales”.

Como un ejemplo simple: Dile que solo tienes un hijo; y luego pregúntale cuántos hijos tienes. Fallará.

Ok, tanto para la prueba de Turing. ¿Qué pasa con el poder de la demostración en sí?

En primer lugar, es difícil saber qué porcentaje de llamadas en vivo reales se acercan a la calidad de lo que se mostró. ¿Qué tan atroz fue la recolección de cerezas? Al ver que no hicieron una presentación en vivo, uno puede suponer que muchas, si no la mayoría de las llamadas de prueba, no funcionaron tan bien. De hecho, ni siquiera sabemos si las grabaciones fueron editadas de alguna manera.

En segundo lugar, cada tarea limitada debe entrenarse por separado con cientos, si no miles, de horas de grabaciones de conversaciones relevantes. Google comentó: “Una de las ideas clave de la investigación fue restringir Duplex a dominios cerrados, que son lo suficientemente estrecho para explorar extensamente. Duplex solo puede llevar a cabo conversaciones naturales después de haber sido profundamente entrenado en dichos dominios. No puede llevar a cabo conversaciones generales”.

Este requisito limita severamente su utilidad práctica. Hace que sea muy costoso recopilar suficientes datos y entrenar, probar y ajustar el sistema para cada aplicación y tarea, y lidiar con cambios de productos o políticas.

En tercer lugar, y quizás lo más importante, el sistema no puede aprender nuevos hechos o habilidades de forma interactiva, no puede manejar oraciones muy complejas ni razonar sobre la situación. En resumen, carece de inteligencia.

Estas deficiencias son inherentes a la tecnología utilizada. Duplex es un sistema estadístico de aprendizaje profundo que representa la ‘Segunda ola de IA’. El aprendizaje en tiempo real, la comprensión profunda, el razonamiento y el manejo de conversaciones fuera del conjunto de entrenamiento requieren verdaderas habilidades cognitivas, también conocidas como la ‘Tercera ola de IA’.