¿LAS MÁQUINAS PUEDEN PENSAR? UN VIAJE A TRAVÉS DEL TEST DE TURING

Juan Carlos Castellanos
12 sept 2024
4 Min. de lectura

Actualizado: 13 ene 2025

Hoy en día, hablar con asistentes virtuales como Siri, Alexa o Bixby es parte de nuestra rutina, al igual que usar herramientas de IA generativa como ChatGPT. Pero ¿alguna vez te has preguntado cómo comenzó todo?

Viajemos en el tiempo a la Inglaterra de los años 50. En esa época, mientras las primeras computadoras se armaban con cables y bulbos, un joven matemático brillante llamado Alan Turing se hizo la gran pregunta ¿las maquinas pueden pensar? (Turing, 1950).

Motivado por esta pregunta, Turing decidió poner a prueba su idea con un experimento que se convertiría en leyenda: el famoso Test de Turing (Cruz, 2008). Este test no se trataba de desentrañar el funcionamiento interno de las máquinas, sino de observar el comportamiento de quienes interactuaban con ellas. Según Turing, una máquina podría ser considerada inteligente si lograba imitar respuestas humanas tan bien que un interrogador no pudiera distinguirla de una persona real.

El juego era simple, un interrogador chateaba con dos entidades ocultas, una máquina y un humano. Si el interrogador no podía distinguir quién era la máquina y quién era el humano, la máquina habría superado el Test de Turing. Para pasar este test, una inteligencia artificial debe ser lo suficientemente convincente como para engañar al menos al 30% de los interrogadores, haciéndoles creer que están conversando con un humano en lugar de una máquina.

Aunque Alan Turing falleció tan solo a sus 41 años en 1954, su prueba para evaluar la potencialidad de las máquinas para emular el pensamiento humano pasó a la historia. El Test de Turing se convirtió en un hito para los apasionados en el mundo de la computación, inspirando la creación del Premio Loebner, una competición anual que desafía a los desarrollos tecnológicos más avanzados a superar la prueba de Turing.

“ELIZA: el primer bot que se sometió a la prueba Turing"

En los años 60, el mundo vio nacer uno de los primeros chatbots, ELIZA, creado por el científico Joseph Weizenbaum. ELIZA fue diseñada para simular una conversación con un terapeuta, utilizando reglas simples de respuesta. Aunque era capaz de mantener conversaciones básicas, rápidamente se hizo evidente que ELIZA no poseía una verdadera inteligencia. Los interrogadores podían descubrir su naturaleza mecánica con relativa facilidad, y ELIZA se quedó lejos de superar el Test de Turing (Shah y Warwick 2010). Este experimento dejó claro que, aunque la máquina podía imitar ciertos patrones de lenguaje, la comprensión humana estaba muy lejos de ser replicada.

“Elbot: un robot divertido que desafió la prueba Turing"

Décadas más tarde, en 2008, el mundo presenció un avance significativo en la inteligencia artificial con Elbot, un chatbot creado por la empresa alemana Artificial Solutions. Elbot era notablemente más avanzado que sus predecesores, destacando por su alta espontaneidad y sentido del humor en las respuestas.

Durante los Premios Loebner, Elbot fue sometido a prueba por 12 evaluadores. Su espontaneidad y peculiar sentido del humor lograron convencer a tres jueces de que era humano (Shah y Warwick, 2010). Si hubiera engañado a solo uno más, habría alcanzado el 30%, el porcentaje que tradicionalmente se considera como el mínimo para aprobar el Test de Turing. Aunque Elbot no logró superar la prueba, fue galardonado con la medalla de bronce.

“ChatGPT-4 supera la prueba en medio de controversias"

Recientemente, científicos de la Universidad de San Diego aplicaron el Test de Turing a GPT-4, desarrollado por OpenAI (Jones y Bergen, 2024). En el experimento participaron 1,979 personas como interrogadores, y cada conversación entre los interrogadores y GPT-4, o entre los interrogadores y humanos, duró 5 minutos. Durante este tiempo, los interrogadores debían interactuar con la entidad oculta y determinar si estaban conversando con GPT-4 o con un humano.

Sorprendentemente, en su mejor rendimiento, GPT-4 logró engañar a sus interrogadores en el 49.7% de los juegos de conversación, lo que representa un avance significativo en la capacidad de la IA para imitar el lenguaje humano.

Sin embargo, los investigadores cuestionaron el parámetro tradicional del 30% utilizado en la prueba de Turing, argumentando que este umbral es demasiado bajo para considerar que la máquina realmente piensa como un humano. Si una herramienta de IA verdaderamente tiene la capacidad de pensar como un humano, debería ser indistinguible en todas las ocasiones, o al menos en la mayoría de las interacciones. En este sentido, un umbral superior al 50% sería más convincente para concluir que una máquina es capaz de emular el pensamiento humano.

Nos encontramos en el año 2024 y la gran pregunta de Alan Turing sigue en pie: ¿Las máquinas podrán pensar como los humanos algún día?

Ahora te toca a ti. Con lo que ya sabes sobre inteligencia artificial, ¿crees que estamos cerca de cruzar esa frontera? ¿O piensas que la mente humana es algo que ninguna máquina podrá igualar jamás?

Referencias

Cruz, A. (2008). Inteligencia Artificial (Test de Turing), Revista de Información, Tecnología y Sociedad, 1, 48-49. http://revistasbolivianas.umsa.bo/pdf/rits/n1/n1a14.pdf

Jones, C., & Bergen, B. (2024). Does GPT-4 pass the Turing test? In Proceedings of the 2024 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies (Volume 1: Long Papers, pp. 5183–5210). Association for Computational Linguistics. Mexico City, Mexico. http://dx.doi.org/10.18653/v1/2024.naacl-long.290

Shah, H., & Warwick, K. (2010). Testing Turing's five minutes, parallel-paired imitation game. Kybernetes, 39(3), 449-465. https://doi.org/10.1108/03684921011036178

Turing, A. M. (1950). Computing machinery and intelligence, Mind, 59(236), 433-460. https://doi.org/10.1093/mind/LIX.236.433

¿LAS MÁQUINAS PUEDEN PENSAR? UN VIAJE A TRAVÉS DEL TEST DE TURING

Entradas recientes

Comentarios