En 1950, Alan Turing proposait une méthode ambitieuse et simple afin d’évaluer si une machine pouvait « penser ». Son test confronte des humains à des machines via des conversations textuelles. À partir d’ici, un juge tente de déterminer qui est humain.

Pour la première fois, des chercheurs de l’Université de Californie à San Diego, Cameron Jones et Benjamin Bergen, montrent qu’une intelligence artificielle a réussi ce test. Selon leur étude, GPT-4.5 d’OpenAI a non seulement passé l’épreuve mais a surpassé les interlocuteurs humains sous certaines conditions précises.
Sur 284 participants recrutés pour l’expérience, GPT-4.5 a convaincu les juges d’être humain dans 73% des échanges, notamment lorsqu’il adoptait un profil précis : celui d’un jeune introverti maîtrisant parfaitement la culture et le langage d’internet. À titre comparatif, GPT-4o, une version antérieure, n’a convaincu que dans 21% des cas. Ces résultats montrent que les modèles récents peuvent reproduire précisément des comportements provenant de l’humain.
Cette découverte ouvre plusieurs débats. D’abord, celui de la définition même de l’intelligence, mais aussi les enjeux éthiques et sociaux liés à l’utilisation de ces IA capables de tromper. Cependant, il faut bien prendre en compte que GPT-4.5 n’a fait que de suivre des instructions précises. Car oui, l’IA a été conditionné au préalable afin d’effectuer le test.
Le test de Turing
Conçu par Alan Turing, il consiste à évaluer si une machine peut être considérée comme intelligente en tenant une conversation écrite capable de tromper un juge humain sur sa véritable nature. Un classique pour juger des progrès en intelligence artificielle depuis des décennies.
M. Turing est considéré comme le père de l’informatique et se fera notamment connaitre grâce à son rôle majeur dans le décodage de la machine Enigma des Nazis durant la Seconde Guerre mondiale.
Sources : Discovermagazine.com