Captchas : suis-je un robot ?
Ce coin est-il considéré comme un feu de signalisation ? Est-ce un « I » ou un « l » ? Toute personne qui utilise l’Internet s’est déjà posé ces questions ou d’autres similaires. La raison ? Les captchas. À quoi ces énigmes sur Internet sont-elles dues et pourquoi sont-elles parfois si difficiles ?
« Je ne suis pas un robot », lis-je sur l’écran devant moi. Je coche la case et une devinette en images apparaît. « Sélectionnez toutes les cases avec des feux de signalisation », me demande-t-on Hm ... seulement le feu de signalisation ou également le poteau auquel il est fixé ? Et qu’en est-il du petit morceau de feu de signalisation qui occupe trois pixels du champ dans le coin supérieur gauche ?
C’est ironique : pratiquement tous les jours, nous devons prouver que nous ne sommes pas des robots – à des robots ! Avant, c’étaient de simples photos et des lettres déformées. Aujourd’hui, ce sont des images d’animaux générées par l’IA, ou de véritables puzzles que nous devons résoudre.
Mais pourquoi ces captchas deviennent-ils de plus en plus difficiles ? Et n’y a-t-il pas une meilleure solution ?
Qu’est-ce qu’un captcha ?
Captcha – ou « CAPTCHA » – est une abréviation qui signifie « *C*ompletely *A*utomated *P*ublic *T*uring test to tell *C*computers and *H*umans *A*part ». En d’autres termes, un test de Turing automatisé qui, au mieux, vous identifie comme une personne. Dans le pire des cas, il ne fait que vous rendre la vie difficile.
Vous pouvez probablement déjà deviner pourquoi cela est nécessaire sur Internet. L’objectif des captchas est de protéger les sites Internet contre les attaques de robots. Dans le passé, les devinettes en images et les lettres déformées constituaient un moyen relativement sûr d’éloigner les robots.
Mais il y a dix ans, Google a admis dans son blog sur la sécurité que même les robots étaient de plus en plus capables de résoudre le captcha, avec une précision de près de 100 %. Une nouvelle solution s’imposait.
La machine au coude à coude avec l’humain
Alors que nous nous sommes lentement mais sûrement habitués aux feux de signalisation et aux motos, les outils d’intelligence artificielle pour la reconnaissance d’images se sont également améliorés. Même les puzzles les plus difficiles peuvent désormais être résolus par des robots, comme l’écrit la « MIT Technology Review ». Et dans le pire des cas, l’IA recrute simplement une personne réelle pour résoudre le captcha, ce qui s’est déjà produit (en anglais).
Que faire lorsque toutes les énigmes et tâches de captcha peuvent être résolues par des robots ? Google dit : « Débarrassons-nous des énigmes ! ».
Ce que les robots ne peuvent pas faire
La meilleure solution au problème des captchas réside probablement dans les « reCaptcha » de Google. Utilisés sur cinq millions de sites Internet actifs, ils constituent de loin le plus grand pourcentage de captchas, selon le « Spiegel ». Vous les reconnaissez au fait qu’il suffit de cocher la case, et non plus de résoudre une énigme.
Le reCaptcha ne teste pas votre humanité avec des énigmes difficiles, mais avec votre comportement. Google le décrit comme suit dans son blog de sécurité : « Nous avons développé un backend d’analyse de risque avancé pour reCcaptcha qui prend activement en compte toute l’interaction d’un utilisateur avec le captcha – avant, pendant et après – afin de déterminer si cet utilisateur est un être humain. »
Concrètement, cela signifie que le captcha analyse votre comportement. Par exemple, la façon dont vous déplacez la souris sur le champ ou ce que vous avez fait précédemment dans le navigateur (en anglais) sont analysés en quelques secondes. Un robot aurait déplacé la souris à une vitesse constante et en ligne droite et n’aurait pas d’abord cherché la recette de pesto sur Google. Il calcule ensuite la probabilité que vous soyez un être humain et non un robot.
Dans la plupart des cas, cela fonctionne et vous pouvez accéder à la page. Seulement si la probabilité n’est pas assez élevée, vous devez résoudre une autre énigme pour être sûr.
« Mais les captchas entraînent les IA, n’est-ce pas ? »
Oui et non. Depuis des années, on spécule sur le fait que nous apprenons à des modèles d’IA ce que sont les feux de signalisation, les panneaux de signalisation et les motos. Google lui-même a admis par le passé que les données reCaptcha étaient également utilisées pour améliorer la reconnaissance de texte OCR et Google Street View.
Lorsque l’industrie des voitures auto-conduites s’est développée, les feux tricolores captcha ont également fait leur apparition. Voici d’ailleurs un XKCD sur le sujet. Mais bien que l’on puisse supposer que les captchas sont utilisés pour entraîner les modèles d’IA actuels et apprendre aux Teslas à conduire, cette hypothèse n’a jamais été confirmée.
Dois-je ou non cliquer sur le poteau de feu de signalisation ?
Les captchas font partie intégrante d’Internet depuis le début des années 2000. Une projection de 2006 (en anglais) a montré que 200 millions de captchas sont résolus chaque jour. À raison de 10 secondes par énigme, cela représente 150 000 heures, soit plus de 17 ans (!). Personne ne sait à quoi ressemblent ces chiffres aujourd’hui.
Toutefois, grâce à de nouveaux développements tels que le reCaptcha de Google, de moins en moins de captchas devront être résolus à l’avenir. En outre, des technologies sont déjà en cours de développement, qui pourraient rendre les captchas complètement obsolètes.
Mais en attendant : non, le poteau n’est pas considéré comme un feu de signalisation.
Les captchas ne sont généralement pas trop stricts dans le choix des images. Si vous avez encore un peu de temps et que vous souhaitez vous perfectionner, vous trouverez ici les captchas les plus courants.
J'ai toujours été fasciné par tout ce qui a des boutons, des écrans et des haut-parleurs. En tant que journaliste spécialisé dans la technologie et la société, je mets de l'ordre dans la jungle du jargon technique et des fiches techniques confuses.