Abstract:
L’apprentissage automatique s’est largement développé ces dernières années, où les systèmes
intelligents et les programmes informatiques deviennent similaires aux capacités du cerveau
humain. Cela est dû au développement d’algorithmes d’apprentissage automatique (en particulier d’apprentissage en profondeur), ainsi qu’à la capacité des ordinateurs et aux mégadonnées
disponibles. Cependant, il y a des utilisations négatives pour ce développement, y compris la
capacité de casser et de réussir le test CAPTCHA.
CAPTCHA pour (Completely Automated Public Turing test to tell Computers and Humans
Apart ), est l’un des systèmes de vérification utilisés par un grand nombre de sites Web et de
services Web pour les protéger contre le piratage par des programmes informatiques (bots), le
CAPTCHA textuel est géneralement le type le plus utilisé.
Notre objectif est d’étudier les mécanismes de rupture ce type de CAPTCHA et les défis liés aux
développements d’algorithmes d’apprentissage automatique face à sa sécurité. Nous menons
une étude expérimentale utilisant un modèle basé sur un réseau End-to-End CRNN-CTC utilisé pour la reconnaissance de l’écriture manuscrite et du texte pour rupture un CAPTCHA
textuel créé avec Python. Les résultats obtenus montrent que notre modèle est capable de
rupture le CAPTCHA textuel avec un bon résultat par rapport à les méthodes d’état de l’art.