الخلاصة:
De nos jours, l’utilisation des ordinateurs, de l’Internet et des technologies numériques en
général a considérablement augmenté. Cette situation a entraîné la prolifération, la simplicité, et l’accès gratuit aux documents numériques et bases de données ouvertes sur le
Web.
Le plagiat est l’utilisation du travail ou l’idée de quelqu’un d’autre sans Confession, ce
qui est illégal surtout dans le domaine académique. Par conséquent, le développement de
méthodes de détection automatique du plagiat a gagné un grand intérêt au cours des trois
dernières décennies. La fouille de données peut aider à construire et améliorer l’efficacité
des systèmes de détection de plagiat grâce à ses techniques populaires telles la classification, la segmentation et la détection des anomalies.
Le but de ce travail est de présenter une étude approfondie des principales méthodes de
détection du plagiat. Dans la phase d’expérimentation, nous rapportons notre implémentation JAVA d’une méthode de détection intrinsèque du plagiat intrinsèque basée sur le
caractère 3-gram. les résultats obtenus montrent l’utilité de la méthode pour reconiser les
passages plagiés. Cependant, dans le cas d’énormes corpus, son efficacité devrait être reconsidérée