Abstract:
Les technologies modernes de l’information et de la communication ont considérablement
modi é le contenu Web. Les réseaux sociaux sont l’un des changements les plus profonds qui
se soient produits. Grâce à eux, l’internaute est devenu aujourd’hui le premier producteur de
contenu après avoir été un consommateur passif de contenu dans le passé.
Ce nouveau type de production de contenu présente de nombreux défauts et problèmes qui
suscitent de nombreuses préoccupations (di amation, l’extorsion, discours de haine, ...etc).
Les méthodes pouvant être utilisées pour traiter ces problèmes peuvent être résumées en identi cation de l’utilisateur, et la modération. Bien que l’identi cation des utilisateurs soit un
processus simple, la modération est un processus complexe, coûteux et long.
Le but de ce mémoire est de proposer un outil qui aide à la modération de contenus. Pour ce
faire on recueille les di érentes technique citées dans la littérateurs permettant de véri er la
qualité du contenu textuel généré par l’utilisateur.
On a choisies la classi cation de texte pour élaborer notre approche qui est basé notamment
sur le calcule de similarité des textes.