Abstract:
La thématique abordée par ce mémoire est l‟extraction des données web ou
le web scraping, le travail proposé à travers ce mémoire est de répondre à une
problématique bien précise qui est d‟extraire les données numériques
existantes en proposant un système de web scraping qui est une application
web nommé My-Price-Check.
Très souvent les sites e-commerce ne proposent pas le même produit, donc
pour comparer des prix il faut trouver le même produit. Le challenge est de
trouver les mêmes produits ou à la rigueur les plus similaires possibles, de ce
fait le challenge est d‟implémenter un moteur de recherche qui puise des
informations sur le produit dans l‟historique du site lui-même afin de garantir
une comparaison cohérente et homogène, dans le cas où un produit est
introuvable dans tous les sites en même temps le système va proposer une
comparaison avec les produits avec les caractéristiques les plus similaires
possibles et donner la possibilité au client de consulter les produit un par un
dans leurs établissements d‟origine.My-Price-Check est une application web
de comparaison de prix à partir des géants du web du e-commerce tel que
Amazon, Ebay, Alibaba et autres. My-price-check permet de collecter les
données de différents sites web et afficher les caractéristiques des produits
demandés par le client et ceci en lui proposant les meilleurs prix disponibles
parmi les boutiques en ligne énoncées ci-dessus, ceci grâce à un programme
minutieux et un moteur de recherche adapté afin de garantir le bon traitement
des données. En d‟autres termes plus techniques il s‟agit de faire du « Web
Scraping » extraction des données web