Abstract:
Le traitement des vidéos prend de plus en plus d’importance dans de nombreuse applications. De grand progrès ont été réalisé dans ce domaine grace a l’Apprentissage
Automatique (AA), en particulier l’Apprentissage Profond (AP), qui est le sous-domaine
qui imite le cerveau humain en modélisant les réseaux de neurones biologiques à l’aide d’un
outil appelé Réseaux de Neurones Artificiels (RNA). Les deux RNA les plus importants
sont les Réseaux de Neurones Convolutives (RNCs) et les Réseaux de Neurones Récurrents
(RNRs). La Mémoire Court et Long Terme (MCLT) est l’une des architectures RNR la plus
fréquemment utilisées grâce à son grand succès dans le traitement de donnée séquentielles
comme la vidéo. L’objectif de ce travail est de trouver une combinaison de RNA la plus
appropriée pour construire un modèle capable de classer les vidéos dans leurs catégories
respectives. Dans cette perspective, nous avons expérimenté deux approches différentes. La
premiere utilise uniquement un RNC, et la deuxieme utilise à la fois un RNC et une MCLT
afin d’effectuer une classification vidéo sur trois distribustions de données entraînement /
test provenant de l’ensemble de données UCF-101. Les experimentations confirment que
l’utilisation d’un RNR combinée avec un RNC donnait des résultats impressionnants par
rapport à l’utilisation de l’RNC seul, qui a des difficultés avec les vidéos compte tenu de
leur structure dynamique