Abstract:
Résumé :
Avec le phénomène de l'explosion de données, l'apprentissage automatique est devenu de plus en
plus une discipline indispensable dans le domaine d'informatique. Cependant, dans de nombreuses
applications dans le monde réel, les données ne sont pas toujours linéairement séparables. Par
conséquence, les méthodes d'apprentissages traditionnelles ne peuvent pas être appliquées. Pour
faire face à ces limitations, les méthodes à noyaux ont été proposées.
Dans ce mémoire on s’intéresse précisément aux noyaux sur les arbres qui ont proliféré dans des
vastes domaines grâce à leur forme hiérarchique.
Nous avons présenté l'astuce noyau ainsi que les méthodes à noyau d'arbre ST (Subtree kernel) et
SST (Subset tree kernel) ainsi que l'analyse de leur complexité.
Par ailleurs nous avons commencé au développement d'une boite à outils comportant
l'implémentation des algorithmes suscités. ملخص :
مع ظاهرة انفجار البيانات، أصبح التعلم الآلي بشكل متزايد
لم يعد الانضباط الأساسي في مجال علوم الكمبيوتر. ومع ذلك، في كثير
في تطبيقات العالم الحقيقي، لا تكون البيانات قابلة للفصل خطيًا دائمًا. بواسطة
وبالتالي لا يمكن تطبيق أساليب التعلم التقليدية. ل
للتعامل مع هذه القيود، تم اقتراح أساليب النواة.
في هذه الأطروحة نحن مهتمون بشكل خاص بنواة الأشجار التي انتشرت فيها
مجالات واسعة بفضل شكلها الهرمي.
لقد قدمنا خدعة النواة بالإضافة إلى ST (نواة الشجرة الفرعية) و
SST (نواة الشجرة الفرعية) بالإضافة إلى تحليل مدى تعقيدها.
وعلاوة على ذلك، بدأنا في تطوير صندوق الأدوات بما في ذلك
تنفيذ الخوارزميات المذكورة. Abstract:
With the phenomenon of the explosion of data, machine learning is increasingly become a
necessary discipline in the field of informatics. However, in many applications in the real world, the
data are not always linearly separable. As consequence, the traditional learning methods cannot be
applied. To cope with these limitations, the kernel methods have been proposed.
In this thesis we are precisely interested in kernels trees which have proliferated in vast
domains thanks to their hierarchical forms
We have presented the kernel trick as well as the kernel tree methods ST (Subtree kernel) and SST
(Subset tree kernel) as well as the analysis of their complexity.
In addition, we have begun the development of a toolbox with the implementation of the generated
algorithms.