Salle 435 - Vers de nouveaux défis en sciences des données : modèles et outils
Mustapha Lebbah
21 April 2017, 15h30 Salle/Bat : 435/PCRI-N
Contact :
Activités de recherche :
Résumé :
L'exposé sera consacré à la fouille et à l'analyse des données massives pour lesquelles la représentation classique des variables a des limites. Il existe actuellement un nombre conséquent de méthodes de clustering, mais elles ne s'adaptent pas toujours aux particularités de certains types de données (catégorielles, binaires, mixtes, séquences, flux, relationnelles, etc.). On distinguera deux familles de modèles de classification non supervisée : les modèles probabilistes et les modèles "déterministes". L'exposé abordera également des travaux récents sur l'apprentissage scalable et relationnel en utilisant les nouveaux paradigmes de passage à l’échelle (MapReduce/actors...etc). En plus des difficultés soulevées par la variété des données dans la mouvance du Big data et de l’Open data accompagnée par des plateformes nouvelles qui offrent un accès facile et lisible à l'information relationnelle (ontologies, Linked data, RDF, etc.), de nouveaux défis sont ouverts et seront présentés, en particulier : l'agilité et la gouvernance en sciences des données