Présentation :
Dans cette formation, qui s’adresse à des apprenants ayant peu de connaissances sur l’analyse de données, on se propose d’utiliser Python pour découvrir, puis approfondir, les principes d’analyse de la donnée.
Afin de sensibiliser l’apprenant on commencera par un exercice pratique permettant de comprendre les problèmatiques pratiques liées à la découvertes des données. On présentera ensuite les méthodes de préparation, de description et d’analyse des données. On appliquera ces principes sur un exemple de séparation de source voix/piano, à la description des habitudes alimentaires à partir de données brutes et à la décomposition/recomposition des visages. En complément des techniques d’analyse, on présentera aussi quelques outils Python pour le webscraping dont BeautifulSoup.
Enfin, on verra comment un passage à l’échelle sur une infrasctructure BigData peut être envisagé grâce à PySpark.