Sciences des données

Code Cours
2021-FGES-COMP-FR-3024
Langue d'enseignement
Français, Anglais
Ce cours apparaît dans les formation(s) suivante(s)
Responsable(s)
Julie JACQUES

Présentation

Prérequis

Aucun pré-requis théorique n’est nécessaire.


Amenez un PC ou un MAC


Objectifs

L’objectif de ce cours est la découverte de la science des données ou datascience. Cette discipline s’intéresse à l’exploitation des données à l’aide d’outils mathématiques, statistiques et informatiques. Elle est présente dans la vie quotidienne : elle est derrière les recommandations de contenus multimedia comme Netflix, Amazon, Spotify, ou encore la détection des SPAMS ou de fraude à la carte bleue…



Après un tour d’horizon des applications de la sciences des données, notre objectif est de réaliser à la fin de cet enseignement un outil de détection des champignons vénéneux. A partir des caractéristiques d’un champignon (couleur, odeur, spores,…) l’outil indiquera si le champignon est vénéneux ou non. Différents outils simples de sciences des données seront présentés et mis en pratique avant de passer au projet. En fonction du temps restant, nous étudierons la problématique du panier de la ménagère, qui peut être très utile pour le commerce ou l’e-commerce. A l’aide de l’algorithme A Priori, nous identifierons les articles fréquemment achetés ensemble.


Présentation

  • (Cours) Panorama de l’utilisation de la science des données et vulgarisation du vocabulaire de la science des données : Algorithme, Big Data, Machine Learning, Deep Learning, Data Mining, Intelligence Artificielle (IA)…

  • (Cours-TD) Calcul de similarité (distance) entre deux objets : théorie et exercices pratiques (Cours-TD) Evaluation de la qualité d’une prédiction (matrice de confusion, confiance, sensibilité, accuracy,…) et méthode KNN : théorie et exercices pratiques

  • (Projet) Partie 1 : Détection de champignons vénéneux

  • (Projet) Partie 1 : Détection de champignons vénéneux (suite)

  • (Cours-TD) La sélection d’attributs

  • (Projet) Partie 2 : Détection de champignons vénéneux avec un nombre minimum de questions

  • (Cours-TD) Algorithme A priori et problème du panier de la ménagère

  • (Cours-TD) Algorithme A priori et problème du panier de la ménagère (suite)



Modalités

Modalités d'enseignement

2h par semaine

12h de cours et d’exercices pratiques, sur papier et sur le logiciel Orange de Biolab

6h de projet, sur Orange pour les non informaticiens (approche NoCode), en Python pour les informaticiens.

Évaluation

Ressources

Bibliographie

<a>https://orange.biolab.si/download </a>