Libellé du cours : | Données de santé (open Data, Big Data, préparation et analyse des données) |
---|---|
Département d'enseignement : | EEA / Electronique Electrotechnique Automatique |
Responsable d'enseignement : | Monsieur SLIM HAMMADI |
Langue d'enseignement : | |
Ects potentiels : | 0 |
Grille des résultats : | Grade de A+ à R |
Code et libellé (hp) : | ISA_OSP_DSA - Données de santé (open Data, B |
Equipe pédagogique
Enseignants : Monsieur SLIM HAMMADI
Intervenants extérieurs (entreprise, recherche, enseignement secondaire) : divers enseignants vacataires
Résumé
Ce cours a pour but de donner aux étudiants les connaissances et la maîtrise des outils nécessaires à l’exploitation de données dans un contexte de santé. En effet, on oublie trop souvent que l’utilisation d’algorithmes de machine learning ne peut pas se faire sans une étape préalable de traitement de données. La compréhension du problème à étudier, l’analyse des données à disposition, et leur préparation en vue d’une utilisation pour apprentissage, sont autant de prérequis essentiels qui seront étudiés. L’enseignement aura deux visées : - Sur le plan théorique, donner aux étudiants les bases nécessaires à la prise en main et l’analyse de données de santé issues des sources hétérogènes (urgences, IoT, biologie et clinique). Il s’agit à la fois d’outils statistiques (métriques d’analyse des données, méthodes de réduction de dimension, etc.) et informatiques (formation à l’utilisation des librairies communes, notions de big data, etc.). - Sur le plan pratique, introduire des méthodes et bonnes pratiques indispensables dans l’industrie : production de code de qualité, organisation en équipe d’un projet informatique, partage de code et version control, étude de papiers de recherche.
Objectifs pédagogiques
Du point de vue des connaissances : - Connaître l’état de l’art du Big Data et du Machine Learning en santé. - Comprendre les enjeux de la préparation de données dans le cadre d’un pipeline de Machine Learning. - Comprendre les défis additionnels posés par les données de santé, qu’il s’agisse de l’utilisation même des données ou de leur acquisition. - Apprendre les bons réflexes pour la manipulation de données de santé, à la fois des points de vue technique et éthique. - Connaître les méthodes classiques de visualisation, analyse et préparation de données, leurs avantages et inconvénients. - Connaître quelques méthodes plus avancées de préparation des données. Du point de vue des compétences : - Mettre en place les outils de manipulation, analyse, visualisation et préparation des données en Python, avec les librairies adaptées (numpy, pandas, scikit-learn, etc.). - Produire du code de qualité et le partager sur une plateforme de version control. - Savoir lire un papier de recherche sur le thème de la Data Science et en extraire les informations essentielles.
Objectifs de développement durable
Modalités de contrôle de connaissance
Contrôle Continu
Commentaires: Contrôle continu via compte-rendus de TP, réalisés par petits groupes d’étudiants.
Ressources en ligne
Tous les supports de cours et les notebooks de TDs/TPs seront disponibles en accès libre.
Pédagogie
Séances en salle informatique. Les points théoriques sont exposés de façon interactive avec des slides, puis sont mis en pratique immédiatement après sur ordinateur. Certains comptes-rendus de TPs sont à rendre pour évaluation.
Séquencement / modalités d'apprentissage
Nombre d'heures en CM (Cours Magistraux) : | 12 |
---|---|
Nombre d'heures en TD (Travaux Dirigés) : | 12 |
Nombre d'heures en TP (Travaux Pratiques) : | 0 |
Nombre d'heures en Séminaire : | 8 |
Nombre d'heures en Demi-séminaire : | 0 |
Nombre d'heures élèves en TEA (Travail En Autonomie) : | 0 |
Nombre d'heures élèves en TNE (Travail Non Encadré) : | 0 |
Nombre d'heures en CB (Contrôle Bloqué) : | 0 |
Nombre d'heures élèves en PER (Travail PERsonnel) : | 0 |
Nombre d'heures en Heures Projets : | 0 |
Pré-requis
Notions basiques de programmation algorithmique en Python.