Livret - Atelier GM

NOTES
Ate li e r G é n i e M a t h é m a t i q u e
Les outils m athé m atique s ap p liqué s à
L’EPID EMIOLOG IE
I nter ve n t i on s
P ou r plus d’inf o r m a t i o n s , r e t r o u ve z n o u s su r n o tr e
s ite el e v es -inge n i e u r s . m a t h e m a tiq u e s.in sa - r e n n e s.fr
ou su r la page f a c e b o o k d e l ’ é v è n e m e n t:
INSA
Génie Mathématique
Ecole des hautes
EHESP études
en santé publique
INSA Rennes
L’institut national des sciences appliquées de Rennes est une école d'ingénieurs localisée à Rennes en Bretagne. Elle fait partie du Groupe
INSA, qui forme chaque année près de 12 % des ingénieurs français.
James Ledoux
M. Ledoux est un universitaire "pur", il fait toutes ses études à l'université : Licence puis maîtrise en Mathématiques avec option magistère (orientation entreprise), mais non concluant
donc orientation vers l'enseignement/recherche. Thèse sur la fiabilité des logiciels et réduction
de dimension des modèles markoviens. Choix d'étude des probabilités car motivé par la qualité
des enseignements dispensés et mélange de plusieurs disciplines (analyse, algèbre...). Choix de
la recherche académique car liberté d'action. Pas forcement de journée type mais comprend
toujours beaucoup de réunions. La recherche est maintenant au second plan (par rapport au
département GM). Pas de travaux dans le domaine épidémiologique ou médical mais peut
parler des modèles statistiques. Pour lui, la principale difficulté en modélisation est de cerner
le problème à partir des informations données par les experts pour ensuite rendre un modèle
assez simple pour être facilement compris, mais assez complexe pour donner des informations
que les experts ne savent pas. Logiciels utilisés : R principalement, Matlab et Mapple (avant).
Jean François Dupuy
Jean François Dupuy, actuellement enseignant chercheur à l’INSA de Rennes a beaucoup travaillé auparavant dans le domaine de la santé. Il a tout d’abord commencé par un DEA (Diplôme
d’Etude Approfondi) bio statistique équivalent à un master 2 à l’université René Descartes
(Paris 5). Poursuivant sa lancée, il réalisa pendant 4 ans une thèse statistique sur la « modélisation conjointe de données longitudinales et de durées de vie » (Donnée de qualité de vie, prise
en compte de paramètres plus subjectifs en santé). De plus, il a dirigé des recherches à l’institut
pasteur de Dakar sur des modèles de régression linaire appliqués aux sérotypes de la Dengue
en prenant en compte l’immunisation du patient. Il travaille principalement sur des problèmes
d’adaptation, d’amélioration de modèles non prévus à la base pour ce type d’études. Par exemple,
il s’agit de traiter de problèmes de données manquantes, problèmes très récurrent dans la santé.
Actuellement, J-F Dupuy travaille sur les durées de vie extrêmes de patients atteints du VIH.
SEPIA
SEPIA-Santé est un bureau d’études indépendant en épidémiologie,
biostatistiques et santé-environnement, qui s’interrogent sur l’existence
de risques pour la santé des populations. Ils apportent les connaissances scientifiques et aident à la prise de décision pour plusieurs organismes différents : équipes de recherche publiques, associations,
ministères et clients privés. La société compte aujourd’hui 6 salariés.
Claire Ségala
Titulaire d’un doctorat en biologie et sciences de la santé et d’un
diplôme en toxicologie, elle crée
son propre bureau d’étude en
santé-environnement en 1993.
Sylvie Martin
Biostatisticienne. Titulaire d’un
doctorat en pharmacie et d’un master 2 en statistiques.
Quelles méthodes mathématiques et statistiques utilisez-vous, et avec quels logiciels ?
Hervé Loïc
Loïc Hervé, professeur des universités à l’INSA de Rennes, fait partie de l’équipe de
théorie ergodique de l’IRMAR (Institut de Recherche Mathématique de Rennes).
Issu des classes préparatoires, il se dirige ensuite vers le milieu universitaire et le
monde de la recherche fondamentale. Il travaille principalement sur la théorie
spectrale des opérateurs. Plus récemment, en collaboration avec James Ledoux,
il s’intéresse aux propriétés des modèles markoviens. Membre actif du département génie mathématique, il est aussi responsable de plusieurs modules du cycle
préparatoire et participe au renouvellement pédagogique des enseignements.
Modèles classiques de statistiques : modèles de régression linéaire, analyses descriptives et factorielles, Modèles de Cox (Analyse de survie) et analyse des séries
temporelles. Les statisticiens de SEPIA ont également souvent recours aux statistiques bayésiennes. Ils travaillent quotidiennement avec les logiciels SAS et R.
EHESP
Nolwenn Le Meur
Quel est votre parcours universitaire ?
- Cursus d’ingénieur en 3 ans à l’ESMISAB (Ecole Supérieure de Microbiologie et de Sé
curité Alimentaire de Brest)
- DEA en recherche à Rennes, spécialisé en génomique et informatique.
- Thèse en biologie-informatique à l'université de Nantes en étant rattachée à l’INSERM.
- 1er post-doctorat aux Etats-Unis (pendant 2 ans et demi) : elle était au centre de re
cherche contre le cancer de Seattle.
- Retour en France : 2nd Post-doctorat à l’IRISA où elle préparait des concours en parallèle.
Quel est votre parcours professionnel?
- Depuis 4 ans : Professeur de bio-statistique (en CDD) à l’EHESP.
- Elle travaille sur l’inégalité sociale de santé. Elle a des relations professionnelles avec des
médecins de l’hôpital orientés vers la recherche, mais également des professionnels hospitalo-universitaires.
EHESP
Tania Serrano
Quel est votre parcours universitaire ?
Après une licence et un master en sciences géographiques et environnementales en
Equateur, Tania SERRANO est arrivée en France en 2007 où elle a eu un Master en Dynamiques spatiales, gestion des territoires et développement, spécialité en Gestion des
Risques Naturels.
Les maths et elle
N’ayant pas eu de formation en mathématiques et en épidémiologie, elle a dû suivre une
formation en statistiques lors de son passage à l’INSERM où elle était dans une équipe
épidémiologie.
Travail actuel
Pouvez-vous nous expliquer d’où proviennent vos données ?
Elle travaille à l’EHESP depuis juin 2014 comme enseignante au département santé-environnement-travail, où elle donne des cours sur les méthodes d’analyse spatiale et Systèmes
d’Information Géographique (SIG) afin d’estimer une exposition de la population aux polluants environnementaux.
Quelles méthodes mathématiques et
statistiques utilisez-vous, et avec quels logiciels ?
Logiciels utilisés
Les données, anonymes, sont à disposition sur un portail web privé. Elles viennent de l’assurance maladie et de l’hôpital.
Les modèles classiques de statistiques sont variées : classification, ACP, théorie des
graphes, datamining, modèles de survie, régression logistique et multi-niveaux, variables
d’attentes, modèles spéciaux (SIG). Les logiciels utilisés pour exploiter les données sont : R,
SAS, mais surtout STATA, Statgraphics, Python, Pearl, C++.
Pouvez-vous nous expliquer un cas d’étude ?
Etude menée avec l’assurance maladie concernant le parcours de soins des femmes enceintes notamment le nombre d’échographies grâce aux données de l’assurance maladie.
Elle a croisé le lieu de résidence des femmes avec des données de l’INSEE afin d’avoir
leur milieu social d’évolution et a réalisé une analyse de séquences sur la base du datamining (regroupement des femmes qui ont des profils similaires). Elle a pu observer 3
profils : niveau intermédiaire de visite, celles qui ont effectué au plus une visite par grossesse, et celles qui ont une forte consommation de soins durant leur grossesse. Le niveau
de diplômes des femmes aurait un lien sur leur consommation de soins mais pas leur âge.
La description des clusters a été limitée par le peu de données individuelles.
Pour ses études les logiciels les plus utilisés sont : Savgis (payant), Arcgis (gratuit).
Pour les cours dispensés le logiciel utilisé est Qgis.
Explication d’un cas d’étude : cohorte Pélagie
Le but de cette étude était d’estimer l’exposition des femmes enceintes aux pesticides en Bretagne. Les données étaient recueillies par un questionnaire adressé aux femmes (adresse
postale utile pour la géolocalisation), les tests d’urines. Mais ces tests ont un coût élevé
donc on essaie d’estimer l’exposition aux pesticides par la géographie (et les SIG) plutôt que
de prélever et d’analyser les urines. On fait ensuite le lien avec les cartes d’occupation du
sol qui sont disponibles en ligne, cartes fournissant les types de cultures, et l’utilisation du
sol (ex : maïs donc beaucoup d’herbicides, habitations) par des images satellites (Modis).
Evolution de l’étude
Etendue de l’étude sur les femmes enceintes en France, partout sur le territoire français,
évolution de la santé des enfants jusqu’à l’adulte. Il s’agit de la cohorte ELFE : une cohorte de 18 000 femmes enceintes puis on suit les enfants nés jusqu’à 22 ans. L’intérêt de ces études est de conduire à un renforcement des politiques de santé publique.
SEPIA
Pouvez-vous nous expliquer un cas d’étude ?
EHESP
L’Ecole des Hautes Etudes en Santé Publique est un établissement public qui exerce une double mission de formation et de recherche en
santé publique et action sociale. L’EHESP forme les cadres supérieurs
de la santé et du secteur social, au niveau national et international.
Nolween Le Meur
Les travaux de SEPIA concernent la santé environnementale, en particulier la qualité de l’air. Des études sont réalisées pour mettre en évidence des facteurs de risques
sanitaires (polluants atmosphériques, pollens, déchets radioactifs, poussières organiques). Les enquêtes réalisées par SEPIA s’étalent parfois sur plusieurs années,
notamment pour pouvoir disposer de jeux de données pertinents et exploitables.
Après un parcours universitaire atypique et un long séjour aux Etats-Unis, elle
devient professeur de bio-statistique à l’EHESP en 2011. Elle tend à s’orienter vers l’épidémiologie. Elle travaille sur l’inégalité sociale de santé. Enfin, elle a effectué plusieurs études notamment sur le parcours de soins des
femmes enceintes en utilisant des méthodes et logiciels statistiques variés.
Pascale Crepey
Pouvez-vous nous expliquer d’où proviennent vos données ?
SEPIA-Santé dispose du personnel et des moyens logistiques nécessaires pour la
réalisation d’enquêtes en population générale, auprès de professionnels ou de patients. Ces enquêtes peuvent être téléphoniques, en ligne, postales ou en vis-à-vis.
Diplomé de l'Université Pierre et Marie Curie, Pascal Crépey est docteur en biomathématiques et biostatistiques. Actuellement enseignant chercheur à l'Ecole des
hautes Etudes en Santé Publique et dans l'UMR émergence des Pathologie Virale,
il est spécialisé dans l'épidémiologie, les vaccins, les maladies émergentes. Ses recherches tournent autour de la modélisation de la propagation des maladies infectieuses et de l'analyse statistique des données de santé.