L’open Data au service de la santé et de l’environnement

Marie Ramon-Daré , chef de projet design et innovation au sein d’Ecolab, est l’invitée de l’épisode 39 de Data Driven 101.

Elle décrit les efforts pour structurer et optimiser l’utilisation des données dans le domaine de la santé environnementale, en abordant les défis techniques, légaux et communautaires.

Open Data au service de la santé et de l’environnement , Marie Ramon Daré

– Marc — 00:00 :

 Aujourd’hui je reçois Marie Ramon Daré, chef de projet design et innovation au sein de l Ecolab. l’Ecolab est le laboratoire d’innovation pour la transition écologique au sein du commissariat général au développement durable. Bonjour Marie. 

– Marie — 00:13 :

 Bonjour. 

– Marc — 00:13 :

 Alors Marie, est ce que tu peux nous dire un petit peu plus en détail? Qu’est ce que fait l’ecolabs? En quoi ça consiste? Oui, tout à fait. Alors l’ecolab, c’est le laboratoire d’innovation pour la transition écologique qui va œuvrer pour la valorisation et l’ouverture de la donnée publique et apporter des réponses innovantes à la fois à l’urgence de transformation numérique et également de transition écologique. Donc nos actions s’inscrit vraiment dans le dans la stratégie nationale France nation verte et notamment du plan de planification écologique. On va à la fois agir sur la réduction des émissions de gaz à effet de serre et porter des actions également d’adaptation au changement climatique, de préservation de la biodiversité, des ressources et également de réduction des pollutions des milieux. Alors on a juste 2 pôles au sein de l’école, on a un pôle de la Greentech innovation qui vise à décerner un label pour les start-up et PME innovantes sur le champ de la technologie verte. Et qui vise également à animer cet écosystème de la greentech. On organise par exemple un rassemblement annuel, donc il y a lieu cette année les 7 8 novembre à station F et donc on a un autre pôle qui est le pôle innovation données intelligence artificielle qui lui a vocation à promouvoir la production et l’usage des données, qu’elles soient publiques et privées, pour la transition écologique. Et là, on va avoir par exemple des appels à projets pour l’i. A frugal. Dans les territoires, on va également porter des expérimentations ou des projets, dont le Green Data for elles. On va animer la stratégie du ministère en matière de données et notamment tout ce qui va être l’administration ministérielle de la donnée, des algorithmes et des codes sources. Et donc là on va avoir des actions de formation, d’animation de la communauté, de la donnée, du pôle ministériel et suivi de projets structurants pour les politiques publiques du ministère. 

– Marc — 01:57 :

 Alors, c’est qui les interlocuteurs de l écolab? 

– Marie — 02:00 :

 C’est assez varié, majoritairement, on va s’adresser aux agents du pôle ministériel, notamment les directions générales. On va avoir les directions générales, par exemple sur le logement, la mobilité. La prévention des risques, la mère et on va également s’adresser aux opérateurs du ministère aux territoires et ensuite en fonction des projets, on va s’adresser également aux acteurs privés notamment. J’ai parlé des start-up et des PME également la recherche, le citoyen, voilà, ça dépend également des actions que l’on mène, des projets qui sont portés par les colèmes. 

– Marc — 02:30 :

 Alors justement, au sein de l’école, quelles sont tes missions? 

– Marie — 02:33 :

 Alors comme tu l’as dit en introduction, je suis designer de formation donc je vais avoir pour vocation à porter certaines des initiatives et projets de l’ecolam notamment. Avec une approche agile et ancrée dans les démarches de, de design de service public. Tel que le Green Data for health et j’ai également à cœur d’appuyer les projets de l’ecola pour les aider à mener leurs projets avec voilà cette approche agile et avec ces ces démarches d’innovation et également je contribue en ce moment à la structuration d’une offre de design et sciences comportementales pour l’ecolab qui va aider donc à la fois les projets internes et pourquoi pas pouvoir s’inscrire aussi dans l’accompagnement de projets de l’école.. 

– Marc — 03:11 :

 Alors ce Green data for health est ce que tu peux nous en parler un peu plus? En quoi ça consiste? 

– Marc — 03:15 :

 Tout à fait. Alors déjà pour comprendre d’où vient ce projet et comment est ce qu’il est né. Donc je dirais que le démarrage date de fin 2019 dans un contexte à la fois de la stratégie de la Commission européenne sur l’ouverture des données et cette volonté de structurer ce qu’on appelle des espaces communs de données sur des grandes verticales sectorielles, par exemple la santé environnement. En ce qui concerne ce projet, on avait le contexte national d’ouverture des données avec la la loi, le maire en 2016 et plus précisément sur le champ de la santé environnement juste pour donner un chiffre clé l’o. M s. A déclaré qu’environ vingt-trois pour cent % au niveau mondial et 25 % des pathologies. Peuvent être attribuées à l’effet de l’environnement sur la santé, que ce soit la pollution de l’air, le bruit, ce qui fait qu’il y a quand même un un gros enjeu de mieux qualifier Ben les risques sanitaires liés à l’environnement et dans le plan national santé environnement qui a été publié en 2021 Justement, un des axes consiste à améliorer les connaissances des liens entre la santé et l’environnement par la recherche et faciliter l’accès aux données existantes. Justement pour les acteurs de de la recherche et de l’expertise. Voilà donc c’est dans ce contexte-là que s’inscrit le le Green Data Forest. 

– Marc — 04:25 :

 Et son objectif enfin concrètement, ses missions vont vont être de quel type? 

– Marc — 04:29 :

 Alors le Green Data for health, il va avoir pour objectif d’améliorer la mobilisation et la valorisation de la donnée environnementale pour un usage en recherche, en santé environnement. Alors il faut dire que le patrimoine de la donnée environnementale est très riche en France. Il y a énormément de producteurs de données sur tous les champs, que ce soit pour qualifier l’état des milieux, pour qualifier les sources de nuisance par exemple. Mais actuellement, on a fait le constat que ces données étaient sous peu. Enfin vraiment très peu mobilisées. Voilà donc le Green Data Falls va avoir pour enjeu d’aider à lever les freins. La mobilisation de ce riche patrimoine de données d’accord donc on va chercher les différents acteurs qui les collectent. Ces données, ça va être des collectivités locales, des associations. 

– Marc — 05:11 :

 C’est très large en effet. Oui, dans les dans les besoins qu’on a identifié, il y avait en effet tout ce qui était la repérabilité, ce qu’on va appeler la découvrabilité de la donnée, donc comprendre quels sont les acteurs qui produisent et gèrent cette donnée, comment est ce qu’on fait pour y accéder? Et ensuite on va également toucher aux enjeux de qualité de la donnée. En effet, c’est très large, on va avoir soit des opérateurs qui produisent de la donnée. Soit des collectivités, des associations. Par exemple, si je pense à toutes les associations à agréer de qualité de l’air, les Alaska qui sont sur le territoire et qui font des mesures justement de de qualité de l’air et qui vont être très riches pour justement avoir de l’information sur l’impact de la qualité de l’air sur la santé par exemple. 

– Marc — 05:49 :

 Ok et alors donc, ces associations, ces collectivités, une fois qu’on les a convaincues qu’elles pouvaient partager ces données qui avaient vraiment une réelle valeur pour les citoyens de les partager? Qu’est ce qu’ils peuvent faire? Est ce qu’il y a une sorte de plateforme? Est ce qu’on répertorie les différentes sources de données? 

– Marc — 06:07 :

 Oui, alors initialement, le Green Data for health s’appelait le Green Data hub et à l’origine du texte de loi, on avait vocation à créer un hub de données, donc c’est à dire stocker toute la donnée environnementale qui était utile pour la santé environnement. Et on s’est vite aperçu que finalement, ces données sont déjà stockées dans des SI existants ou par les acteurs qui les détiennent en grande majorité en grande majorité également, du fait notamment des lois. Je parlais de la loi Lemaire tout à l’heure.. Ces données ont vocation à être ouverte, notamment parce qu elles contiennent des informations liées à l’environnement, ce qui fait qu’on est plutôt sur de l’Open data et nous la vocation du Green Data Flow, ça va être vraiment de recenser la donnée, avoir un endroit, un point d’entrée pour identifier tous les acteurs de la donnée quand même subissent quand même des données qui vont être à accès restreint, soit parce qu’elles contiennent de la donnée identifiante, soit parce que le producteur, pour le moment, ne l’a pas mise en open data parce qu’elle n’est pas de qualité suffisante. Ou voilà pour d’autres raisons. Nous, notre objectif c’est que quoi qu’il arrive de recenser la donnée, qu’elle soit ouverte ou non pour au moins savoir qu’elle existe. Et Ben faire avancer la recherche dans ce domaine. 

– Marc — 07:10 :

  •  Je parlais de qualité, est ce que vous filtrez les données qu’on vous propose? Est ce qu’il y a des critères pour pouvoir publier ces données et apparaître dans ce catalogue? Non alors non, on va pas filtrer la donnée, enfin il faut qu’elle rentre dans le périmètre alors le périmètre de la donnée utile pour la santé environnement peut être très large. On a même des données d’occupation du sol. Une forme. Vous avez demandé si les données de répartition des boulots en France pouvaient être intéressantes à intégrer? Parce que sur tous les sujets d’allergie, voilà. Enfin tout dépend de de la limite. Ce qu’on donne au périmètre de cette donnée utile. Après concernant la qualité, c’est surtout nous qui allons avoir une action dans la façon dont on va décrire la donnée en elle même, donc on va utiliser des métadonnées, donc ces informations descriptives qui vont permettre de qualifier assez généralement hein le le les informations géographiques, temporelles et on a rajouté une couche d’information liée à la santé, environnement, comprendre quels sont les agents physiques, biologiques et chimiques qui vont être mesurés par les contenus dans le jeu de données par exemple. Et ensuite on va pouvoir avoir des actions de montée en qualité de ces données via des initiatives qu’on lance grâce au GD 4H D’accord, 

– Marc — 08:15 :

 Et est ce que c’est uniquement de la donnée nationale ou est ce qu’il y avait des sources locales et et à ce moment-là comment on fait pour fournir une une donnée nationale à partir de plein de sources locales? 

– Marc — 08:24 :

 Alors c’est un vrai enjeu et ça va être notre chantier justement des des prochains mois. Là, initialement, on s’est vraiment concentrés sur de la donnée nationale. Il va y avoir des sources. Par exemple, si je prends les données de prélèvement de qualité de l’eau donc qui remontent des agences régionales de santé, on va avoir des prélèvements au niveau des territoires, mais qui vont être on va dire bancarisés. Au niveau national, on peut notamment les retrouver sur data gouv ou du coup sur notre site du Green Data for health. L’idée pour nous serait d’identifier aussi des données à enjeux pour les territoires et qui viennent des territoires. Et là on réfléchit à la façon dont on pourrait les valoriser sur notre plateforme, est ce qu’on valorise la donnée de chaque territoire? Est ce que pour chaque chercheur il y a un intérêt, est ce que ces données soient prêts? Agrégées est ce qu’il a besoin de la donnée très fine et comment est ce qu’après on met ses données là en valeur sur la plateforme? 

– Marc — 09:07 :

 Quelles ont été les grands travaux menés dans le cadre du Green Data For Health? Alors il y a eu beaucoup de choses qui se sont passées dans ces 18 mois d’incubation du projet. Je dirais que le premier gros travaux a été toute la phase d’investigation des besoins de l’écosystème de la recherche et plus largement de la santé environnement de comprendre là actuellement, qu’est ce qui bloque la mobilisation de ces données? Et dans les 3 grands besoins étaient, Premièrement, j’en ai parlé tout à l’heure de la repérabilité, comprendre où se trouve la donnée, qui sont les acteurs? La 2ème qui consiste plutôt en la qualité de la donnée. Faut savoir que la qualité de la donnée environnementale n’est pas souvent optimale. Pour être croisées avec des données de santé, notamment parce que la donnée environnementale la plupart du temps, est prélevée pour répondre à des réglementations ou à des objectifs qui sont tout autres que celui d’un croisement avec de la donnée sanitaire et enfin le besoin qui finalement était le plus prégnant, était celui de la synergie et d’une meilleure communication entre les acteurs, qu’il s’agisse des réutilisateurs, de la donnée avec les producteurs ou les réutilisateurs entre eux pour bah se réunir lors d’initiatives autour d’objectifs communs et ensuite au niveau des actions que l’on a menées, il y a eu la structuration de cette communauté qui a été très importante dès le démarrage. Et qui nous a permis de créer une offre de service qui est mise à disposition depuis un peu plus d’un an et donc on va avoir ce fameux catalogue de données qui recense actuellement 130 ressources et à vocation à à grossir. Donc vous pouvez le retrouver en ligne au GD 4 point gouv point f r. On va également avoir des outils d’appui juridique pour aider à la fois les producteurs à ouvrir les données et les réutilisateurs, à comprendre quels sont leurs droits et leurs devoirs face à cette donnée là, comment est ce qu’ils peuvent y accéder? Donc on va avoir des fiches de ressourceries juridiques en ligne qui vont donner les grands principes de la donnée environnementale. Et on a d’autres outils qu’on est en train de développer et qui devraient arriver prochainement. Et enfin, toutes les initiatives d’animation où là on a lancé un appel à projet pour accompagner des projets de recherche sur 18 mois pour mobiliser la donnée. Pour donner un exemple, on accompagne un projet qui vise à mener une étude écologique en île de France pour comprendre quel est l’impact du bruit sur le sommeil des individus. Et là donc, il y a beaucoup à faire pour identifier les bonnes données environnementales et comment les croiser avec les données de santé qui sont utiles sur ce territoire d’île de France. Et on a également lancé d’autres initiatives comme un challenge GD 4H Qui pour nous représente vraiment la richesse de l’écosystème à la fois des experts du numérique dans des profils data, DEV Designer, chef de projet avec des experts de la santé environnement. On a eu plus de 150 bénévoles sur un mois qui se sont mobilisés pour créer 15 outils permettant de monter en qualité la donnée environnementale. 

– Marc — 11:42 :

 Alors quel est l’intérêt d’un tel projet selon toi alors je dirais qu’il y a plusieurs enjeux. Le premier, j’en ai parlé, hein. C’était vraiment de structurer cette communauté, de mutualiser les efforts entre les les différents acteurs. Donc ça vraiment? Pour moi le le plus gros enjeu et on voit que ça fonctionne réellement et que l’écosystème est a vraiment envie de se rencontrer, de monter ces projets communs et d’aboutir à cet objectif qui est de d’aider à une meilleure valorisation. Mobilisation de cette donnée l’autre enjeu sur le projet, on s’en est vite rendu compte, c’est que je parlais tout à l’heure d’enjeux de la donnée comme levier pour adresser des des les politiques publiques du ministère dont la santé environnement. On a parlé de la stratégie nationale, Hein, France nation verte, on voit bien que typiquement, le Green Data Falls peut se positionner comme une sorte de démonstrateur ou de métrique à la fois en termes de gouvernance et d’offre de services. Pour mener des actions ou répondre aux enjeux de préservation de la biodiversité des écosystèmes, réduction de la pollution des milieux et ce qui est intéressant, c’est qu’on a vraiment acquis une légitimité auprès de l’écosystème de la santé environnement, justement parce qu’on traitait le sujet par le prisme de la donnée. Je pense que ça aurait été tout à fait différent si on avait tenté de de se positionner dans cet écosystème par le le prisme de l’expertise santé environnement. Et ensuite je voudrais juste apporter une précision sur la donnée comme levier. On m’a fait un retour l’autre jour en me disant oui mais il faudrait pas que les acteurs se cachent derrière la donnée en se disant qu’il faut avoir une donnée très fine et aboutie pour pouvoir agir à ce moment-là la donnée pourrait être considérée comme justement un un moyen d’inaction. Je voudrais dire que la donnée est partout. Enfin on parlait tout à l’heure des territoires. Enfin l’autre jour j’ai changé avec un territoire qui me disait mais nous on n’a pas forcément de base de données, on n’a pas de données hyper fines, je suis oui mais vous avez peut être je sais pas moi des documents Word, des enquêtes auprès des citoyens ou ce genre de choses qui peuvent être collectées et tout ça est de la donnée. Enfin un tweet c’est de la donnée ce qu’on écrit nous enfin. Un fichier PDF qui contient des informations, c’est de la donnée, donc tout est intéressant, tout est important à collecter, à capitaliser et à la fois sur les enjeux d’épidémiologie environnementale, donc plutôt accès recherche et pour un territoire qui vouloir je sais pas moi mener un diagnostic territorial en santé également. Voilà, tout est important. 

– Marc — 13:53 :

 Alors est ce que tu peux nous donner un ou plusieurs exemples concrets de projets, d’initiatives qui a été permis par cette réalisation? 

– Marc — 14:00 :

 Oui, alors tout à l’heure, je parlais par exemple de l’appel à projet, donc j’ai donné un exemple de projet de recherche. Donc on va également accompagner des projets de recherche. Sur les expositions multiples ou encore sur les bassins industriels par exemple, se dire quel est l’impact de la proximité d’un riverain à un bassin industriel français sur le challenge, par exemple un des projets? Bah le projet qui a gagné le le challenge des 4H consistait à répondre à l’enjeu d’évolution des contours géographiques des Iris au fil des années. Et donc ils ont créé une table de correspondance entre les différents millésimes des des Iris, ou en tout cas des contours géographiques des Iris. Entre 1999 et 2022 les Iris, je sais pas si c’est un découpage du territoire français de. 

– Marc — 14:44 :

 L’insee. Oui, tout à fait. Découpage territorial du territoire français de l’Insee et ce qui est intéressant, c’est qu’enfin, on pourrait se demander, OK très bien, mais en quoi est ce que cet outil là s’inscrit dans la santé, environnement ou dans les enjeux de santé environnement? Et bien on s’aperçoit qu’il s’agit cette table de correspondance s’agit d’un outil vraiment très important pour pouvoir utiliser la donnée environnementale à des fins de croisement avec de la donnée de santé. Et on voit qu’il y a plein d’outils qui paraissent, j’allais dire assez rudimentaires ou assez simples, qui toutefois permettent après de capitaliser sur cette donnée et d’et de passer à l’échelle des projets ou permettre de nouveaux projets. Et une dernière initiative également que l’on est en train de lancer, alors on s’est aperçu qu’oui, l’offre de services répond aux enjeux de la recherche et des experts en santé environnement, que ce soit par exemple des chercheurs de l’Inserm, du CNRS des chargés d’études, de l’ineris, de santé publique France ou autre. On s’est aperçu que de plus en plus, l’offre de services va avoir de réels enjeux ou apports pour les acteurs locaux, les acteurs privés mais également le citoyen. Et là on a une action de formation citoyenne autour de la donnant en santé environnement. Expliquer aux citoyens, à des, à des associations, à des élus de collectivités qu’oui, l’environnement va avoir un effet sur la santé humaine, animale et des écosystèmes. Comment est ce qu’on fait pour utiliser cette donnée à ces fins là pour montrer cette influence? En tout cas, cet impact sur la santé. Ouais donc ce modèle de formation sera bientôt délivré, en tout cas bientôt lancé d’ici la fin d’année 2023 alors quelles sont quels ont été les obstacles à surmonter dans vos travaux? 

– Marc — 16:20 :

 Alors je dirais que le principal obstacle, quand on a démarré le projet, était de bien identifier tous les acteurs de l’écosystème de la santé environnement, comme je le disais au début, hein, il y a assez peu de synergie entre ces acteurs là, ce qui fait qu’on avait du mal à identifier le périmètre très large de l’écosystème de la santé environnement et notamment au niveau de la recherche. Ce n’est pas toujours aisé, surtout au début du projet, d’identifier toutes les unités de recherche, tous les les acteurs qui vont avoir vraiment un réel enjeu sur ce champ là. Le 2ème enjeu était plutôt de concilier à la fois les besoins de la recherche. On parlait tout à l’heure d’épidémiologie environnementale. Avec les besoins des acteurs publics nationaux et territoriaux, on parlait des territoires qui vont avoir besoin de je sais pas, de réaliser des études d’impact en santé, des portraits territoires, des diagnostics territoriaux en santé, des acteurs nationaux qui vont porter des gros projets de bah en lien avec les politiques publiques actuelles. Donc ça c’était également un, je dirais, un enjeu et un autre. Je dirais pas qu’il y a un obstacle, c’est juste quelque chose qu’il faut avoir en tête et qui sera également un de nos enjeux. Là dans les dans les prochains mois, qui va être plutôt l’interfaçage avec toutes les les initiatives au niveau européen, au niveau international ou même au niveau français. Comment est ce qu’on articule au mieux toutes ces solutions de catalogage, et cetera. Et ça, c’est vraiment un travail qu’on mène. Au quotidien avec les initiatives au sein de l’ÉCOLAB, mais également avec d’autres initiatives, je pense par exemple à Data Gouv. 

– Marc — 17:46 :

 Comment ça s’interface data gouv et L Écolab est ce que tout ce qui est sur l’ecolab est sur data gouv? Est ce que. 

– Marc — 17:53 :

 Comme il s’agit en majorité de données ouvertes, tout ce qui est sur le Green data For health  et également sur d’autres solutions qu’on peut avoir à l’école, on a par exemple un catalogue de toutes les données de la transition écologique qui s’appelle écosphère, qui est en train d’etre structurée. Toutes ces données là ont vocation à être sur data gouv et par exemple sur le Green Data Forez. Elles sont en train de mettre en place un moissonnage. Pour bah avoir un flux automatisé récupéré automatiquement la donnée qui vient d’être à gouv sur le champ de la santé environnement. Alors rien n’empêchera d’avoir des données plus spécifiques à la santé environnement qui ne sont pas forcément ouvertes et que datago en tout cas dans l’immédiat, n’a peut-être pas vocation à recenser, mais l’idée serait que si on rencontre un acteur qui a des données en open data mais qui ne sont pas sur data gouv, qu’on lui dise Bah que la priorité pour lui est déjà de les mettre sur data Gouv pour qu’on puisse les valoriser sur notre site. 

– Marc — 18:43 :

 Qui peut proposer des datasets pour des 4H alors on va avoir tous les producteurs et gestionnaires de données publiques dans un premier temps et là on est en train de de réfléchir à l’intégration de données d’acteurs privés ou l’intégration de données privées à intérêt enfin d’intérêt général au niveau des données d’acteurs privés, on échange avec certaines entités en se disant est ce qu’il y a pas un lot de données que vous pourriez mettre à disposition en open data et qu’on pourrait valoriser sur la plateforme du Green data for health et qui permettraient de mener par exemple à votre plateforme ou l’utilisateur pourrait trouver d’autres données ou d’autres services que propose votre entité. Mais là, on est globalement principalement, enfin. On a un focus sur les producteurs de données publiques et données au niveau national et territorial. On a un parcours de réutilisation des données qui est également en cours d’implémentation. Donc ça, ça rejoint le sujet de la qualité de la donnée de se dire pour la santé environnement, quand j’identifie une donnée sur le catalogue du Green Data for health, Quelles sont les réutilisations qui sont possibles à partir de cette donnée là? Et donc là on va intégrer ces réutilisations qui vont permettre de comprendre enfin d’éviter en tout cas de d’avoir des biais de réinterprétation de la donnée. Donner des idées aussi de projets ou de de d’outils qui peuvent être réalisés à partir de la donnée oui. 

– Marc — 20:00 :

 Puis y a peut être un peu un effet aussi comme les avis sur Internet. Enfin, quand on a vu qu’il y a plein de gens qui avaient laissé un avis. On a tendance à se dire que c’est un bon produit, ou en tout cas que si y a moins de risques, le dataset c’est un peu pareil. Si y a beaucoup vu de réutilisation, on le voit sur data gouv quand y a beaucoup de de de réutilisation, on se dit y a peut être pas mal de richesse dans le data SET totalement et puis ce qui va être très important, c’est de dans cette réutilisation sous l’angle de l’usage hein, pour la santé environnement de lier cette réutilisation avec un data Paper ou la documentation qui va en tout cas permettre de de comprendre. On va peut être qu’y a eu un problème dans l’exploitation de la donnée initiale. Qu’est ce qui a été mis en place pour lever les freins à mobilisation de cette donnée? Est ce qu’il y a des petits outils en plus? Typiquement, je parlais tout à l’heure de la table de correspondance entre les différents Iris mais peut être qu’on va lier en fait une réutilisation avec cet outil là en disant Ben cet outil m’a été utile où j’aurais eu besoin de cet outil pour pouvoir aboutir à cette réutilisation. Voilà donc on on va toujours aller dans le sens d’une meilleure documentation pour un usage. Ben on va dire plus rigoureux de la donnée. 

– Marc — 21:02 :

 Alors qu’est ce qui selon toi doit être dit tout le temps à chaque interlocuteur que que que tu as? Et qui sera une évidence pour tout le monde. Dans 10 ans, 20 ans. 

– Marc — 21:12 :

 Je pense que déjà se dire que la donnée est en actif à forte valeur ajoutée, que ce soit dans la conduite du projet ou même on en parle régulièrement dans le lam, dans tous ces enjeux d’évaluation des politiques publiques d’évaluation de l’impact, de se dire que même depuis le démarrage du projet, c’est enfin c’est important d’identifier les bonnes données, de pouvoir les quantifier, les utiliser de sorte avoir un bon suivi du projet, une bonne mise en œuvre de ce projet là et surtout pouvoir qualifier l’impact à chaque étape du projet. Mais plus globalement, voilà, je dirais que la la donnée a vraiment une forte valeur ajoutée, notamment pour la conduite. On le voit hein, de nos politiques publiques, notamment pour le ministère de de l’écologie où il y a beaucoup à faire de forts enjeux dans les prochaines années si on veut justement arriver aux objectifs que l’on s’est fixés. Et un autre apprentissage donc du projet du Green Data for health et également des projets Menaecolam tous projets autour de l’innovation, du numérique, de la donnée à mon sens, doit être porté par une communauté d’acteurs et cette communauté d’acteurs doit être structurée dès le début du projet. Pour permettre Ben d’identifier les, les, les besoins les plus prégnants, développer une solution et nos 2 services. Un produit qui sera le plus à même de répondre à ces besoins là et avoir des utilisateurs des contributeurs aux solutions qui vont être mises en place. 

– Marc — 22:29 :

 Alors qu’est ce que tu préfères dans dans ce métier que tu as aujourd’hui? 

– Marc — 22:32 :

 Alors je j’allais dire, sauver le monde, c’est un peu la la mission qu’on se donne, hein, quand on est au ministère de l’écologie. Mais moi j’ai vraiment cette sensation. Mais non, quand je me lève tous les matins, quand j’avance sur les travaux du Green Data Forez ou d’autres projets qu’on porte à l’école. D’avoir un impact positif par rapport à la transition écologique, à la transition de notre société plus globalement et Ce que j’aime dans le projet du Green Data Fored, c’est d’avoir les les retours de d’acteurs de la santé environnement, de grosses entités de santé publique qui nous disent ça faisait 15 ans qu’on attendait une offre de service comme celle-ci On pensait pas qu’elle allait voir le jour. Voilà ce type de retour est vraiment très plaisant de d’avoir l’impression de vraiment être utile et d’apporter une brique. Enfin en tout cas une solution au au problème qui ont été identifiés depuis plusieurs années. Ce que j’aime aussi dans la démarche d’un Lab comme l’ecolab, ça va être ce ce côté apprentis sorciers où on mène des expérimentations, par exemple sur le Green Data for health l’appel à projets qui vise à croiser les données environnementales et de santé. Il s’agit d’un des premiers appels à projets, notamment en France, qui permet d’opérer ce croisement et donc on se pose plein de questions de se dire comment est ce qu’on fait pour croiser ces données? Quelle est la maille la plus fine commune entre les données environnementales et de santé? Peut être que des projets n’aboutiront pas dans comme ils l’auraient souhaité, ou peut être qu’on va trouver des solutions qui n’avaient pas identifiées au départ. Mais en tout cas, on sait qu’on on avance, on expérimente, on cherche des solutions et c’est vraiment ce qui est stimulant au quotidien. Et puis plus largement, je dirais que via les méthodes, les démarches d’innovation, de design, on a tout l’aspect sciences comportementales également au sein du Lam. J’aime me dire qu’on a cette page blanche ou cette confiance qui nous est donnée pour traiter de sujet à fort enjeu, hein? Que sont les politiques publiques du ministère de l’écologie? Et voilà avoir cette liberté et de pouvoir mettre ma pratique par exemple du design au service de l’élaboration des politiques publiques jusqu’à leur mise en œuvre. 

– Marc — 24:22 :

 Alors si c’était à refaire, est ce que tu changerais quelque chose? 

– Marc — 24:26 :

 Franchement, avec du recul, je pense que non, c’est un peu prétentieux de ma part, mais je me dis que toutes les erreurs sont bonnes à bah à commettre et qu’on apprend de de ces erreurs. Là je vois par exemple sur le projet du Green Data for health toutes les choses qui ont pu être un peu plus compliquées qui ont pu ne pas fonctionner nous ont appris beaucoup de choses sur la façon de mener le projet, sur les solutions qui fonctionnent ou pas par rapport aux objectifs visés. Chose que je changerai et notamment le démarrage du projet. Comme je disais le l’en tout cas le l’objectif qui avait été visé n’était pas le bon par rapport aux besoins de la Communauté et on voit bien que c’est en testant les choses qu’on arrive à rectifier le tir. Et maintenant on est enfin le Green data hub, donc exactement. 

– Marc — 25:09 :

 Ouais, ouais. 

– Marc — 25:09 :

 Donc le le changement entre Green Data hub et Green Data for for health, c’est l’abandon d’une plateforme d’hébergement et le recentrage sur les données de santé enfin lié au lié à la santé, c’est ça oui, 

– Marc — 25:20 :

 Alors l’idée était vraiment de se dire au démarrage, on va créer un hub qui va stocker la donnée environnementale pour communiquer avec la plateforme des données de santé qui est le web datum en France. Et que les 2 plateformes pourront communiquer. Sauf qu’on s’aperçoit avec l’update qui est notre partenaire privilégié. On collabore énormément avec eux que finalement, la donnée de santé n’a pas les mêmes. Enfin les mêmes propriétés que la donnée environnementale. Il y a vraiment ces enjeux de sécurisation de la donnée, de stockage de la donnée. Et c’est vrai que le fait de réorienter le Green Data Forest de se dire Bah on a pas besoin de stocker de la donnée, on n’a pas forcément besoin d’une infrastructure sécurisée comme peut le proposer le pardon, le F data ou le centre d’accès sécurisé à la donnée. Ouais, tous ces éléments là ont fait qu’on a réorienté la commande initiale pour aboutir à un projet qui convient totalement aux besoins d’en tout cas je l’espère, mais de la Communauté. 

– Marc — 26:11 :

 Et alors pourquoi ce centrage sur la donnée de santé? Est ce que ça a permis de de convaincre des parties prenantes de se recentrer sur la santé? Pourquoi ne pas être avoir gardé l’écologie au sens large? 

– Marc — 26:23 :

 Parce qu’on est vraiment, je pense, sur le le sujet de la donnée au service d’un usage spécifique et pour moi par exemple, on le voit sur le le projet Ecosferme dont je parlais tout à l’heure, qui est une plateforme des données de la transition écologique. Même eux mènent cette réflexion de se dire, en fonction des usages, on va pas utiliser les mêmes données ou de la même façon et ils sont en train de structurer ce qu’ils ont appelé des bouquets données, c’est se dire sur un un sujet par exemple, je sais pas. Un territoire qui veut faire un diagnostic ou mettre en place une opération d’aménagement sur le territoire, quelles sont toutes les données qui vont être utiles, par exemple pour un plan d’urbanisme? On voit bien qu’un usage par exemple une même donnée, que ce soit pour monter un projet d’urbanisme, de mobilité ou de santé environnement, on va pas du tout avoir les mêmes usages et les mêmes enjeux. Voilà donc je dirais que c’est une première réponse et la 2ème, notamment parce que le projet s’inscrit dans le plan national santé environnement et qui traitait donc initialement de la santé. 

– Marc — 27:19 :

 D’accord, alors c’est quoi les les étapes suivantes pour le Green Data for for health? 

– Marc — 27:23 :

 Eh bien, je dirais faire grossir l’ambition. En tout cas, les initiatives qui sont portées par le Green Data for health, on aimerait bien reproduire un challenge. Gd 4H lancer une 2ème vague d’un appel à projet sur des thématiques qui ont été priorisées, hein par l’écosystème? On aimerait recenser plus de données, on parlait des données locales, y a une grande richesse aussi de données en dehors du niveau national, hein. Au niveau européen, des données d’acteurs privés, on va travailler sur le catalogue de données pour l’enrichir, apporter toujours plus d’informations sur la donnée qui est recensée. On a aussi l’enjeu de s’inscrire dans la le concept One Health donc, qui est le concept, une seule santé qui vise à dire, voilà que la santé ne se qualifie pas seulement via la santé humaine, mais qu’il faut aussi considérer la santé animale, la santé. Des végétaux et l’état de l’environnement. On a vraiment vocation à s’inscrire dans ce concept là en intégrant des par exemple des projets via un appel à projet de de recherche par exemple et se dire comment est ce qu’on peut croiser ces différentes données issues de ces 4 santé et plus largement de contribuer à l’identification de données, à produire sur des champs à fort enjeu et contribuer toujours à la mise en open data des données? Ça serait vraiment notre objectif d’arriver à avoir une action encore plus forte sur ces 2 objectifs. Il y a aussi un autre objectif qui provenait de toute la phase d’investigation où des acteurs, notamment des agences et opérateurs, nous avaient fait remonter ce besoin en temps de crise lorsqu’il y a des incidents par exemple, je pense à l’usine du Lubrizol de se dire comment est ce qu’on se met en état de marche assez rapidement pour avoir toutes les données à disposition pour pouvoir réaliser des études et même créer de l’information, produire de l’information pour le citoyen dans ces temps de crise, pourquoi pas? Cela pourrait également être une action amener par le Green Data for health par la suite. 

– Marc — 29:14 :

 Oui, parce qu’un des enjeux de toutes ces données, c’est qu elles sont évolutives. C’est aussi là peut être que vous avez intérêt à ne pas les stocker vous même c’est qu’il y a des publications régulières de mise à jour de toutes ces données dans le temps et qu’elles sont utiles que parce qu’on on les observe régulièrement, on va dire un screenshot à un instant TA beaucoup moins de valeur que cette évolution en l’occurrence qui est d’une crise. Pouvoir faire des analyses d’impact d’un événement local oui. 

– Marc — 29:42 :

 Et puis il y a aussi ce sujet, bah on on rejoint le sujet de la synergie de se dire. Effectivement, il y a une très grande richesse de données, notamment dans ce type de situation à l’instant T qui sont collectées et qui doivent être analysées. Et donc comment est ce qu’on aide tous ces acteurs là à se mettre en synergie et à mieux communiquer sur les données, sur les analyses qui vont en produire? Il y a aussi un aspect sur le stockage. Pourquoi est ce qu’au-delà du fait de se dire que les données sont déjà stockées dans des SI existants? Ou voilà on n’a pas à identifier vraiment de problématique à ce niveau-là Il y avait aussi l’aspect frugalité. Enfin on a quand meme au ministère de l’écologie donc de se dire. Voilà comment est ce qu’on peut trouver la solution la plus frugale possible, et alors. 

– Marc — 30:24 :

 Est ce qu’on pourrait imaginer que bah sur des sujets on va dire brûlants d’actualité. Bon je pense au au glyphosate à des EST ce qu’on pourrait imaginer que les sources, les journalistes, les politiciens, que tout le monde aille puiser finalement dans le Green Data for else? À ce niveau-là pour débattre? 

– Marc — 30:43 :

 Alors quand je disais tout à l’heure qu’au delà de la recherche, on s’aperçoit qu’on va aussi avoir un intérêt pour d’autres acteurs, les journalistes par exemple en font partie ou les dessineurs, c’est vrai que tous nos projets, notamment au niveau de l’écolab hein, ont vraiment cet cet objectif d’aider à la décision. Je dirais qu’il y a toutefois une des précautions à prendre dans ce que l’on va publier également sur le Green Data for health par exemple. Je parlais tout à l’heure de mieux décrire la donnée, c’est pour ça qu’il est vraiment important de bien documenter ce qui est recensé sur le site pour éviter des biais d’interprétation, notamment tout à l’heure, je parlais des citoyens quand on produit des outils qui vont permettre de dire je sais pas, par exemple si on parle des expositions d’une population à un polluant. Quels sont les polluants dans les aliments? Et cetera. Il faut vraiment bien documenter pour éviter une une interprétation qui pourrait être, on va dire hasardeuse par un réutilisateur. 

– Marc — 31:35 :

 Ouais, on cherche à faire le Buzz et finalement on raconte oui, puis surtout enfin des messages qui pourraient à l’encontre des messages de santé publique au niveau national. 

– Marc — 31:45 :

 Alors, quel invité est-ce que tu aimerais entendre dans un prochain épisode de data driven One one? 

– Marc — 31:49 :

 Alors, s’il n’a pas d’ores et déjà été invité, je pense que Théo Alves da Costa serait un candidat extrêmement intéressant alors. Il se décrit lui même de Geeks activiste Théo, c’est une une personne. Je dirais incroyable que j’ai rencontrée lors d’un projet qu’on menait à l’ecolam qui consistait à créer une plateforme pour centraliser les aides publiques pour les entreprises pour qu’elles puissent mener des actions de transition écologique. Et Théo, donc, qui est cofondateur de Data for Good donc, qui est une association qui vise à bah à fédérer, on va dire un pool de bénévoles plutôt profil autour de la data, Data Scientist Analyst ingénieur. Il y a également des développeurs, des designers et il lance des saisons pour accompagner des entités publiques privées à mener des projets. Et donc ce projet là notamment avait bénéficié de l’aide de ses bénévoles et au-delà de ça CO il a vraiment pour mission de mettre la data au service des transitions sociales et écologiques. Également de questionner notre rapport à la technologie et ses dérives et il a notamment eu l’occasion de mettre en place une sorte de chat GPT du rapport du GIEC qui s’appelle climate QNA et qui est un outil qui va permettre, grâce à l’i.. A de répondre de manière fiable et pédagogique à des questions relatives au climat. Et rien que pour ça, je trouve que ça serait chouette de l’entendre. 

– Marc — 33:14 :

 Eh Ben merci pour la recommandation. Merci Marie. 

– Marc — 33:17 :

 Merci. 

– Marc — 33:18 :

 Vous venez d’entendre Marie Raymond Daret, chef de projet design et innovation au sein de l’Ecolab sur Data driven One. Oh One. Merci d’avoir écouté.