LA PÉDAGOGIE DE LA DATA

Pédagogie de la data : Ils ont voulu développer une petite plateforme de test pour le recrutement en Data Science et ils ont fini par créer un énorme organisme de formation continue en data.

Charles Sutton, CTO de DataScientest, est l’invité dans l’épisode 6 de Data Driven 101.

Il nous partage le recul que lui offre sa position d’entrepreneur qui a vu passer plus de 7000 apprenants :

👉 Quelle place pour les autodidactes dans le monde de la Data ?

👉 Comment s’adapter efficacement aux profils très différents qui souhaitent se former ?

👉 Comment rester au courant des pratiques d’entreprise dans ce monde en constante évolution ?

La pédagogie de la data : Charles Sutton

– Marc — 00:49 :  Aujourd’hui, je reçois Charles Sutton CTO de datascientest après une formation à Dauphine polytechnique et Hermione, il a une première expérience entrepreneuriale dans le Conseil avec wati BC Data.. Et là, en 2017 datascientest un organisme de formation continue en data qui forme à divers métiers, data Scientist Analyst, Engineers, et cetera. 5 ans d’existence et 7000 Alumnis. Des centaines de promotions chaque mois. C’est aujourd’hui le Leader en France, en Allemagne, en Espagne et au Canada de la formation continue en ligne en data. Bonjour Charles. 

– Charles — 1:41 :

 Bonjour Marc et merci de me recevoir. 

– Marc — 1:45 :

 Mais avec grand plaisir. Alors Data Scientist, est-ce que tu peux nous en dire un peu plus sur qu’est-ce que c’est éventuellement, comment est née cette boîte ? 

– Charles — 1:49 :

 Effectivement donc data scientest, aujourd’hui, c’est une centaine de personnes. On est leader dans la formation métier de la data mais à l’origine et d’où le nom de dataScientest on était une plateforme dédiée au skill assessment et pour la petite anecdote, on avait créé donc une plateforme pour tester les gens dans le milieu de la data Science. On est à ce moment-là à peu près en 2017 qui à une époque où tout le monde est data Scientist et personne n’est data Scientist en même temps. Et fondamentalement, on n’a pas trouvé de marché sur ce produit, à part sur des entreprises qui avaient énormément de candidats, notamment des des supers cabinets de Conseil en stratégie et on a du coup pivoté vers de la formation et on parlera peut-être un peu plus tard de l’histoire de ce pivot, 

– Marc — 02:26 :

 Alors, l’état des lieux sur le besoin de formation. C’est lequel? Celui que vous avez fait en 2017 

-Charles – 02:31

Alors justement, pour poursuivre l’anecdote. Ce qui s’est passé en 2017 c’est qu’on a réussi à vendre ce produit à un premier client qui nous avait demandé, je peux le citer : C’est le BCG que le Boston Consulting Group, qui est  un cabinet de conseil en stratégie qui recevait énormément de candidatures pour les métiers de data Scientist et qui voulait développer son activité. En fait, c’est une entreprise qui est un peu atypique, c’est pas une entreprise moyenne. Et puis quand on a ensuite voulu vendre cette plateforme de skill assessment à d’autres clients, eux sont venus nous voir avec le problème inverse, on était dans une phase de pénurie, hein de métier de la data et ils nous ont dit, écoutez, nous, on a 10 postes ouverts, on a 2 candidats, on va pas les tester. En plus, c’est un peu un frein au recrutement. Par contre, notre plateforme est super, si on pouvait en faire de la formation dessus. Pour dire un petit mot de la plateforme, c’est une plateforme très expérientielle dans le sens où vous pouvez coder dans notre cloud pour les détails architecturaux et dans lesquels typiquement, Ben on voulait d’abord tester. Puis désormais, on a fait une formation avec Python, peut-être aussi pour prendre un petit peu de recul en 2017 de la formation en ligne, c’est moins évident. On était avant le COVID, c’était pas forcément perçu comme la qualité, c’était des taux de complétion très bas et c’était une orientation souvent académique avec l’émergence de coursera, hein. À cette époque là ou un petit peu avant. Et donc le besoin en formation, concrètement, on a énormément d’entreprises en France qui amorcent leur transition data. Et qui nous disent “on est en pénurie de profils dans la data Science”. Ils étaient même dans une phase où ils définissaient eux, Qu’est ce que c’était la data au sens large Pour eux, leur stratégie data?Et quels étaient leurs besoins en compétences. Et donc le premier client qu’on a rencontré, c’était le groupe Covéa qui est un grand groupe d’assurance MAAF MAA GMF ça devrait plus parler à ceux qui nous écoutent. Eux-mêmes, nous disent” Écoutez, nous, on a des gens en multi-sites” . En fait historiquement, l’assurance c’est à Niort, Romans et cetera, et faire une formation en data science, c’est très compliqué pour nous parce faut ramener tout le monde à Paris, donc y a un problème d’espace et de logistique. Il y a un problème de temps parce que voilà, il faut leur bloquer 2 jours ou 3 jours consécutifs. Et aussi on avait un problème tout bête d’IT, qui est que ben installer Python sur 1 PC dans le monde de l’assurance, ça prend 1-2 à 3 mois et ils nous ont dit “vous avez votre plateforme, on pourrait résoudre les 3 en même temps” puisque…je pourrais expliquer un petit peu, comment est notre ADN pédagogique, mais nous notre formation est principalement en ligne, en asynchrone, ça veut dire les en une grande partie de la formation se fait en asynchrone donc on avait plus cette problématique de temps, en ligne donc on avait plus trop cette problématique d’espace. Et puis enfin, sur la partie déployabilité au sein du B to B où là on a commencé, on n’a pas eu de problème parce que c’était notre plateforme et voyez le un petit peu comme un Netflix ou Facebook vous connectez, vous avez accès, mais on n’utilise pas les ressources de l’ordinateur pour calculer et faire des modèles. 

– Marc — 05:06 :

 Et alors, comment on apprend sur Datascientest c’est quoi la méthode pédagogique? 

– Charles — 05:10 :

 Alors ça, c’est des questions qu’on s’est posées très tôt. Bon avant toute chose aussi, c’est ce pivot. Là on l’avait bien réfléchi parce qu’on entre dans une posture, on va dire d’enseignement ou de formation. C’est quelque chose qu’il faut absolument vouloir,   du moins si on veut délivrer de la qualité. Ce qui a été le le principal objectif dès le début, dès lors qu’on a fait ce pivot,. La à posteriori, si je devais définir donc la méthode pédagogique et l’ADN qui est aujourd’hui fait foi, hein, dès lors qu’on lance des produits et des formations, c’est que Bah tout d’abord on a un ADN qui se veut professionnel, ça c’est assez atypique dans le monde de la formation en boot camp, sur des sujets de la tech de commencer dans le B to B, C’est quelque chose d’assez unique, donc nous, on souhaitait tout de suite former des professionnels à des compétences professionnelles fortes. Ça vient initialement de ce que j’ai pu dire avec la rencontre du groupe Covéa à l’origine. Ensuite, on a des critères d’efficience, dans le sens où bah les professionnels qu’on va former, ils sont en ressources de temps limités très souvent, il va falloir leur apprendre un maximum de choses en un minimum de temps sans jamais vulgariser. Et c’est là là subtilité. Et enfin, c’est un parti pris qu’on avait chez data Scienctest, c’est une pédagogie la plus active possible à cela.une espèce de combinaison un peu mutuelle en des savoirs-faire pédagogiques, c’est à créer des cours de qualité, un environnement qui serait un petit peu aux besoins des entreprises. Et en parallèle, un outil technologique qui est avec une certaine synergie entre ces 2 réussites permettrait de faire une expérience de formation qui est assez unique. Et aujourd’hui, qu’est-ce que ça donne ? On va dire dans l’expérience d’apprentissage, c’est bah des formations qui sont toujours en groupe, ça se fait toujours en campus inversé, c’est à dire que vous avez 80 % de la formation qui se fait en asynchrone. L’outil plateforme, c’est un peu un outil central du dispositif, sans être suffisant à la bonne réussite du dispositif pédagogique. On ajoute à cela ce que l’on appelle, la validation continue, c’est à dire que tous les mois, si vous faites de la formation continue ou toutes les semaines si vous faites un boot camp, vous devez valider des évaluations de programmation individuellement ou vous faites des livrables sur des projets Fil rouge qui accompagnent votre formation. Justement, le projet Fil rouge est quelque chose sur lequel on met beaucoup d’importance et d’intérêt, parce que c’est ce qui permet de ressentir une expérience de data Scientist où Data Analyst ou de Data Engineer sur le cours que vous faites et qui vient aussi justifier par exemple, d’une première expérience, quelle que soit votre profil, Le dernier point qui est assez important, c’est qu’on a mis le paquet sur tout ce qui est l’expérience utilisateur. Et le support premium ,ce qu’on appelle en internz, il y a une vraie volonté d’accompagner les étudiants. Le le gros billet qui avait sur la formation en ligne et qui existe en fait toujours sur les plateformes massivement distribuées, donc les MOOC, les plateformes qui vous proposent des cours sur un petit peu tous les sujets du cloud ou de la data ou des compétences tech, c’est qu’on a des taux de complétion qui étaient extrêmement bas. Pour donner à une stat, Je crois que coursera revendiquée entre 10 et 20 % de taux de complétion de leur formation à l’époque où on s’était lancé. Là où nous aujourd’hui et  historiquement, on tient des taux de complétion qui vont de 95 à 100 % selon les produits, les comptes et cetera. Alors ça tombe pas par hasard, c’est effectivement qu’autour de l’asynchrone, il y a du synchrone qui se compose en général par des masterclass, des cours magistraux que l’on fournit au groupe, justement, du mentorat, projet qu’on a pu parler et toute une équipe de customer care qui accompagne les utilisateurs à tout moment de leur formation pour s’assurer que tout va bien. Il y a aussi une sélection à l’entrée, ça c’est important pour s’assurer que les gens sont bien au bon endroit et donc selon les produits de formation que l’on a, vous allez avoir des prérequis en général académique et un test de skill assessment qui vient bien valider que vous êtes bien positionné pour la formation

– Marc — 08:09 :

 Le test de skill assessment, c’était votre business au début, vous avez changé. C’est encore possible d’utiliser ça pour tester ces data scientist ?

– Charles — 08:15 :

 C’est tout à fait possible d’utiliser ça. Pour la petite anecdote donc data Scientest effectivement c’était donc comme son nom l’indique, une entreprise qui visait à tester les gens. Puis aussi une petite anecdote culturelle, qui peut être marrante pour ceux qui nous écoutent, c’est que à l’origine on voulait comme logo un sphinx, ce qui semble être en général la réponse majoritaire quand on demande aux gens à quoi ressemble notre logo pourquoi? Parce que dans la mythologie et pour les générations plus récentes avec Harry Potter 4, vous verrez que c’est le sphinx qui laisse passer ou pas quand vous avez une bonne réponse, donc c’était un peu ça l’idée et à l’époque, on avait pas vu que c’est pas du tout un sphinx que le designer qu’on avait pris qui nous avait livré et pour anecdote s’appelle un chérubin. Alors moi aussi je suis tombé de haut quand j’ai appris ça et peut-être un petit clin d’œil à un Monsieur Rocheman la Société générale qui nous l’avait fait remarquer et vous verrez en fait, c’est un mix entre un lion, un aigle, un roi, et cetera. Et finalement on l’aime bien ce chérubin, donc on l’a gardé comme logo, donc ça c’était pour l’anecdote. Ensuite, pour revenir sur le Skill Assessment. Au début c’était, on a gardé cette technologie pour évaluer les profils en fin de formation, donc faut imaginer. Je vous dis que la plateforme est expérientielle, faut imaginer que c’est des notebook sur lequel vous allez coder dans lequel c’est des use case de data science que vous résolvez de manière assez didactique. Et puis en fait, une fois que vous avez fini votre apprentissage, il y a une évaluation chronométrée, sur lesquels on va vous évaluer et qui reprend exactement la même technologie de classement. Pour l’anecdote, les comptes avec qui on a travaillé en formation, donc les banques, assurances, l’énergie et cetera,  en B to B, c’était finalement un second produit qui nous ont demandé, une fois que leur maturité data, elle a évolué et on a fait ce produit, de skill assessment. Pour l’anecdote aussi avec le BCG l’aventure avait continué, on avait fait pas mal de tests d’abord pour eux. Et puis in fine, ils nous distribuaient sur dans l’accompagnement des comptes dans leur transformation data, essentiellement à l’étranger.

– Marc — 09:57 :

C ‘est quoi les profils qui viennent se former sur data scientest? 

– Charles — 10:00 :

 Alors, comme j’ai pu dire, selon les produits, vous allez avoir différents niveaux de prérequis. Peut-être déjà à l’initiative, qui sont ces profils qui viennent se former? À l’origine, vous avez souvent des professionnels, c’est pas une cible, on va dire initiale où d’étudiants qui vient souvent des gens qui ont déjà validé des diplômes qui sont dans leur carrière, donc j’ai réglage médian et autour de 30, 35 ans pour nos étudiants, des gens qui veulent surtout le dénominateur commun de tous les apprenants data Scientist, c’est qu’ils veulent affaire une transformation de leur carrière, un boost. Alors certains sont en poste et ils veulent peut-être amplifier leurs connaissances avec les techniques de machine learning, data science. Certains sont au sein d’une entreprise qui veut financer leur formation pour les faire évoluer. On va voir des particuliers en poste ou en recherche d’emploi qui vont vouloir s’armer de ces nouvelles compétences pour aller vers de nouveaux métiers, data Scientist, Data Analyst, Data Engineer. Le vrai dénominateur commun, c’est que c’est pour tous un point d’inflexion dans leur carrière, en tout cas qu’ils souhaitent amorcer et qui dans la pratique est bien réalisée à l’issue des formations. Donc ça, c’est le point commun, bien sûr, avec ça, il faut une forte appétence pour l’analytique ou la data science, le machine learning. Et l’idée aussi, des tests de positionnement que l’on a en début de formation, c’est de tester bien sûr. Est-ce qu’on a bien les bons prérequis académiques? et aussi la motivation, 100 % des profils qui viennent chez nous sont accueillis, donc on appelle un conseiller pédagogique ce qu’on va plutôt préférer, c’est travailler tout de suite avec des profils motivés et bien positionnés pour aller chercher beaucoup de valeur pour eux, pour nous et pour la data science en général. 

– Marc — 11:25:

 Comment on filtre la motivation? 

– Charles — 11:28 :

 Alors ça, c’est l’excellente question, c’est nos conseillers pédagogiques sont hyper rodés à l’exercice. Déjà c’est essayer de comprendre pourquoi ils entreprennent cette démarche de se former. Est-ce que c’était juste par simple curiosité? Est-ce que c’est parce que quelqu’un leur a conseillé, est-ce qu’au fond, ce qu’on va beaucoup regarder, c’est Est-ce que c’est quelque chose qui va le faire pour leur carrière et qu’est-ce qu’ils vont faire après? Alors bien sûr, on ne va jamais empêcher quelqu’un qui va absolument s’inscrire et qui, au niveau académique, de s’inscrire, mais on va toujours le ramener vers une compréhension du pourquoi et pourquoi il veut faire ça.

– Marc — 11:58 :

 Oui, parce que d’un côté, on a des entreprises qui veulent former leurs éléments et puis de l’autre, vous avez des particuliers qui ;tu parlais de de financement par le compte personnel, de formation ; qui j’imagine qu’ils viennent se former pour se réorienter complètement après la fin d’un d’un premier emploi. Ce genre de choses. 

– Charles — 12:15 :

 C’est exactement ça. Pour l’anecdote, c’est vrai qu’on a commencé en B to B, j’ai pas peut être précisé comment on a switché vers les particuliers, à ouvert les particuliers. Je pense que tout le monde le devine un peu, mais c’est en 2020 dès lors qu’il y a eu les confinements et le COVID en France.  Il faut imaginer que nous, toute notre croissance, a été gelée, voire abattue sur le B to B par le COVID, c’est à dire que l’ensemble des cycles de vente que l’on avait qui sont très longs B, ont été interrompus, avortées où gelées en mars 2020 ou plutôt en mai 2020 quand on a commencé à reécrire des mails. Et puis c’est là où on s’est dit, Bah pourquoi pas lancer les particuliers? Effectivement, en France, il y a une chance énorme qui est que, il y a énormément de dispositifs qui sont là pour soutenir les particuliers qui souhaitent se former. En numéro un, qui n’a pas forcément bonne presse aujourd’hui mais qui pourtant est redoutable : c’’est le compte personnel de formation ou pour ceux qui nous écoutent, vous devez sûrement le savoir dès lors que vous travaillez, vous cotisez sur votre compte personnel qui vous permet ensuite d’être mobilisé pour suivre des formations. Mais y’ a pas que ces types de dispositifs. Historiquement, on est un grand partenaire du pôle emploi et ce même avant le COVID où vous avez des des souvent pour ceux qui sont en recherche d’emploi, il y a des financements qui sont existants avec des financements régionaux, y a énormément de financements possibles, ça sur la partie on va dire B to C. Et puis aujourd’hui on a un maillage qui est assez complet aujourd’hui. Je dirais qu’on a vraiment 4 cibles, on va avoir les B to B gros qui vont faire des promos en intra, donc ça c’est ce que j’ai pu citer plus tôt. On va avoir ensuite des des plus petits B to B donc c’est des PME ça peut être aussi des B qui arrivent pas trop à se coordonner pour créer des classes entières, eux vont faire ce qu’on appelle de l’Inter entreprise. Il y a des classes en Inter entreprise, y a les particuliers qui veulent se former et enfin on va accompagner des gens dans le retour à l’emploi

– Marc — 13:53 :

 D’accord, alors, la data Science c’est de la Computer Science d’un côté et puis c’est des maths de de l’autre, notamment, comment est-ce qu’on apprend les maths sur une formation en ligne? 

– Charles — 14:04 :

 C’est une excellente question. Tout d’abord pour revenir donc sur le campus inversé. Qui dit campus inversé d’il y a une partie, alors aujourd’hui, on appelle en asynchrone et en synchrone alors ça peut ne pas forcément parler à tout le monde. Avant le COVID on disait en ligne, en présentiel, alors il faut savoir aujourd’hui, 100 % de formations sont en ligne. Ça veut dire que vous vous déplacez, jamais, vous pouvez travailler depuis chez vous voilà la synchrone, c’est un temps, vous êtes avec vous-même, il y a une plateforme qui est là sur lequel vous accompagnez et le synchrone, c’est là où il y a des gens qui sont là pour vous accompagner. Donc typiquement nous y a une vraie réflexion à chaque fois qu’on lance un produit sur, qu’est ce qui passe en asynchrone? Qu’est-ce qui passe en synchrone? Il y a 2 curseurs clés pour définir ça. Y a déjà la cible. Je donne un exemple pour un même produit, par exemple Data Scientist, si demain on est amené à distribuer je sais pas à des étudiants, on va peut-être probablement mettre plus de synchrone, parce qu’on est conscient que sur cette cible là ça va être plus bénéfique pédagogiquement. L’autre point, c’est le produit en lui-même. Plus vous allez avoir des produits accessibles, plus il va y avoir du synchrone généralement et à contrario c’est ce que je voulais illustrer, plus on va aller sur des produits pointus par exemple, Je prends l’exemple de notre cursus Deep learning engineer ou vous allez apprendre des choses très avancées en Computer Vision et LP. Généralement, on va mettre  le taux de synchrone minimal que l’on a, c’est 20 %. Et voilà donc ça, c’est pour répondre maintenant directement à la question qui a été posée sur comment on apprend les maths, comment on apprend les sujets plus fondamentaux. Nous, il va falloir penser qu’il y a une partie qui va être validée en prérequis. Typiquement pour les gens qui rentrent en cursus Data Scientist, on va demander un bac plus 5 scientifique donc on va pas reprendre les bases d’algèbre, de proba de stats où d’analyse qu’ils auront vu généralement pendant en licence ou pendant leur scolarité. On va quand même vérifier avec le test de positionnement que c’est toujours frais et à jour parce que parfois ça, pour certains ça fait 20/25 ans qui sont sortis des bancs de l’université, donc ça c’est le premier point. Et pour tout le reste dès lors qu’on va entrer soit sur du scientifique plus pointu, soit sur des notions plus fondamentales, on va passer ça en synchrone donc désormais ça va peut-être pour les master class et qu’on magistraux et cetera. Et dans la formation asynchrone que votre information on va plutôt orienter et on va mettre des plus l’accent sur la pratique, la mise en pratique.Dans tous les cas on vulgarisé jamais. Et aussi il faut savoir qu’il y a une énorme panoplie de ce qu’on appelle des matériels, donc des choses en plus qui vont accompagner la formation. ça peut être ce qu’on appelle les fameuses cheat sheet, espèces de fiches l’antisèche, vous savez faire plein de choses qui peuvent aussi bien être scientifiques pour faire des rappels probas stats, que techniques pour rappeler les principales façons de programmer avec Python par exemple, voilà. 

– Marc — 16:25 :

 Alors on a parlé des élèves. Les profs de data Scienctest, qui sont-ils? Qu’est-ce qu’il est séduit pour venir enseigner chez Data Scientest? 

– Charles — 16:33 :

 Alors c’est une excellente question, parce que c’est l’équipe que je dirige, j’ai peut-être pas présente aussi mon rôle au sein de l’Organisation chez Data Scienctest, donc moi-même je suis en charge de la partie technique,Alors qui sont ces profils qui viennent? Historiquement, c’était beaucoup d’étudiants, de grandes écoles, d’ingénieurs en sortie d’école, alors ça peut paraître paradoxal. Nous, ce qu’on regarde, c’était une forte appétence pour la pédagogie, une certaine excellence scientifique et nous, derrière, on s’occupait aussi de former, accompagner. Il est bien sûr évident que l’ensemble des profils qui sont chez nous, ont soit une énorme appétence, une énorme expertise dans le domaine, soit ils sont formés pour pouvoir délivrer personne, on va dire n’est jeté comme ça, dans l’arène. Depuis ça, c’était dans les années 2017 2018 2019. On va dire qu’à partir de 2020 / 2021, on a un peu ouvert nos recrutements avec des gens plus pointus. C’est vrai que les gens ont commencé à avoir de l’expérience en machine learning, en data science, en Deep learning, donc là y a des profils plus expérimentés qui nous ont rejoints, qui vont porter aussi souvent des produits un peu flagship, donc Deep learning, mlops, M& L engineering et cetera. Et donc là on va avoir des profils qui ont plus d’expérience, plus expérimentés, donc on a ces 2 sources qui coexistent encore. Sur les produits, sur les grandes écoles d’ingénieurs, on va plutôt envoyer les profils sur ce qu’on appelle nos produits vanille. Donc data Analyst, Data Science qui sont des produits super installés en “road mode » comme on dit. Et on a ouvert aussi un dernier profil très intéressant et très non conventionnel, ce qu’on recrute nos anciens. Donc fondamentalement il y a des gens qui sont nos formations, certains sont en poste un an, 2 ans, 3 ans et puis ils veulent ; ils ont une forte appétence pour la pédagogie, ils ont aimé data scientest, le dispositif ,les équipes et cetera. Donc aujourd’hui, on a une trentaine de profils qui sont assez bien répartis selon ces 3 critères, des anciens, des experts et des profils grandes écoles avec une excellence scientifique qui est propre à ces formations là, et c’est un tout cohérent parce que Ben chacun va apporter sa pierre à l’édifice, sa façon de voir les choses et c’est ce qui est très intéressant. Peut être le dernier point aussi, c’est que nos programmes aussi, on les fait pas en dans notre tour d’Ivoire, on est énormément accompagné par des externes précisément pour chacun de nos produits en fait, ça va être des conseils de perfectionnement qui sont souvent constitués d’un professeur des universités, d’un professionnel reconnu du domaine qui est externe à data scienctest, au sens où il a pas fait la formation ou c’est pas quelqu’un avec qui on travaille en B to B et cetera. Et un ancien. Et puis ça, c’est aussi ce qu’on appelle “nos antennes” qui viennent nous dire pour chaque produit comment ils évoluent, et cetera, sans pour en parler un petit peu de l’évolution de la data. Mais le, le cursus Data Scientest ,il évolue tout le temps. Alors il a été créé en 2017 Mais celui qu’on vendait en 2017 et qu’on proposait , celui qu’on fait en 2020 et celui qu’on fait en 2025 ce sont 3 produits très différents qui s’adaptent exactement aux attentes autour de ces métiers et en termes de compétences que que de rôles aussi au sein des entreprises. 

– Marc —19:13:

 La data, ça a été montré comme un eldorado dans lequel tout était possible. Il y a eu énormément de profils qui se sont reconvertis là-dedans et donc tous les gens qui recrutent des profils data sont habitués à énormément de profils reconvertis et à le faire très attention aussi avec ça, dans le sens où on a vite fait  de présenter un profil comme expert en data science alors qu’il a passé 10 ans à faire autre chose et qui s’est reconverti l’an dernier. Est ce que vous vous en occupez à ce point là, D’une part, et d’autre part, quel est l’on va dire le personnel d’entreprise type qui sera intéressé par le profil qui sort de data Scientest? 

– Charles — 19:49 :

 Alors, c’est tout d’abord une excellente question, est-ce qu’il faut voir déjà c’est quelle est la problématique aujourd’hui et et comment on arrive là. Alors déjà le point de départ, c’est qu’il y a une pénurie de compétences et donc une pénurie de profils qui va avoir dans les entreprises ,qui elles-mêmes ont amorcé une transformation data pour certaines assez tôt. Donc on parle des années 2015 2016 pour certains plus tard dans les années récentes et dans tous les cas, qui dit pénurie dit que les exigences vont descendre, donc je vais donner des exemples. Quand vous êtes une très grande entreprise qui a tendance à recruter, on va dire des profils de niveau A sur leur CV ou leur formation. Bah s’il y a plus de compétences et bien sûr ils vont être plus susceptibles d’ouvrir un petit peu, on va dire les Vannes et cetera. Nous aujourd’hui, cette pénurie de la tech, comment on l’analyse, pareille Un petit peu en frontal avec ce qui était proposé à l’initiative où en 2017 quand on s’est lancé,  c’est vraiment de coder et travailler, et nous on est plutôt sur ce positionnement et donc le personna d’entreprise qu’on va adresser, Ça va être effectivement sur ceux qui vont avoir besoin de ses doers, c’est à dire ces gens qui dans les entreprises vont pouvoir adresser problématique, accompagner cette transfo data, la continuer. Et c’est vraiment ça ce qu’on fait. Effectivement, on va pas former des gens pour aller chez Deep mind ou chez Tesla ou chez Google X dans les pôles RD on va plutôt former bah des data scientists qui veulent entrer dans des grands groupes, des sociétés de service, des startups et sur lesquels on va avoir besoin de profils qui ont ces compétences là, qui sont recherchées. Peut-être un point aussi , qui est intéressant, mais ça c’est plus mon avis personnel. Ce qu’on va trouver chez les gens qui font des reconversions , pas seulement chez data science mais chez nos concurrents, c’est une valeur courage. C’est pas évident sur des profils qui ont 30, 35 ans de se dire Ah bah tiens, j’ai un bac plus 5 scientifique, je suis en poste mais je vais quand même aller faire une formation exigeante de 400 heures qui est quand même un effort lourd, soit au boot de camp, soit pendant un an, pas le soir et week-end parce que, comme vous savez maintenant, vous pouvez faire quand vous voulez avec la plateforme. Mais ça c’est une valeur courage qui est énorme et ça aussi c’est je pense des valeurs qu’on peut rechercher chez des profils qui font des boot de camp et donc pour ceux des profils qui suivent, les formations à Data scientest. Donc voilà, et les personna donc d’entreprise pour répondre explicitement, vous allez avoir beaucoup d’entreprises qui conduisent une grosse transformation natale, donc les B to B. Dans les start-up, on va chercher plutôt des multi spécialistes, des gens qui sont capables de faire du machine learning,de la data mais aussi qui peut être un peu de bouteille dans d’autres domaines et qui vont pouvoir avoir cette double casquette là. Et bien sûr aussi les entreprises de service numérique, donc là on a besoin de consultants data et ça paraît qu’ils vont plutôt être en interaction avec les B to B qui recrutent directement sur des projets plus spécifiques. Voilà. 

– Marc — 23:29 :

 Donc, alors data Science c’est une chose. Et puis il y a tout ce qui est data Engineering, tout ce qui se rapproche un peu plus du soft ,du Software. Tout ça c’est un monde qui foisonne d’outils, des outils qui évoluent, qui changent d’un jour à l’autre. Quels sont les outils que vous, vous choisissez? Comment est-ce que vous restez au fait des tendances de, des nouveaux outils? 

– Charles — 23:49 :

 Alors, c’est très intéressant ce que c’est vrai, que c’est des choses qui ont l’air très statiques, très imposées, et cetera, alors qu’au contraire, la data c’est un monde qui vit aussi bien dans les positionnements, les entreprises, les postes en eux-mêmes et les outils. Aujourd’hui, la data, pour faire simple, nous on a une grande chance chez data scientest qu’on est très indépendant, sur le choix des outils et comment on promeut. Parce qu’en fait, les partenaires de l’ensemble des grands acteurs, si on prend le cloud dans les partenaires de AWS et azur et même si ça reste assez confidentiel, vous le devinez un 3ème grand Leader qui devrait être partenaire avec nous d’ici peu. Et aujourd’hui, ce qu’on va voir, c’est dans les tendances, les outils choisis, c’est des produits qui vivent. Donc si on prend l’exemple, je vais essayer de décliner assez rapidement sur les métiers de la data science, les data Scientists : On est arrivé, on a convergé vers quelque chose d’assez stable, c’est à dire aujourd’hui à une demande qui est assez continue et stable en data scientist, mais on va attendre 2 d’avoir beaucoup plus de compétences Engineering dans le sens où capable de mettre en production, dépasser le cadre du Notebook et on entend beaucoup en ce moment, mais dépasser le cadre du prototype et d’aller en production. Dans les grandes entreprises pour avoir cette capacité d’interaction et pensées scalable parce, qu’on a dépassé le cadre du POC, on est sur des choses qui passent en prod aujourd’hui et dans les start-up pour avoir un multi spécialiste qu’on a pu dire plutôt que d’avoir un data Engineer Data Scientist qu’on peut pas se permettre en tant que start-up, On a quelqu’un qui est capable de faire les 2. Sur les métiers ensuite d’analyse, data engineer, Là on sent une énorme explosion de demande des profils sur ces 2 domaines, l’analytique c’est Engineering pourquoi? Parce qu’il y a 2 choses : pour moi et c’est mon analyse c’est que énormément d’entreprises ont beaucoup grandi en maturité dans la data et on arrive sur cette vague là où bah aujourd’hui on peut  faire. Donc avant on avait pas les données, on avait pas les warehouse, on avait pas les data Lake et donc on pouvait pas faire tout simplement de la BI dans les BU. Aujourd’hui on peut et donc on a besoin de ces profils là plutôt en analyste. En Engineering c’est pour opérer cette transformation data et avoir des gens qui amènent la data ou peuvent mettre en production et donc aussi y a de plus en plus de demandes. Donc ça c’est des besoins qui sont croissants. Concernant les outils aussi, sur les métiers d’analytique d’engineering, du fait d’une grosse maturité data, on voit énormément d’outils apparaître, le cloud se démocratise. Les outils aussi, certains commencent à monter en maturité et si on prend de la BI énormément d’outils qui sont proposés, nous la très grosse demande, elle repose autour de Power BI entièrement dans la BI mais je sais qu’il y a énormément d’autres outils qui sont demandés, looker chez de Google on va avoir metabase, on va avoir énormément d’outils micro strat ,tableau, on est capable d’accompagner au fond c’est des outils, ce qui est important aussi, c’est leur utilisation.Sur les parties Engineering. On va avoir beaucoup de technos qui sont demandés fondamentalement c’est une constante malgré tout c’est que l’Open source a un peu la préférence de la communauté data. Un exemple que j’aime bien, c’est DBT. Par exemple, on va avoir pas mal de concurrents quand même tient un trajet haute assez principaux concurrents, plutôt dans l’engineering et donc voilà, c’est ce qu’on observe. Donc ça vie. Il y a des produits qui montent, y a des produits qui descendent, y a des besoins qui évoluent, mais moi ce que je constate aujourd’hui c’est qu’il y a une maturité qui avance et donc y a des profils et des outils qui se mettent en place et ça c’est hyper intéressant à regarder et comment nous on se tient au fait de ça, Ben je vais peut-être dire un petit peu et faire de la redite, bah nous on a effectivement les conseils de perfectionnement qui sont un peu nos antennes qui nous permettent d’avoir un petit peu en avance de phase, les infos. Ce qui est cool c’est que si on a un ADN très B to B historiquement, donc on est au contact des entreprises qui développent ces besoins là, et cetera, Donc très tôt on sait ce qu’elles ont besoin. Alors généralement une entreprise classique, elle va d’abord passer par un consultant une fois qu’elle a bien compris son besoin, elle va former et enfin elle va recruter et donc dans cette configuration là, dès lors que nous on intervient à peu près entre cette phase là où ils sont conseillés et on forme, on sait très très tôt quels sont les besoins de demain en data science et ça nous donne un vrai avantage compétitif sur une concurrence qui est plus B to C. Parce qu’on est à l’écoute de ce que nous demandent les entreprises et qui finalement va se répercuter dans le monde des particuliers plus tard peut être un écueil qu’on a pu à faire Une fois. C’est de ne pas trop succomber à la hype, c’està dire parfois il y a des outils qui vont énormément monter ou des uses cases qui vont énormément monter, et il ne faut pas tomber dans cet écueil. Typiquement en ce moment on parle beaucoup de GPT 3 il ne faut pas tomber dans l’écueil de pensée, surtout quand on veut former comme j’ai dit des doers que tout le monde doit savoir faire un chatbot ou comprendre comment on entraîne un GPT 3. Parce qu’en fait dans la pratique,  Je pense qu’il y a très peu d’entreprises en France   computationnelles, d’entraîner un tel modèle, alors j’en parle encore moins de le mettre à disposition et de l’utiliser dans les cas pratiques. 

– Marc — 28:07 :

 Vous vous servez de la data également en interne pour piloter votre entreprise. 

– Charles — 28:12 :

 Alors c’est vrai que c’est, c’est assez particulier, donc nous on a 1500 étudiants, 7000 alumni. Fondamentalement, on n’a pas non plus des pétaoctets de données ni des usagés qu’on pourrait en faire de ces données, quand bien même on les récupérait. Là où il y a des besoins fondamentalement data qui sont plus intéressants, sont plutôt dans l’autre département, dans le département business et là on a aussi beaucoup plus de data du fait qu’on soit extrêmement présent en ligne et bien référencé. C’est comment on va par exemple gérer nos campagnes de digital marketing pour vous donner un exemple, on reçoit autour de 3000000 de visiteurs sur notre site annuellement. On va avoir des budgets ads qui sont alloués, Ben les équipes de data, donc mes équipes vont aller collaborer avec les équipes acquisitions pour essayer par exemple de piloter les campagnes marketing. Ça c’est un usage, un autre usage intéressant de R et d interne. C’est aujourd’hui, on avait une compta qui était très standard, on va dire dans notre société jusqu’en 2020 et puis à partir de 2021 on a décidé d’avoir une approche produit et plus analytique et là par exemple, alors c’était pas de la data science du machine learning. On est entre plus dans les sujets de BI et donc avec la BI on a réussi à faire de la compta quelque chose déjà de plus enthousiasmant, en tout cas de mon point d’et aussi de plus cohérent et plus orientée produit. Et c’était vachement intéressant, peut-être quelques autres usagés que je peux le bailler. On utilise beaucoup de data et de machine learning. On va avoir par exemple au sein de l’équipe data Paris aussi beaucoup de monitoring, souvent sur la qualité, donc nous on est très très data driven donc on va avoir beaucoup de prises de feedback aussi bien sûr la qualité des interventions, la qualité des enseignements, la satisfaction des utilisateurs, les taux de complétion et cetera. Et en fait typiquement bah voilà j’ai des référents opérations en interne qui peuvent vous dire Bah vous voulez votre dashboard pour voir comment vous animez des masterclass qui sont nos cours magistraux. Eh bien, une personne peut savoir à peu près se situer, voir comment il se situe par rapport aux autres, la qualité, donc voilà, on a des usages. Quels sont les usages qu’on pourrait faire Du machine learning aujourd’hui? Ben j’ai pas de vision concrète. Typiquement, on pourrait essayer de forcer un peu la chose en disant Bah tiens, quelle proba quelqu’un réussisse un cours ou un examen mais fondamentalement je pense ça serait un peu overkill, le versa dans le sens où aujourd’hui on le sait très bien à la lecture du fichier. Si demain on a 1000000 d’utilisateurs ça peut être intéressant mais là c’est encore un peu tôt, peut être un dernier point intéressant et ça peut  croiser avec les profils qui sont chez nous, les profils qui sont chez nous, Je disais ils font pas de l’enseignement une activité principale. Ils ont essentiellement 4h en cours magistraux, mais après ça serait parti le temps entre le développement de cours, mentorat, projet et RD et dans la dimension R, ce qui est intéressant, c’est qu’on applique une stratégie R et D sur lequel on a la chance de pouvoir travailler absolument ce qu’on veut puisque bah on a aucun biais qui nous pousserait à aller en RD spécifique. On a identifié 4 thématiques, je sais pas, c’est mieux d’en parler, mais c’était les bibliothèques, le signal processing, l’analyticsdans le sport pour le département Analytics. Et plus récemment aussi, les mathématiques pour l’économie et la finance. Donc ça, c’est 4 thématiques qui sont ressorties. Et puis en fait, ces sujets sur lesquels ils peuvent travailler et qui généralement une fois qu’ils sont assez mûrs atterri dans notre catalogue, projet qu’on fait avec les utilisateurs. Et pour l’anecdote, c’est assez sympa. Là, en ce moment on a, on a tellement bien avancé sur un sujet de débiaisage des images, donc ça peut être intéressant qu’on est en train d’écrire un Paper avec un groupe projet, donc c’est assez intéressant là-dessus mais bon voilà c’est c’est des petits obsédés qu’il y a à travailler chez attention test mais donc finalement on fait du machine learning de Au niveau mais pas forcément pour le bien de la boîte au fond, on peut le dire, pour le kiff, voilà. 

– Marc — 31:33 :

 Est-ce que tu as une anecdote ou une opinion à nous partager sur la data? 

– Charles — 31:38 :

peut-être une opinion qui est intéressante aujourd’hui. Ce qu’on voit dans la data et pareil il ne faut pas céder aux sirènes qui sont évoquées. j’aime bien revenir aux origines en 2017 le contexte. On disait Voilà Data Scientist, le métier le plus sexy du 21ème siècle je pense. C’est là le meilleur marketing possible de la data science, et ce qu’il faudrait voir il faudrait pas que la data ça soit quelque chose à part ou en plus dans une entreprise, moi je le vois un peu comme le digital. Ça c’est intéressant parce que quand je cours avec les entreprises, on parle beaucoup de data Factory, de transformation, data, et cetera, et cetera. Vous prenez tous ces warnings là, vous revenez 10 ans en arrière et on parle de transformation digitale, de digital Factory et cetera. Et donc c’est quoi l’analogie. C’est que la data sera l’affaire de chacun dans les entreprises demain, de manière plus ou moins profonde. Certains, comme on a pu dire, font de la R et d ça sera leur métier d’être des vrais data Scientist au sens de Scientist, mais demain on peut imaginer je parlais de la Compta que demain un comptable doit savoir utiliser un dashboard de BI Ou que quelqu’un qui fait du webmarketing ai des notions un petit peu de statistiques ou de data analyse pour mieux piloter ses campagnes. Et on va assister à cette intégration et cette fusion des compétences en ce que l’ensemble des corps de métiers d’une entreprise et cette extension là qui est permise par la data et bien sûr heureusement il faut des profils plus spécialisés qui auront leur place dans cette entreprise. Donc c’est un peu mon opinion donc c’est pas juste un métier de spécialiste ou un un quelque chose de compartimenté, la data c’est quelque chose qui va vraiment se fondre dans les entreprises petit à petit. Et c’est des choses qu’on peut déjà voir et c’est une transformation qui opère. Donc oui, oui, c’est un métier de sexy. C’est une transformation importante du 21ème siècle. Mais attention, faut pas le voir comme des ovnis ou des supers champions de l’entreprise, au contraire, ça va être une affaire collective, la data. 

– Marc — 33:19 :

 Si c’était à refaire, qu’est-ce que tu changerais? 

 

 Si c’était à refaire, si c’était à refaire, moi, ce que j’aurais fait principalement, c’est essayer assez vite de prioriser pour data scientest, la compétence pédagogique à la data Science pure. Alors en fait, ce qu’on fait, c’est ce qu’on opère, mais j’ai peut-être aller un petit peu plus vite, aujourd’hui, le vrai savoir faire des data scientest bien sûr, il est dans l’excellence scientifique, académique, technologique avec la plateforme, mais peut-être à mon niveau plus personnel, ça va être dans le fait d’avoir insufflé cette ADN pédagogique de qualité qui peut se retrouver aujourd’hui, par analogie dans toutes les autres pénuries de la tech. À vrai dire, c’est pas pour rien qu’on ouvre aussi d’autres marques en cyber, en développement, et cetera sur lesquelles on va essayer d’appliquer les mêmes schémas pédagogiques Fondamentalement, je me rends compte aujourd’hui en 2021 2022 plutôt et bientôt 2023 que les conseils avisés des gens qui sont plus spécialisés où là où j’étais moi spécialiste avant comme la formation en data science se révèle parfois bien plus pertinent, plus percutant, et faut pas hésiter justement à les écouter, là où moi, ma valeur ajoutée va plutôt être, j’espère  et sur le long terme sur cette capacité à balancer des produits pédagogiques, amener cette innovation.je sais pas si c’était à refaire. Je pense qu’on a quand même fait les choses comme il fallait, mais c’est plutôt ce qu’il faut faire à partir de maintenant et pour la suite quoi donc voilà. 

– Marc — 34:43 :

 Alors justement, pour conclure, ce que tu peux nous dire, un mot sur la suite de Data Scientest ? 

– Charles — 34: 45 :

 Alors la suite de Data Scientist donc bah aujourd’hui effectivement on a la chance d’être leader sur le marché français. Dans la data, on a des ouvertures en Espagne, en Allemagne, au Canada, donc dans la suite logique, on aimerait continuer notre expansion géographique en Europe à l’international. Surtout, bien sûr, on a un enjeu de couvrir plusieurs fuseaux. Là, on ouvre l’Amérique en janvier avec le Canada, le continent américain, mais on va essayer de s’étendre là-bas,2ème enjeu. J’ai pu en parler dans les grandes lignes, c’est d’aller chercher des cibles un peu plus à la frontière du monde du travail, donc de développer nos savoir-faire avec les fonctions publiques, on accompagne beaucoup les chercheurs d’emploi dans le retour à l’emploi avec un certain succès En 5 ans, on a très directement trouvé un emploi à plus de 350 personnes dans les métiers de la data. Bien sûr, c’était des chercheurs d’emplois qualifiés, hein? Le plus souvent, on ne fait pas de miracle non plus. Et aussi l’autre point, c’est d’aller peut-être aller chercher des profils où y a une grosse porosité entre l’université et le monde du travail. Et probablement, vous voyez de quoi je parle, mais c’est l’alternance aujourd’hui en M1 et M2, on a des profils qui mettent le pied à l’étrier dans le monde du travail et nous aujourd’hui c’est plutôt des profils qu’on va essayer aussi d’aller adresser. Donc une extension de nos cibles par rapport au traditionnel un 3ème objectif, d’ouvrir ce savoir-faire pédagogique à d’autres pénuries de la télé sur lesquelles on retrouve exactement les mêmes schémas. La Cyber, les métiers du développement et pourquoi pas à terme encore d’autres pénuries? L’avenir nous le dira. 

– Marc —36:01:

 Super merci Charles. 

– Charles — 36:03 : 

 Merci à toi Marc. 

– Marc —36:04 :

 Vous venez d’entendre Charles Sutton City de Data Science test sur Data driven One One, merci d’avoir écouté si vous avez aimé que vous voulez nous soutenir, n’hésitez pas à vous abonner à la chaîne, à liker et à partager.