Innovation & Mobilité : L’IA au service du train
Johan Maussion, Directeur Performance Business & Webanalytics chez SNCF Connect & Tech est l’invité de l’épisode 75 du podcast Data Driven 101.
🎧 Dans cet épisode captivant, nous plongeons dans :
Les coulisses de la gestion des données à grande échelle 🌍
L’utilisation de l’IA pour prédire et optimiser la performance 💡
Les enjeux de la mobilité durable et digitale 🚆
Johan partage aussi des anecdotes fascinantes sur les ouvertures des ventes SNCF et les innovations mises en place pour simplifier l’expérience utilisateur.
🔗 Écoutez maintenant et laissez-vous inspirer par les défis et les opportunités de l’ère data-driven !
#DataDriven101 #Podcast #IA #MobilitéDurable #Analytics
🔑 MOTS CLÉS
Analytics : Processus d’examen des données pour tirer des conclusions sur les informations qu’elles contiennent. Cela inclut l’analyse descriptive, prédictive et prescriptive pour améliorer la prise de décision.
Performance Business : Mesure de l’efficacité d’une entreprise dans l’atteinte de ses objectifs commerciaux, souvent évaluée à travers des indicateurs clés de performance (KPI).
RGPD (Règlement Général sur la Protection des Données) : Règlement de l’Union Européenne qui vise à protéger la vie privée et les données personnelles des citoyens européens, en imposant des règles strictes sur la collecte et le traitement des données.
Prévisions : Estimations basées sur l’analyse de données passées et présentes pour anticiper des résultats futurs. Dans le contexte du podcast, cela fait référence à la prévision des ventes de billets.
Consultatif : Se réfère à un modèle d’interaction où l’accent est mis sur le conseil et l’assistance aux clients plutôt que sur une simple transaction commerciale.
🎙 SOUTENEZ LE PODCAST
Abonnez-vous 🔔
Laissez 5 étoiles et un avis 🥰

Marc Sanselme 00:00:00 – 00:00:42 : Vous écoutez le podcast Data Driven 101. Le contenu de ce podcast est entièrement non sponsorisé et ce depuis le début. Il est rendu possible par Scopeo. Si vous appréciez ce podcast et pour qu’il continue longtemps, pensez à parler de Scopeo à tous ceux qui autour de vous auraient besoin de spécialistes dans la conception, le développement et l’intégration d’IA sur mesure. Bonjour et bienvenue sur Data Driven 101. Je suis Marc Sansem, l’hôte de ce podcast, qui s’intéresse aux applications concrètes et variées de l’intelligence artificielle et de la data. Dans Data Driven 101, je reçois chaque semaine des professionnels pour qu’ils nous partagent leurs expériences et leurs visions sans filtre. Aujourd’hui, je reçois Johan Motion.
Johan Maussion 00:00:42 – 00:00:42 : Motion.
Marc Sanselme 00:00:42 – 00:00:43 : Motion.
Johan Maussion 00:00:43 – 00:00:47 : Je vais le redire.
Marc Sanselme 00:00:47 – 00:01:26 : Je vais le redire. Je le refais depuis le… Bonjour et bienvenue sur Data Driven 101. Je suis Marc Sanselm, l’hôte de ce podcast qui s’intéresse aux applications concrètes et variées de l’intelligence artificielle et de la data. Dans Data Driven 101, je reçois chaque semaine des professionnels pour qu’ils nous partagent leurs expériences et leurs visions sans filtre. Aujourd’hui, je reçois Johan Motion, directeur performance business and web analytics chez SNCF Connect & Tech. SNCF Connect & Tech, filiale privée de SNCF Voyageurs, est le leader du numérique et du e-commerce français dans le secteur des mobilités. Bonjour Johan.
Johan Maussion 00:01:26 – 00:01:28 : Bonjour Marc.
Marc Sanselme 00:01:28 – 00:01:34 : Alors Johan, est-ce que tu peux nous parler un petit peu plus de l’activité de SNCF Connect & Tech ?
Johan Maussion 00:01:34 – 00:02:10 : Oui, bien sûr. L’entreprise SNCF Connect & Tech a une ambition principale, c’est d’innover pour rendre les mobilités durables accessibles à tous. Au travers de cette ambition, on a deux activités principales. Une que tout le monde connaît, notre activité d’e-commerçant et de distributeur de mobilité durable via notre application et notre site SNCF Connect. Et on a une autre activité de services et de solutions numériques pour le groupe SNCF, mais aussi pour des collectivités ou d’autres entreprises qui souhaitent se développer dans le secteur de la mobilité.
Marc Sanselme 00:02:11 – 00:02:25 : D’accord. Par exemple, pour parler un peu d’autres choses que la SNCF qui seraient accessibles, on parle de quoi ? On parle d’autres marques, d’autres opérateurs de trains ?
Johan Maussion 00:02:25 – 00:03:01 : Oui, ça peut être… En fait, on développe des applications qui peuvent être utilisées principalement par la SNCF, qui est notre client principal, mais on a aussi d’autres entreprises qui peuvent venir à nous, puisqu’on est des experts en digitales, qui peuvent venir à nous pour qu’on les aide aussi sur le développement de solutions. Donc ça reste dans le cadre de la mobilité, mais certaines applications développées pour la SNCF peuvent être utilisées effectivement par d’autres acteurs de mobilité, la partie contrôle, etc., aide aux conducteurs, on développe ce type de solution principalement.
Marc Sanselme 00:03:02 – 00:03:13 : D’accord, donc il y a une partie qui vend des billets, une partie qui aide les opérateurs de train, le personnel ?
Johan Maussion 00:03:13 – 00:03:55 : C’est ça. Les applications qui sont mises en œuvre sont principalement pour le groupe SNCF. Mais on aide soit les opérateurs dans les trains via certains services ou certaines solutions. En fait, on part de l’idée. Quand il y a des problématiques, on part toujours d’une idée. En fait, on a deux sous-activités dans cette activité principale. La première, c’est qu’on part de l’idée. On travaille avec le besoin, on va faire le développement, la conception et la mise en place. Et puis l’autre, comme je disais aussi, c’est une société de services. On vient accompagner des entreprises qui ont des besoins spécifiques sur les services numériques.
Marc Sanselme 00:03:55 – 00:04:01 : D’accord, très clair. Alors, ton équipe en particulier, qu’est-ce que vous faites? ?
Johan Maussion 00:04:01 – 00:04:54 : Alors, deux activités aussi chez moi, comme pour l’entreprise. Je m’occupe de toute la partie mesure de la performance business et marketing. C’est une de mes activités. J’en ai une deuxième qui est la mise à disposition des données digitales pour l’ensemble de l’entreprise. L’objectif, pour aller un peu plus loin, c’est, quand je dis mesure, c’est vraiment, moi je travaille uniquement sur SNCF Connect, je suis principalement dédié sur SNCF Connect, sur l’activité de vente de billets de train, et donc forcément on veut mesurer notre performance, au quotidien, en hebdo ou en mensuel. Ça, c’est pour la première partie. Et la deuxième, c’est qu’on est une activité d’e-commerçant. Et donc forcément, les données digitales ont une importance toute particulière. Et donc moi, une partie de mes équipes met à disposition toutes ces données digitales pour que ça puisse mesurer la performance de nos parcours, etc.
Marc Sanselme 00:04:55 – 00:05:04 : D’accord. Votre équipe est un peu en charge d’agréger, nettoyer, transformer cette donnée pour la rendre exploitable ?
Johan Maussion 00:05:04 – 00:05:30 : On est même en plus bas. On en reparlera peut-être aussi, mais nous, on est vraiment en bout de chaîne. C’est-à-dire que nous, on est là pour exploiter la donnée. On est vraiment sur la partie analytics pour la première activité. Pour la deuxième, effectivement, on est plutôt sur une partie où on va mettre à disposition. J’ai encore ces deux activités-là, mais tu as raison sur une partie. La première étant en bout de chaîne, la deuxième étant plus en amont.
Marc Sanselme 00:05:30 – 00:05:35 : De quel genre de données on parle ? Quel type de données vous traitez ?
Johan Maussion 00:05:35 – 00:06:37 : Alors, je vais citer un chiffre, comme ça, ça va donner tout de suite le périmètre de ce qu’on traite comme données. On a vendu en 2023 un peu plus de 200 millions de billets. Et donc, on traite principalement des données business, puisque c’est ça qu’on va regarder. On va mesurer notre performance business. On traite aussi de données clients. Alors, ces données-là, elles sont captées suivant les règles RGPD, bien entendu, mais du coup, derrière, ça va nous permettre de traiter, pas forcément dans mes équipes, mais pour l’entreprise, d’optimiser notre connaissance client. On va traiter de données marketing, tous les partenariats qu’on peut faire, les publicités, ce qu’on peut faire sur Facebook, les mails qu’on envoie, etc. Et puis, on va avoir toutes les autres données données digitales, c’est-à-dire les parcours de nos clients sur notre site ou notre application. De ces données-là, c’est de là qu’on va tirer la moelle importante de ces données pour mesurer notre performance.
Marc Sanselme 00:06:38 – 00:06:48 : D’accord. Alors, qu’est-ce que vous avez mis en place comme interface pour la visualisation de vos analytics ?
Johan Maussion 00:06:48 – 00:07:47 : Alors on a une chaîne de la donnée qui part de, pour essayer de simplifier, on a notre site et nos applications, les clients naviguent, achètent, etc. Ce n’est pas que de l’achat d’ailleurs, il y a aussi beaucoup de consultations maintenant. Et en fait cette donnée, elle est déversée dans une data platform, tout ce qu’il y a de plus classique, elle est transformée par des équipes dont c’est le métier. et mise à disposition au travers de données agrégées pour qu’ensuite on les exploite via des outils de data visualisation principalement ou des outils de traitement de données pour faire des analyses différents types d’analyses des analyses prescriptives pour essayer de donner des actions à partir de la donnée des analyses prédictives pour essayer de prévoir aussi ce qui va se passer. on a aussi toute une activité de prévision. C’est important la prévision dans la mesure de la performance. Et on a aussi toute l’analyse descriptive pour comprendre ce qui s’est passé et nous améliorer.
Marc Sanselme 00:07:48 – 00:08:01 : prévision c’est à quelle échelle vous essayez de prédire la journée au train. comment est-ce que vous essayez de prédire les flux de voyageurs si c’est les flux de voyageurs dont on parle d’ailleurs?
Johan Maussion 00:08:01 – 00:08:26 : non on essaye de prédire principalement la partie vente de billets. on n’est pas à la journée. on fait une première projection forcément en début d’année et après on essaye de prédire d’affiner à la journée. Mais on prédit sur 2-3 mois de licence, ce qui nous permet de savoir quand il y a les ventes qui sont réalisées sur une journée donnée, est-ce qu’on est dans les clous ou pas de nos objectifs.
Marc Sanselme 00:08:28 – 00:08:48 : Je suis toujours curieux sur ce genre de problème qui cherche à prédire des choses sur une journée du calendrier. Quelles sont les features les plus importantes ? les prédicteurs les plus importants que font ressortir vos algos pour déterminer le nombre de voyageurs.
Johan Maussion 00:08:49 – 00:09:15 : alors il y a une partie qu’on maîtrise. c’est assez cyclique dans le train dans le domaine de la mobilité par exemple les vendredis soirs les gens partent en week-end. donc forcément on sait que c’est des journées qui vont être plus importantes. le jour de la semaine rentre en ligne de compte. après il y a des éléments qu’on maîtrise moins comme la météo. La météo peut avoir un effet. Si jamais il ne fait pas beau, vous n’avez pas forcément envie de partir en week-end.
Marc Sanselme 00:09:16 – 00:09:18 : Il est important cet effet de la météo ?
Johan Maussion 00:09:18 – 00:09:53 : Difficilement mesurable. Mais quand on fait nos analyses descriptives a posteriori, on regarde cet effet météo. Après, la météo, on sait très bien que c’est difficilement prévisible aussi. Donc, on ne le prend pas en compte dans nos analyses prédictives. On le regarde dans nos analyses descriptives. Et après, il va y avoir les périodes de l’année, les ponts, les vacances scolaires, les vacances d’été. Tout ça, c’est des éléments qui font qu’on arrive à ajuster. Est-ce que le pont tombe un vendredi ou est-ce que ça tombe un jeudi ? Tout ça, c’est des éléments qui rentrent en ligne de compte dans les algorithmes.
Marc Sanselme 00:09:54 – 00:10:04 : Est-ce que vous prenez en compte l’événementiel ? Je ne sais pas moi, un match, un quart de finale ou une demi-finale de Coupe d’Europe, un truc comme ça qui est un peu exceptionnel et qui va faire bouger beaucoup de gens ?
Johan Maussion 00:10:04 – 00:10:46 : Alors, on peut. C’est assez rare quand même. Il faut vraiment que ce soit un énorme événement comme les JO qu’on a connus là à Paris cet été ou une Coupe du monde de foot qui peut avoir un effet. Alors, Une anecdote, un match, la finale de l’équipe de France se voit sur nos performances directement. On peut limite voir les buts sur nos courbes d’audience. Puisque quand il y a un but pour l’équipe de France, l’audience baisse. Après, encore une fois, on descend à une maille vraiment très fine, voire trop fine pour du suivi. Néanmoins, dans nos prédictions, on essaye sur les gros événements comme ça de les prendre en compte. Mais ce n’est pas toujours facilité.
Marc Sanselme 00:10:46 – 00:10:50 : L’activité sur votre application augmente ou descend ? Oui.
Johan Maussion 00:10:50 – 00:10:56 : Elle augmente ou elle descend en fonction de ces événements-là. Il faut que ce soit des gros événements.
Marc Sanselme 00:10:56 – 00:11:22 : Et sur la vente de billets au moment du départ du train, des événements comme une finale de… Une finale du championnat de foot ou de rugby, par exemple. Le Sud de France, 80 000 personnes, ça fait quand même toute une ville, on va dire au moins 40 000 personnes qui se déplacent. Ça ne se voit pas sur les…
Johan Maussion 00:11:23 – 00:11:56 : Si, on va avoir des pics notamment. Comme je vous disais, on est là pour vendre des billets de train, mais on a aussi un deuxième pan qui s’est beaucoup développé avec SNCF Connect, c’est toute la pa rtie consultative. Là, nous, on vend des billets pour l’Île-de-France Mobilité, par exemple, mais on le voit aussi sur l’audience, sur la partie recherche d’itinéraire ou information voyageur. Effectivement, on va avoir des pics, par exemple, si jamais il y a des événements au Stade de France, on va avoir des pics d’audience sur ces pages-là spécifiques qu’on va pouvoir observer.
Marc Sanselme 00:11:57 – 00:12:04 : D’accord, donc le feature le plus important, ce n’est pas tant l’événement lui-même, mais c’est est-ce que les gens ont recherché un trajet à cette date-là ?
Johan Maussion 00:12:04 – 00:12:05 : Exactement.
Marc Sanselme 00:12:0 5 – 00:12:12 : Et c’est ça, c’est une donnée bien plus utile puisqu’il est chargé d’encore plus d’informations que l’événement lui-même.
Johan Maussion 00:12:12 – 00:12:36 : Oui, parce qu’en fait, toute la partie vente en amont va nous permettre de dire oui, on a un gros événement à cet endroit-là. La Coupe du monde de rugby aussi, en 2023, on avait suivi ça de plus près. Donc, il y a toute la partie bien en amont. Il y a la partie le jour J. Cette partie le jour J, elle est moins maîtrisable. On la connaît plus ou moins. Une nuit blanche à Paris, etc. On sait qu’on va avoir un pic de consultation et de recherche d’itinéraire, par exemple.
Marc Sanselme 00:12:38 – 00:13:00 : On peut espérer que les gens qui s’organisent très longtemps à l’avance soient à peu près proportionnels à ceux qui s’organisent en dernière minute et que du coup, avec les gens qui ont gardé un trajet six mois à l’avance, ça nous donne déjà une bonne estimation par une règle de trois du nombre de personnes qui prendront le train ce jour-là.
Johan Maussion 00:13:00 – 00:14:02 : Après, on a quand même deux populations assez différentes sur cette partie. puisqu’on a beaucoup de personnes qui viennent uniquement pour la consultation, puisqu’il y a aussi tous les passes Navigo, encore une fois l’Île-de-France, qui drainent une bonne majorité de la population. En fait, ces clients-là et ces utilisateurs-là, ils vont acheter ponctuellement pour partir en vacances ou pour des déplacements professionnels sur notre activité de vente de billets. Ils vont moins acheter sur l’activité de vente de billets, on va dire, transiliens. de France Mobilité. Par contre, ils vont quasiment tous les jours consulter. Par jour, on a 3,5 millions de visites. Sur l’année, ce qui représente 1,3 milliard de visites sur notre site ou notre application. Sur cette partie-là, c’est du 50% de visiteurs. consultatif, 50% de ventes. maintenant en termes de visite. C’est là où on a basculé sur un aspect beaucoup plus consultatif de nos fonctionnalités.
Marc Sanselme 00:14:02 – 00:14:08 : Il y a les grandes lignes et le départemental, le régional, le départemental.
Johan Maussion 00:14:08 – 00:14:28 : c’est aussi notre ambition c’est d’être la mobilité tout en un c’est à dire qu’on part de chez soi la gare, la ville on veut faire de la recherche de bout en bout on développe cette activité là. donc c’est pour ça qu’on ne fait pas que vendre des billets, grande vitesse ou TER. on a aussi toute cette partie D’accord.
Marc Sanselme 00:14:28 – 00:14:46 : Monsieur, sur ce sujet, typiquement, je dis que vous développez de ce côté-là. Aujourd’hui, on ne parle que de ferroviaire quand même, sur le fait de composer un trajet de plusieurs segments, plusieurs billets différents. On reste sur du pur ferroviaire ?
Johan Maussion 00:14:46 – 00:15:31 : Non, on a du bus aussi. Oui, on vend du bus et après, on vend aussi de la mobilité sur les territoires bien spécifiques. Typiquement, on peut acheter sur SNCF Connect un billet de bus pour des villes comme Avignon, Tours ou Orléans, qui sont nos top 3. En fait, on essaie vraiment, encore une fois, d’aller du point à point. L’ambition, encore une fois, c’est de développer l’ensemble des mobilités durables. C’est d’amener le client ou l’utilisateur de son point A, et quand on dit son point A, c’est chez lui, jusqu’à son point B, c’est-à-dire pas la gare ou la ville, c’est vraiment jusqu’au bout de son trajet. C’est vraiment la volonté de développer toute cette partie de la mobilité.
Marc Sanselme 00:15:31 – 00:15:40 : Est-ce que ça fait partie des choses sur la roadmap que d’ajouter la voiture de location en bout de chaîne ou le vélo ?
Johan Maussion 00:15:40 – 00:15:54 : Ça fait partie des réflexions que l’on a et qu’on cherche à mettre à regarder si ça a de la valeur, etc. Ça fait partie des réflexions que l’on peut avoir pour SNCF Connect.
Marc Sanselme 00:15:54 – 00:16:16 : D’accord. Alors, par rapport à l’ouverture des billets, est-ce que tu peux nous raconter, on en parlait un peu la dernière fois qu’on s’est parlé, l’ouverture des billets de l’été, c’est un gros moment pour vous. Comment ça se passe ? Comment ça se déroule ?
Johan Maussion 00:16:16 – 00:17:27 : Alors, il y a une énorme… Toutes les équipes quasiment de l’entreprise sont mobilisées. Il y a une grosse préparation en amont parce qu’il faut qu’on prépare l’architecture technique. Je te disais, on vend 1,7 million de billets par exemple sur ce type de journée. Les gens se lèvent très tôt, nos clients se lèvent très tôt puisque ça commence dès 6h du matin. Et donc en fait, à 6h du matin, on peut remplir jusqu’à 8 TGV par minute. Donc, l’infrastructure technique se prépare bien en amont. Si on revient sur cette partie data, mes équipes travaillent directement dessus. Elles essayent de prévoir pour ces journées spécifiques pour fournir les informations au maximum aux équipes techniques pour qu’elles puissent dimensionner l’architecture, on va dire. vraiment technique de l’application et du site internet. et donc voilà ça c’est pour la partie préparation. et après on met en place un suivi plus spécifique sur cette journée. là on essaie de suivre très régulièrement les aspects techniques mais aussi la partie vente. pour suivre est-ce que la journée se passe bien? est-ce qu’on est bien dans les clous de ce qu’on avait prévu?
Marc Sanselme 00:17:27 – 00:17:47 : ok tu dis 8 TGV par minute c’est j’imagine sur l’ensemble du territoire en nombre de billets mais C’est quand même curieux. Est-ce que c’est si important de se lever tôt ce jour-là ? Peut-être que oui. À quelle heure, en gros, le premier TGV est complet ? Pour se rendre compte.
Johan Maussion 00:17:47 – 00:18:07 : Alors, nous, on parle de 8 TGV par minute. Donc, en fait, ce n’est pas un TGV qu’on remplit. Après, je n’ai pas forcément… Ça va dépendre de… Est-ce que c’est une ODV été, où les destinations sont quand même très vastes. Une ODV Noël, où c’est un peu pareil, les gens vont dans l’ensemble de la France. Une ODV Neige.
Marc Sanselme 00:18:07 – 00:18:07 : ODV…
Johan Maussion 00:18:08 – 00:18:09 : ODV Ouverture des ventes, pardon.
Marc Sanselme 00:18:09 – 00:18:10 : Ouverture des ventes.
Johan Maussion 00:18:10 – 00:18:31 : Ouverture des ventes Neige, où? là, c’est plus spécifique. C’est-à-dire que c’est plus pour aller dans des stations de ski. Et où là, forcément, les trains… C’est ciblé. Oui, ça va être très ciblé. On a quelques gares qui desservent les principales stations de ski françaises. Et donc là, forcément, ces trains-là, sur ces journées-là, sont plus rapidement complets.
Marc Sanselme 00:18:31 – 00:18:45 : En fait, ma question, c’est est-ce qu’il faut se lever à 6h du matin pour avoir le billet le moins cher ? Ou est-ce qu’on n’est pas non plus à ce niveau-là ? Et si on le fait à 8h ou à 10h, on a encore le billet ?
Johan Maussion 00:18:45 – 00:19:36 : Alors, je ne peux pas répondre comme ça, parce qu’on ne descend pas au niveau du train spécifiquement. Encore une fois, ça va dépendre de la destination sur laquelle on souhaite aller. Et comme je te disais, sur les destinations neige, forcément, puisqu’il n’y a pas non plus… Enfin, on fait rouler des trains, ce n’est pas nous qui les ont roulés, mais on fait des trains roulent sur des rails, donc on ne peut pas en mettre des tonnes. Et donc forcément, ces trains-là, potentiellement, pourraient être plus… Après, sur une ouverture des ventes, on a un pic à 6h du matin. Après, ce sont des ventes qui s’étalent sur l’ensemble de la journée et sur les jours qui suivent. C’est vraiment un moment important pour l’entreprise parce que c’est là où on ouvre des nouvelles dates et où les Français peuvent se déplacer et prévoir leurs vacances ou leur long week-end.
Marc Sanselme 00:19:40 – 00:19:43 : Et il y en a combien par an des ouvertures de ventes comme ça ?
Johan Maussion 00:19:43 – 00:19:46 : On en a 3 ou 4.
Marc Sanselme 00:19:46 – 00:20:12 : D’accord, ok. Alors, toutes les données qui sont aux différents endroits, est-ce qu’elles sont stockées en silos ? Comment est-ce que vous les désilotez ? Ou est-ce que vous avez une façon de les stocker au même endroit ? Quand on parle de marketing d’un côté, les données d’utilisation de l’app de l’autre, les ventes elles-mêmes, qui sont peut-être encore un troisième type de données ?
Johan Maussion 00:20:12 – 00:21:34 : Non, on essaye. Alors sur les données qu’on exploite, nous, pour faire toutes nos analyses, l’intelligence artificielle, en fait, tout est stocké à un même endroit pour différentes raisons. C’est déjà des raisons de simplicité. Quand on a tout à un même endroit, on peut mieux les gérer d’un point de vue sécurité. Déjà, puisqu’on centralise et on n’a pas différentes bases de données à droite, à gauche, etc. Ça permet aussi de gérer toute la partie RGPD, puisque ça nous permet de minimiser les données, de s’assurer qu’on a bien une finalité dessus. Donc on a vraiment tout centralisé dans la data platform. Après, le décilotage se fait au travers d’une gouvernance data que l’on a dans l’entreprise qui s’assure au travers de process de faire le lien justement avec toutes ces parties juridiques ou sécurité que tout ce qu’on met en place, puisque tout le monde ne peut pas avoir accès à la donnée. Typiquement, la donnée très agrégée, celle-ci, oui, on peut la mettre à disposition via des outils de database, mais les données qui ne sont pas agrégées, les données brutes qu’on a au tout début de la chaîne, celles-ci, elles sont vraiment d’abord sécurisées et ensuite nettoyées et mises à disposition quand il y a des use cases, sinon elles ne sont pas collectées. D’accord. C’est cette gouvernance qui va s’occuper de nous proposer des process pour dessiloter cette donnée.
Marc Sanselme 00:21:37 – 00:21:45 : Est-ce que tu peux nous parler des signaux faibles qu’il peut y avoir, que vous observez, et comment vous les observez dans les données ?
Johan Maussion 00:21:45 – 00:23:04 : Alors comment on les observe, c’est justement tout ce qu’on disait tout à l’heure, c’est toute cette partie objectif. Notre ambition, c’est de pouvoir… Parce qu’un objectif peut être très large, mais du coup, plus il est large, moins on peut détecter les signaux faibles. Donc toute notre ambition, c’est de descendre à des niveaux d’objectifs un peu plus fins pour pouvoir mieux piloter, souvent sur les analyses descriptives d’ailleurs. Donc ça c’est un gros travail de l’équipe de pouvoir descendre et puis de se dire ok regardez ce qu’on a vendu c’est bien mais le regarder au niveau transporteur ça nous permet de nous dire est-ce que c’est tel transporteur qui a une difficulté ou qui fonctionne bien. On regarde aussi ce qu’on appelle les dates de circulation, ce qu’on vend mais pour des dates de circulation à venir. On essaye de prévoir aussi aujourd’hui ou cette semaine, à peu près, les gens pensent qu’ils vont racheter pour telle période. Et donc, c’est toute cette partie-là qui nous permet de détecter les signaux faibles quand on a des variations importantes sur certaines dimensions qui se cumulent. Regarder au global, c’est bien, mais c’est le cumul des dimensions et le cumul de ces objectifs qui vont nous permettre de nous dire, tiens, Là, il se passe peut-être quelque chose et c’est là où on va déclencher des analyses complémentaires ou des analyses de performance sur d’autres aspects. Est-ce que le parcours, est-ce qu’il n’y a pas des problèmes ailleurs ?
Marc Sanselme 00:23:04 – 00:23:08 : Tu as un exemple en tête ?
Johan Maussion 00:23:08 – 00:24:34 : Oui, ça a d’ailleurs donné l’objet à une fonctionnalité qu’on a développée qui s’appelle alerte train complet. En fait, quand on se rend compte par exemple qu’on a beaucoup de visiteurs mais qui finalement en bout de chaîne ne ne convertissent pas leurs visites. Cette fonctionnalité, on s’est dit qu’elle pouvait être utile. C’est que les gens, quand ils arrivent sur une page, parce qu’ils recherchent un billet pour partir à Marseille pour le week-end prochain, qu’ils arrivent sur des trains complets, on sait qu’il y a des billets qui sont annulés entre le moment où la personne achète et le moment où elle voyage vraiment. Et donc, il y a des places qui sont remises potentiellement en vente. Et donc, on voyait qu’on avait, sur certaines périodes, des clients, un afflux de clients sur certaines destinations et qui se cassaient un peu les dents par rapport à ces trains complets. Et donc, on a décidé de développer une fonctionnalité pour justement se dire, mets une alerte. Comme ça, quand le train, il y a une place qui est remise en vente, tu reçois une notification et tu es… Ce n’est pas tout le monde. On a créé tout un tas, tout un algorithme qui permet de cibler les gens qui sont en premier, etc., Et ça permet de se dire, je vois un train complet, mais je pourrais revenir pour racheter derrière. C’est ce type de données. Là, on est sur un exemple concret. Elle nous a servi à mettre en place cette fonctionnalité.
Marc Sanselme 00:24:34 – 00:24:39 : Vous voyez beaucoup de gens guetter le nouvel afflux.
Johan Maussion 00:24:40 – 00:25:12 : Oui, et encore une fois, ça va dépendre des destinations. Il y a des destinations où il n’y aura jamais de train complet, mais c’est sur certaines périodes où on s’est dit qu’il se passe quelque chose. On a plus de gens qui ne peuvent pas acheter, donc il faut qu’on les aide. Notre ambition, c’est aussi de fluidifier le parcours du client. La data doit aussi servir à ça, à mettre en place des fonctionnalités pour se dire, on voit ça, on fait une description de ce qui se passe sur notre site ou notre application, comment est-ce qu’on peut faciliter la vie de nos clients en budget ?
Marc Sanselme 00:25:12 – 00:25:28 : Oui, et puis c’est peut-être le genre de problème où il va y avoir des petits malins, voire des apps spécialisées qui vont rafraîchir toutes les secondes, vérifier qu’il n’y a pas un nouveau billet. C’est vrai que si tout le monde fait ça, ça sature vos serveurs et c’est pas…
Johan Maussion 00:25:29 – 00:25:39 : Oui, on a une équipe sécurité. Je ne suis pas expert sur cette partie-là, mais je pense qu’on a une équipe sécurité qui veille sur cette partie.
Marc Sanselme 00:25:39 – 00:25:48 : Est-ce que vous faites un peu d’IS ? Est-ce que vous avez des cas d’automatisation dont tu pourrais nous parler ? Ou d’assistance grâce à l’IA ?
Johan Maussion 00:25:48 – 00:27:37 : Oui, alors on travaille sur l’IA, on cherche au travers de l’IA, en fait on essaie de concilier l’IA et l’humain. Parce qu’en fait on n’est pas partisan du tout d’IA, on veut vraiment qu’il y ait des use cases et on veut aussi que l’humain, parce qu’on voit bien l’humain garde une place importante dans ses développements. On a de l’IA pour nos collaborateurs, par exemple, où on va chercher notamment à optimiser la productivité. Je parlais pour mon équipe, je parlais des objectifs. Décliner des objectifs suivant des dimensions très fines, c’est extrêmement chronophage. Et donc on fait des expérimentations pour se dire est-ce que l’intelligence artificielle ne peut pas nous aider à construire ces objectifs au travers de l’historique, au travers d’autres données qu’on pourrait aller capter comme la météo. Donc c’est des expérimentations qu’on essaie de faire pour vraiment toute cette partie productivité on va dire. Mais pareil, on ne se lance pas à corps perdu dans l’intelligence artificielle. Moi, mes équipes, elles ont un regard extérieur. Et du coup, c’est pour ça qu’on expérimente, parce qu’on voit bien qu’il y a la théorie, puis derrière, il y a la pratique. Et de temps en temps, j’ai de reprendre ce que potentiellement les algorithmes peuvent donner. Et après, on a aussi l’IA pour nos clients qu’on peut utiliser, mais pareil, avec parcimonie. Je vais vous donner un exemple pour notre bot, où on peut poser des questions sur notre site et notre application. On va utiliser l’IA pour optimiser notre bot et fournir des réponses plus pertinentes à notre client. Donc c’est vraiment deux types d’applications, une plutôt orientée productivité et une orientée pour nos clients, mais encore une fois optimiste. On avance sans jeter sur l’IA, mais en essayant d’avancer petit peu par petit peu pour être efficace sur cette partie.
Marc Sanselme 00:27:39 – 00:27:51 : Ok. Côté méthode managériale, pour mesurer la performance, est-ce que tu peux nous partager ta méthode ?
Johan Maussion 00:27:51 – 00:29:27 : Alors, dans le monde de la data, ce que j’ai longtemps observé, c’est que quand on a un besoin, on fournit aussi la solution à ceux qui doivent nous fournir un chiffre. J’ai besoin de ce KPI, j’ai besoin de ce graph, mais on en oublie le besoin. Et de mon côté, j’essaie de rester au niveau du besoin. C’est-à-dire que j’ai des experts, j’ai des data analysts dans mon équipe, certains plus jeunes, puisqu’on a des alternants et puis qu’on recrute, donc ils sortent d’école, d’autres plus expérimentés. Mais en fait, j’essaie toujours de leur expliquer de quoi j’ai besoin pour qu’eux me trouvent la solution. Et en fait, je me rends compte que plutôt que de leur demander un chiffre sur lequel ils vont pouvoir me le sortir souvent, mais ça ne va pas répondre à la question que je me posais. J’essaie vraiment de rester à ce niveau de question. C’est quelque chose que j’ai pu tester plusieurs fois. Alors, ça prend des fois un peu plus de temps. Je n’ai pas forcément la réponse tout de suite parce qu’ils ont tout un tas de réflexions à avoir. Mais je pousse leur expertise au maximum et je suis assez surpris de ce qu’ils arrivent à me sortir parce que des fois, ils produisent des graphiques, ils produisent des analyses et ils vont sur des terrains que je n’avais même pas imaginés, même au niveau de mon besoin. Le fait de rester au niveau du besoin, ça me permet d’utiliser leur expertise et ça me permet, moi, de rester high level. C’est-à-dire, du coup, comme ça, je ne suis pas rentré dans tout le détail et je réagis par rapport à ce qu’ils me fournissent. C’est un peu ma méthode que j’applique sur mes trois équipes, d’ailleurs.
Marc Sanselme 00:29:27 – 00:29:41 : Donc un peu une sorte de refuser de rentrer dans le détail justement pour qu’il y ait un effort de synthèse qui soit fait. et cet effort de synthèse permettra aussi de filtrer l’information inutile.
Johan Maussion 00:29:41 – 00:30:30 : Un effort de synthèse et un effort de sortir du cadre. Si jamais on leur donne trop la solution tout de suite, en fait, ils ne vont pas sortir du cadre. Ils vont faire ce qu’on leur demande. Le fait de leur fournir des questions, alors après, ils ont le droit de poser des questions, mais le fait de leur fournir une question qui est quand même assez vaste, par exemple, est-ce que nos ventes se sont bien comportées sur l’été ? C’est une question qui est très vaste. Mais du coup, ils vont aller chercher certainement des indicateurs qu’on exploite quelques fois un peu moins. parce qu’ils vont creuser une partie. alors il y a beaucoup de tâtonnements. c’est pour ça que je disais ça prend quelquefois un peu plus de temps mais tant pis sur certains aspects parce qu’ils découvrent et en découvrant on peut découvrir des nouvelles choses. et puis on se dit bah tiens cet indicateur là qu’on suivait pas. il y a peut-être de la valeur il faut peut-être qu’on l’inclue dans nos indicateurs stratégiques de performance.
Marc Sanselme 00:30:31 – 00:30:45 : ok Est-ce que tu as des exemples de grands verrous technologiques, de grands obstacles que vous avez surmontés, résolus ? Est-ce qu’on pourrait en prendre un ?
Johan Maussion 00:30:45 – 00:32:56 : Alors, des verrous technologiques, je dirais que la quantité de données reste quand même un sujet. Comme je disais, on vend énormément de billets. On est une entreprise… où la donnée est quand même très importante. On essaie de la minimiser en fonction de nos use cases, mais ça reste quand même très important. Et aujourd’hui, les technologies sont là pour capter de la donnée, un maximum de données. Mais après, dans l’exploitation, ça fait une somme de données importantes à regarder. Une donnée qu’on ne regarde pas, c’est une donnée qui devient très vite de non-qualité. Sur tout un tas de données, c’est infini, on peut en sortir X indicateurs qu’on peut regarder dans un sens, dans l’autre, etc., C’est un peu ça la difficulté qu’on peut avoir, les freins qu’on peut avoir. Sur ce pool de données, il faut qu’on arrive à trouver les éléments qui vont nous permettre de mesurer la performance. Et là, il y a toute la difficulté. Je voudrais juste partager un dernier élément aussi, une dernière difficulté, c’est l’accompagnement au changement. qu’on peut avoir, notamment sur la mesure de la performance. Mon équipe génère des reporting, elle crée des reporting, elle crée des analyses, et en fait dans cet accompagnement du changement, c’est que les gens, les collaborateurs en interne peuvent avoir l’habitude de voir les choses d’une certaine manière. Quand je suis arrivé chez SNCF Connect & Tech, l’ambition c’était de mettre en place un outil de data visualisation, de sortir du Excel ou d’outils qui étaient plus des ancêtres. Et il y a tout un accompagnement de changement parce qu’il y a des habitudes dans la donnée. On a l’habitude de regarder un indicateur, on a l’habitude de regarder des dimensions. Et justement, pour revenir à ta question de tout à l’heure sur les méthodes managériales, si on reste sur ces habitudes-là, on ne découvre pas de nouvelles choses et on risque de passer à côté de signaux faibles. Et il faut absolument essayer d’ouvrir des nouvelles technologies et d’ouvrir le champ des indicateurs que l’on a à regarder. C’est un peu les verrous que je vois. La somme de données qu’on peut avoir et l’accompagnement du changement sur la donnée et toutes les habitudes que les collaborateurs ont aussi.
Marc Sanselme 00:32:56 – 00:33:07 : Dans cette thématique-là, quelles erreurs est-ce que tu peux nous partager dans l’erreur du passé que tu peux nous partager pour nous faire gagner du temps ?
Johan Maussion 00:33:07 – 00:34:19 : Je dirais de ne pas voir trop… C’est la théorie des petits pas pour moi. Si jamais on ne fait pas la théorie des petits pas, si on voit tout de suite une analyse dans son ensemble ou une prédiction ou essayer de lancer un projet, même d’IA, tout de suite avec la cible, on n’y arrivera pas. Surtout avec la data. En fait, il faut y aller petit peu par petit peu. Sinon on va chercher trop gros, on va s’épuiser, on va épuiser nos collaborateurs et on aura l’impression de rien produire. Moi je suis un partisan des petits pas. J’ai déjà eu à expérimenter pour un data catalogue par exemple, remplir un data catalogue. on peut se dire je vais tout remplir. Ça ne fonctionne pas parce qu’en fait en voulant tout remplir on ne remplit rien au final ou alors on remplit des choses qui ne sont pas forcément importantes pour l’entreprise. C’est exactement la même chose quand on descend dans le niveau de la donnée. Il faut y aller petit peu par petit peu. Donc, mon conseil, c’est de ne pas voir trop grand sur la data et de ne pas attendre. Ça dépend des analyses, mais nous, on est sur la mesure de la performance. Donc, il faut que ce soit quand même assez rapide. On ne peut pas attendre de mesurer la performance et de donner les résultats trois semaines après. C’est souvent trop tard. Et donc, oui, il faut accepter de faire des petits pas et ne pas forcément donner la réponse tout de suite.
Marc Sanselme 00:34:21 – 00:34:55 : Comment tu défends cette poétique des petits pas, cette agilité, comme on pourrait l’appeler très itérativité, face à des gens qui demandent un budget pour l’an prochain, qui te demandent combien de temps il faut pour faire l’ensemble d’une tâche ? Comment est-ce qu’on fait coexister des gens qui aiment bien planifier des grands projets ? avec cette politique des petits pas qui aime bien écrire le cahier des charges en cours de route ?
Johan Maussion 00:34:55 – 00:35:30 : On peut fournir des données très rapidement. En fait, le fait de produire des premières données qui vont commencer à nourrir les interlocuteurs en face, ça déjà détend l’atmosphère. Ensuite, une fois qu’on a nourri une première partie, on laisse le temps de réflexion pour ajuster leur projet ou leur budget pour l’année prochaine. Et après nous on continue par contre, c’est-à-dire qu’on ne s’arrête pas à ce moment-là. Mais en fait c’est comme un projet agile, le fait de livrer quelque chose, de tester ce qui a été livré et de l’ajuster, ça évite de livrer un projet qui en bout de chaîne ne répond pas aux attentes des utilisateurs.
Marc Sanselme 00:35:30 – 00:35:51 : Et globalement, dans une boîte aussi grosse qu’une filiale de SNCF Voyager, c’est des processus qui s’appliquent bien. On arrive à piloter avec des petits pas et du court terme. On n’a pas des comptes à rendre un peu long terme compliqués.
Johan Maussion 00:35:51 – 00:37:02 : Si, mais ça s’ajuste au fur et à mesure. En fait, en fournissant un chiffre, on a beaucoup d’interactions entre les différentes directions. On travaille pour les directions commerciales, direction client, direction produit. En fonction de la performance que l’on observe, on va derrière fournir des premiers chiffres. Eux vont avoir des retours, ils ont des premières questions. C’est beaucoup d’interactions à la data. Il ne faut pas s’arrêter sur « je fournis une grosse présentation ». Ça dépend encore une fois de ce qu’on veut en faire. Des fois, il y a des études qui nécessitent qu’on passe du temps, qu’on fournisse une étude bien ficelée, etc. Sur la mesure de la performance, c’est autre chose. La mesure de la performance, c’est qu’on avance aussi avec les sachants. Nous, on est côté data. On n’a pas forcément tous les tenants et les aboutissants côté produit, côté direction commerciale ou côté direction marketing. Et donc, c’est nous, on leur fournit des chiffres. L’objectif, c’est qu’ils puissent s’emparer de ces chiffres-là pour soit ajuster leurs actions, soit comprendre les actions qu’ils ont faites et pouvoir nous challenger en nous disant « j’ai besoin aussi de ce chiffre-là en plus ». C’est là où moi, je remonte d’un cran en leur disant « mais tu en as besoin, pourquoi ? Est-ce que c’est pour lancer une action ? Est-ce que c’est pour comprendre ? ». Parce que du coup, ce ne sont pas forcément les mêmes indicateurs. Et donc, cette théorie des petits pas, elle est liée aussi à une très bonne communication qu’on doit avoir entre les différentes directions. Ok.
Marc Sanselme 00:37:03 – 00:37:10 : Alors, déjà, qu’est-ce que tu préfères et que tu aimes le moins dans ton travail ?
Johan Maussion 00:37:10 – 00:38:20 : Ce que je préfère, c’est que chaque journée est différente de l’autre. En fait, dans la donnée, on peut découvrir, soit parce qu’il s’est passé quelque chose la veille sur notre site, notre application, comme une ouverture des ventes, soit parce qu’il y a des chiffres qu’on ne comprend pas. parce qu’on a des évolutions ou des choses qu’on ne comprend pas soit parce qu’on a des projets à mener. la data elle est partout. et donc c’est un peu ce qui me fait me lever le matin c’est de me dire ok cette donnée je peux l’exploiter et je vais pouvoir en tirer quelque chose de nouveau à chaque fois. ce qui me plaît peut-être un peu moins c’est un peu justement. c’est ce qui va avec cette infinité de données c’est que on peut se perdre et des fois on se perd et des fois on dit qu’on peut tout expliquer par la data. Puis il y a des choses qu’on n’arrive pas à expliquer par la data. Donc il y a une certaine frustration et c’est des éléments exogènes qu’on ne maîtrise pas quand on nous pose la question. Et en fait, on se rend compte que la data, elle n’explique pas tout. Et donc il y a cette frustration qui peut arriver. Ou alors c’est qu’on ne voit pas. Par l’infinité de la donnée, des fois, on n’a peut-être pas mis les bonnes dimensions, on n’a peut-être pas pris les bonnes datas.
Marc Sanselme 00:38:22 – 00:38:27 : Est-ce que tu as une anecdote à nous partager ?
Johan Maussion 00:38:27 – 00:39:21 : Oui, une anecdote. Quand je suis arrivé chez SNCF Connect & Tech, une de mes premières missions, ça a été de développer la data vise. Et je suis arrivé le jour du confinement. le jour même, où on nous a dit, il faut rester confiné chez vous. Et en fait, il y a eu, je ne sais pas si tu te rappelles, mais il y a eu un jeune étudiant qui s’appelait Guillaume Rosier qui avait lancé CovidTracker. Et en fait, je me suis dit, ça tombe bien, il a utilisé la database pour démocratiser une donnée que tout le monde voulait regarder. Et moi, j’avais comme mission de démocratiser la data au travers de l’outil de database. Donc je me suis dit, ça tombe très bien, Je vais utiliser ce qu’il a fait, c’est-à-dire qu’il a pris quelque chose qui était utile. En fait, il a pris un tableau de bord qui était utile pour l’ensemble des Français, mais je me suis dit, moi, pour développer la database, il va falloir que je trouve le dashboard le plus utile pour développer la database dans l’entreprise.
Marc Sanselme 00:39:21 – 00:39:25 : Tu as clarifié ta fiche de poste et il a évangélisé en même temps.
Johan Maussion 00:39:26 – 00:39:28 : Exactement. C’était parfait.
Marc Sanselme 00:39:28 – 00:39:32 : Est-ce que tu as une opinion que tu voudrais partager ?
Johan Maussion 00:39:32 – 00:40:27 : Oui. En fait, J’entendais hier, je crois que c’était une interview sur France Info, on revoit encore les maths, on ne sait pas trop comment. est-ce que les mathématiques doivent être enseignées à l’école, est-ce que c’est important ou pas? important, parce que souvent les étudiants, moi je suis le papa de deux enfants, on me dit mais à quoi ça va me servir? les maths, etc. Et en fait on vit dans un monde de données. et je pense que les mathématiques à l’école ont une place toute importante parce qu’aujourd’hui tout est donné on entend les élections tout tourne autour de la donnée et les matières scientifiques sont extrêmement importantes pour comprendre le monde d’aujourd’hui. donc voilà c’est vraiment ça pour moi qui est extrêmement important. j’aimerais que cette partie mathématique revienne sur le devant de la scène parce que c’est ce qui permet aux différentes personnes de comprendre le monde qui nous entoure.
Marc Sanselme 00:40:30 – 00:40:36 : Quels sont les chantiers en cours dans l’équipe que tu diriges ?
Johan Maussion 00:40:36 – 00:41:05 : beaucoup d’expérimentation. encore une fois sur la partie on veut vraiment on parlait de l’IA tout à l’heure pour la partie productivité. je veux vraiment essayer de développer cette partie là. moi mon ambition c’est vraiment de recentraliser mes collaborateurs sur une partie plus analyse c’est à dire que j’utilise leur cerveau pour faire des analyses plus poussées plus concrètes pour les directions pour lesquelles on travaille. et donc les prochaines étapes en tout cas côté dans mes équipes c’est vraiment de développer ces expérimentations avec les outils d’intelligence artificielle qui sont disponibles.
Marc Sanselme 00:41:06 – 00:41:14 : ok et qui est-ce que tu aimerais entendre au micro de Data Driven 101 dans un prochain épisode ?
Johan Maussion 00:41:14 – 00:41:47 : alors je suis fan de sport. une application moi qui me que je trouve juste géniale c’est Strava et j’aimerais entendre quelqu’un qui travaille sur la donnée justement chez Strava de savoir comment est-ce qu’ils exploitent cette data là pour développer tout ce qu’ils ont mis en place aujourd’hui. je crois que On le dit, si ce n’est pas sur Strava, c’est que tu n’as pas fait de sport. C’est quelque chose comme ça, je crois, le texte. Et c’est grâce à la data qu’ils ont développé cette application-là. Ils ont tout misé sur la data. Je trouve que j’aimerais bien entendre quelqu’un qui parle de la data chez Strava.
Marc Sanselme 00:41:47 – 00:41:49 : Très bonne idée. Merci beaucoup, Johan.
Johan Maussion 00:41:49 – 00:41:50 : Merci, Marc.
Marc Sanselme 00:41:50 – 00:43:12 : Je vais faire la petite outro. Vous venez d’entendre Johan Motion, directeur performance, business et web analytics chez SNCF Connect & Tech. Dans le prochain épisode, je recevrai Johan Motion, directeur performance business et web analytics chez SNCF Connect & Tech pour nous parler d’IA et de mobilité. A très vite.