L'APPRENTISSAGE DE LA LECTURE GRÂCE À l'IA
Laurent Jolie, fondateur et directeur des opérations chez Lalilo, est l’invité de l’épisode 12 de Data Driven 101.
Il nous explique comment Lalilo utilise l’intelligence artificielle pour améliorer l’apprentissage de la lecture, mais nous parle aussi :
👉🏼 de la nécessité de faire fonctionner les algorithmes et les professeurs ensemble.
👉🏼 de la personnalisation de la méthode
👉🏼 de l’importance de mesurer la progression
Marc — 00:00 :
Aujourd’hui, je reçois Laurent Joly, directeur des opérations et cofonder à la lilo, la Lilo est un outil destiné à aider les professeurs des écoles à l’apprentissage de la lecture. C’est une entreprise qui a été rachetée par Renaissance groupe il y a 2 ans. Bonjour Laurent.
– Laurent — 00:12 :
Et Marc. Et merci de m’avoir invité.
– Marc — 00:14 :
Avec grand plaisir alors, est-ce que tu peux nous raconter ce que fait lalilo exactement?
– Laurent — 00:19 :
Donc on fait un outil numérique qui va comme tu le disais, aider les élèves à apprendre à lire. On va avoir 2 interfaces, une interface pour l’élève dont la spécificité, ça va être de choisir une activité pour chacun des élèves de la classe. Soit différente des autres et qui soit adaptée à cet élève et pour l’enseignant d’avoir une bonne visualisation, de là où en sont ses élèves. En ce qui concerne l’apprentissage de la lecture.
– Marc — 00:41 :
D’accord, donc le support, c’est une application.
– Laurent — 00:44 :
Exactement.
– Marc — 00:44 :
Mobile, ouais, et vous avez donc 2 interfaces, l’interface élève et l’interface professeure. La data chez les Lilo, à quoi ça sert? Comment est-ce que vous faites usage de la data?
Laurent — 00:50 :
Alors on a? Un premier usage qui est au cœur du produit. On a 2 propositions de valeur data au cœur de notre produit. La première, qui est probablement la plus importante, ça va être d’utiliser de la data pour choisir quelle est l’activité la plus pertinente pour un élève à un instant donné. En ce qui concerne son apprentissage de la lecture, c’est une technologie qui s’appelle l’Adaptative Learning qui a différentes couches de de complexité. On a un 2ème aspect qui est intéressant et qu’on a développé depuis le début de l’agglo qui est une technologie de reconnaissance vocale spécifique de l’apprentissage de la lecture parce que pour apprendre à lire une activité qui est très pertinente, c’est de le lire à voix haute et d’avoir un feedback immédiat sur sa réponse. Ouais, donc on va avoir des exercices qui vont proposer à des élèves de lire des syllabes, des mots, des phrases et de leur faire une correction sur ce qu’ils ont bien prononcé ou pas. Alors ça, c’est un aspect qui est dans le produit. Ensuite, on a comme n’importe quel entreprise un usage de la data qui nous permet de mieux comprendre nos utilisateurs.
– Marc — 01:56 :
Sur le premier usage donc, vous vous adaptez à chaque élève. Quel genre de données? Sur quoi est-ce que vous basez pour dire? Tel élève est plus adapté à telle ou telle méthode, telle activité, et je dis méthode, mais est-ce que c’est carrément des méthodes différentes ou est ce qu’on va dire c’est plutôt fait, telle ou telle activité?
– Laurent — 02:16 :
Alors, il y a beaucoup de vocabulaire très spécifique dans l’éducation et donc faut faire attention à tous les mots, ce qu’on appellerait une méthode de lecture, c’est quelque chose de plus large que ce qu’on propose par méthode. On entend vraiment solution d’A à Z pour apprendre à lire. Nous, on va se positionner comme un complément à l’apprentissage de la lecture. Et on va complémenter une méthode de lecture. Donc en disant dans cette méthode de lecture, qui est généralement la même pour tous les élèves de la classe, il va y avoir un élève qui va louper une marche. Un autre élève va louper une autre marche et nous, on va avoir une forme d’intelligence qui va essayer de complémenter ces méthodes de lecture. Donc ensuite, comment est-ce qu’on va choisir, quelle est la bonne activité pour un élève? Donc il y a 3 sources de données pour ça. La première c’est pas de la donnée, on va dire, c’est l’état de l’art en recherche d’apprentissage de la lecture qui est travaillée par différents domaines de la psychologie cognitive, des neurosciences, de la linguistique, de la didactique. Il y a un certain nombre de spécialistes qui vont s’intéresser à cet apprentissage et qui ont fait avancer, puis plusieurs siècles millénaires la question de comment est ce qu’on apprend à lire? Donc on va pas partir de 0, on part de cette base là. Ensuite, la 2ème source dont je parlerai, c’est celle de l’ensemble de nos utilisateurs quand ils vont répondre à des questions, on va savoir quelles questions on a posé, à quoi ressemblait la question, est-ce qu’ils ont eu bon, est-ce qu’ils ont eu faux, parfois y a le type d’erreur, ils ont fait et on va avoir des indications sur ce qui marche, ce qui marche pas avec l’ensemble des élèves et ensuite la 3ème source qui est inclus dans cette 2ème, c’est les réponses d’un élève donné, c’est-à-dire que parce qu’on a réussi à avoir des indications avec d’autres élèves qui sont passés sur les mêmes exercices avant lui. On va pouvoir savoir quelle est l’activité qui va permettre à un élève de progresser ou non.
– Marc — 04:04 :
Donc vous récupérez une donnée de feedback sur les exercices au fur à mesure.
– Laurent — 04:08 :
Globalement, c’est ça, on récupère principalement quelles réponses à 1QCM un élève à donner sur une question de lecture
– Marc — 04:16 :
Ok donc il s’agit d’identifier les points forts, les points faibles et tirer des conclusions sur peut être est ce qu’un exercice a été efficace pour faire apprendre quelque chose d’une part et d’autre part qu’est-ce qu’il faut encore faire progresser? Ce qu’il faut encore. Faire s’exercer la personne, c’est un peut être les 2 interprétations que vous pouvez faire.
– Laurent — 04:39 :
Ouais ce que tu dis c’est vraiment le béaba et effectivement toute la complexité se retrouve juste après ça. Pourquoi le béaba? Parce que le béaba c’est effectivement de poser une question qui, au bon niveau de difficulté pour un élève, là ça se complique, c’est que l’apprentissage de la lecture ou n’importe quel apprentissage de quelque chose d’assez conséquent, on va pas être linéaire, c’est à dire qu’il peut y avoir, pour simplifier donner 2 branches des élèves qui sont bons en code, c’est-à-dire en capacité à prononcer à voix haute ce qui vont lire ce qui va être écrit devant eux. Et qui sont mauvais en compréhension, donc en fait, ils vont avoir du mal à comprendre ce qui a été écrit. Mais si on fait de la compréhension orale même si on leur disait je veux dire, on fait des exercices de compréhension orale, on va lire un texte à voix haute à un élève et voir si il donne la bonne réponse lire, c’est avoir un texte écrit et le comprendre. Donc en fait il va y avoir certains élèves qui vont avoir besoin d’avancer sur une branche et qui vont avoir un certain score sur cette branche et d’autres qui vont avoir besoin plutôt d’avancer sur l’autre branche et qui vont avoir un certain score sur sur cette branche là. Ce qui est compliqué également, c’est d’avoir une mesure du progrès. C’est en fait ce qu’on veut mesurer, c’est pas. Est-ce qu’un élève donne une bonne ou une mauvaise réponse? C’est ce qu’un élève va progresser avec un une activité donnée et c’est compliqué parce qu’on peut donner une mauvaise réponse et très bien progresser parce qu’on a donné une mauvaise réponse et qu’on a fait une erreur et qu’on a compris son erreur. Tout comme on peut progresser parce qu’on est en train de draguer et de donner des bonnes réponses à un exercice et de la consolidation. Donc ce qui est assez compliqué, c’est plutôt d’avoir une bonne heuristique de ce que ça veut dire. Le progrès et de l’avoir sur un élève donné plutôt que d’avoir ça de facilement statistique.
– Marc — 06:05 :
Jusqu’où est-ce que vous allez sur la personnalisation de l’enseignement en utilisant la la donnée?
– Laurent — 06:12 :
Et c’est une très bonne question dans la mesure où c’est très dur d’y répondre. Ce qui assez compliqué de sur l’adaptative learning, c’est que c’est un peu un un mot générique qui juste dire on va proposer des activités adaptées à un élève. Ces activités adaptées, elles peuvent être adaptées de façon très simple. C’est on peut dire Ben en fait on a un parcours linéaire et des élèves sont à différents endroits de ce parcours. On pourrait dire, c’est de l’active learning. On va plus loin que ça, donc on a une capacité à décomposer ce que c’est que l’apprentissage de la lecture en plusieurs composants élémentaires et à essayer de trouver quel est le composant élémentaire qui va le plus aider. Un élève donc pour répondre à la question dans l’autre sens, ce qu’on ne fait pas, mais qu’on aimerait bien faire, c’est qu’on a la même méthodologie de d’apprentissage pour tous les élèves. On pourrait imaginer à un moment réussir à se dire en fait, tel type d’élève, ce qui est adapté pour lui, c’est d’apprendre une certaine manière et tel autre type d’élève. Et d’apprendre une autre manière pour être assez concret, il y a un long débat dans l’apprentissage de la lecture, par exemple, qui est de savoir pour des élèves ce qu’il faut mieux avoir une entrée phono, une entrée graph c’est en fait ce qu’il faut mieux dire. Un élève, je t’apprends les lettres de l’alphabet, tu les visualises et après je vais dire ces lettres là, elles ont une façon de se prononcer ou alors de dire à un élève Ahh, Bah tu vois, quand on parle, on prononce des sons t’entends ces sons, et Ben faites figure-toi ces sons là, ils peuvent s’écrire et en fait, alors il y a des gens qui ont des avis sur ce qu’il faut mieux avoir à obé, et j’avais envie de de rentrer dans le débat. Moi, ce que j’aimerais bien qu’on réussisse à faire un un jour avec du kilo, c’est de dire mais en fait, pour tel élève, si ça se trouve, il faut avoir une entrée phono et pour tel autre élève il faut avoir une entrée bravo et ça on n’est pas encore en mesure de le faire.
– Marc — 07:52 :
D’accord et le point que tu soulèves est intéressant, c’est à dire que l’apprentissage de la lecture c’est un sujet qui est presque politique. On va dire même philosophique, en tout cas très chargé d’opinion. La Lilo, ce que vous offrez, ce que vous proposez, ce que ça suggère? Disons, est-ce que vous avez des détracteurs?
– Laurent — 08:10 :
Je pense que quand t’as pas de détracteurs que tu fais rien de très innovant, alors on assume même éventuellement quelques je veux dire à externalités négatives, à notre produit. Typiquement, il y a un vrai sujet de l’exposition des enfants aux écrans et on est en train de proposer un produit pédagogique qui a lieu sur un écran. Donc en fait, on augmente du temps d’écran pour les élèves. Donc ne serait-ce que ça finalement, c’est c’est négatif. Nous notre point là-dessus, c’est que bah nous, on fait du temps pédagogique, peut-être que c’est pas d’abord. Donc faut taper sur le temps d’écran, mais peut-être sur d’autres personnes. Mais actuellement, c’est un point qu’on assume et qu’on essaie de travailler. Alors l’apprentissage de la lecture, c’est, c’est surtout un enjeu social, c’est l’accès à l’information. En réalité, on n’a pas présenté comme ça, mais nous, ce qui nous intéresse, c’est le décrochage scolaire qui a plutôt lieu en fin de collège et en fait, nous, notre constat, c’est que pour lutter contre le décrochage scolaire, donc des gens qui finalement vont souvent avoir un décrochage sociétal. Après l’idéal c’est d’agir très tôt, dès le CP sur de l’apprentissage de la lecture, parce qu’y a un apprentissage. Quelque chose qu’on appelle l’effet Mathieu qui est de dire un élève, moins il va comprendre, moi il va comprendre ça en fait. Il va arriver donc on dit y a 20 % des élèves qui arrivent en 6ème sans savoir lire, sans savoir lire. C’est une définition particulière, mais c’est assez important. En fait, ça veut dire qu’ils n’ont pas le niveau en lecture pour suivre une scolarité normale. Ouais et globalement le prof va leur donner du travail à la maison n’attend d’eux qui soit en mesure de faire travailler à la maison s’ils ne savent pas lire, ils vont pas pouvoir le faire. Donc en fait, il va encore moins bien progresser que les élèves qui ont déjà un petit peu d’avance donc c’est cet enjeu là. Donc en tant que compétence fondamentale qui est souvent discutée. Alors le grand débat sur l’apprentissage de la lecture, c’est méthode syllabique ou méthode globale? Donc c’est dire, est ce qu’on doit enseigner à des élèves à reconnaître des mots de manière globale, c’est à dire un mot en entier ou est-ce qu’on doit leur apprendre à décomposer le mot sous forme de syllabes? C’est assez intéressant parce que c’est un sujet qui est plutôt bien tranché. Il y a encore des des gens qui en discutent, mais qui est plutôt bien tranché en faveur de la méthode syllabique d’un point de vue scientifique. Ce qui s’est passé historiquement, qui est intéressant, c’est qu’on a découvert il y a quelques dizaines d’années que les adultes lisaient de manière globale, c’est-à-dire lisaient des mots en entier, donc il y a plein de scientifiques qu’on dit, mais en fait, on apprend aux élèves à lire de manière syllabique si la part syllabe, alors que quand ils seront adultes, ils iront par mot entier. Donc on perd énormément de temps, autant leur apprendre directement à lire de manière globale et ce qui est incroyable, c’est qu’on a écouté cette recherche scientifique très vite alors que d’habitude on a énormément de mal à faire entrer les progrès scientifiques et les progrès de recherche scientifique. À l’éducation on l’écoutait peut-être un peu trop vite et on a passé ça à l’échelle partout en France, on s’est rendu compte de nombreuses années plus tard que c’était une erreur, que ça avait fait pas mal de dégâts et on essaie de revenir dessus, mais on a eu un message tellement fort dans cette direction-là qu’on a du mal à revenir en arrière.
– Marc — 10:57 :
Alors tu parlais d’identifier les endroits où y a du décrochage, donc ça m’amène à parler un petit peu de l’utilisation de la data sur votre positionnement lui-même, est-ce que tu peux nous parler un peu de ce que vous avez fait avec la data pour décider de votre cœur de cible? Votre stratégie, on va dire commerciale?
– Laurent — 11:15 :
Alors, le gros avantage effectivement d’enregistrer de la data pour notre produit, c’est que très tôt on a eu ce réflexe d’enregistrer de la data qu’on avait à disposition et qu’on a pu utiliser pour mieux comprendre notre usage. On a utilisé ça pour comprendre comment ça se passait dans les salles de classe, on s’est rendu compte, ça a été un peu une une première surprise qu’on avait eu assez peu d’enseignants qui utilisaient la lilo en classe entière. C’est on se rendait compte qu’on avait rarement 20 élèves connectés en même temps. Sur notre plateforme donc vu qu’on jumelait ça avec beaucoup de présence dans les salles de classe, on comprenait que les cas d’usage qu’on observait, on pouvait les retranscrire par pourcentage d’utilisateurs et donc on se rendait compte que les cas d’usage majoritaire finalement, c’était le cas d’usage remédiation, c’est à dire un enseignant qui va mettre un ou 2 élèves sur un ordinateur en fond de classe sur l’agglo pour rattraper le niveau de la classe parce que c’est des élèves qui sont plutôt en retard ou alors ce qu’on appelle des îlots de travail. Donc en fait, le professeur va mettre. 5-6 élèves chacun avec une tablette sur la lilo, 5-6 élèves en train de faire des calculs de maths, 5-6 élèves avec lui pour faire de la lecture à voix haute et va tourner toutes les 20 minutes. Ça, on l’observe assez bien dans la data.
– Marc — 12:24 :
Alors dans ton cadre d’opérations de direction des opérations, à quoi peut servir la data?
– Laurent — 12:30 :
Alors en réalité, moi, mon travail consiste surtout à trouver comment mieux développer l’outil dans différentes régions du monde, ce qui va nous intéresser beaucoup, c’est de réussir à récupérer de la donnée d’usage à un instant donné dans l’endroit qui nous intéresse. Typiquement, je suis en train de travailler sur un programme pour développer la kilos dans les écoles défavorisées, donc ce qu’on appelle les REP et REP plus en France et ce qui va m’intéresser, c’est déjà d’avoir un État de l’art. De quel usage en France on a en rep plus aujourd’hui, donc là on a une, c’est une méthode dans notre dans notre entreprise assez simple, c’est qu’on a une équipe data qui est en mesure de répondre toutes les semaines, a plein de petites requêtes comme ça qu’on peut avoir et qu’on a du mal à récupérer avec les outils qu’on qu’on a à disposition simplement tout simplement par exemple parce que les écoles. Après, plus on pas tagué et qu’il faut voilà comparer avec une base existante donc c’est plus des informations sur comment est notre usage aujourd’hui afin de mieux comprendre comment l’adapter à demain.
– Marc — 13:27 :
Alors ce que tu peux nous partager une décision business que tu as déjà pris avec la data.
– Laurent — 13:33 :
Ouais, alors un travail qu’on a fait récemment qui était assez compliqué pour nous. Ça a été de qu’il est notre modèle. Semion suite à notre acquisition, donc on avait un modèle freemium, donc une grande partie de notre outil était gratuite, sans limitation dans le temps et ensuite on vendait des fonctionnalités premium. Euh, notre acquéreur qui a un certain nombre de produits, est plutôt sur une approche. Voilà, on vend le produit et c’est tout plus classique, et c’est relativement intéressé par cette partie freemium justement de dire, est ce qu’on pourrait pas innover là-dessus? Et on a pas mal analysé nos données pour nous rendre compte d’est-ce que c’est pertinent ou pas de garder ce modèle là? Donc là récemment on est en train de changer de modèle au moins sur du Free trial partout dans le monde. Sauf en France, principalement parce qu’on s’est rendu compte que c’était beaucoup plus pertinent.
– Marc — 14:28 :
En termes de revenus, en termes d’adoption, vous, ou est-ce que le modèle freemium avait un effet négatif sur le l’usage?
– Laurent — 14:37 :
Un peu tout ça. Alors évidemment, on couple toujours ça du à du qualitatif, hein. On essaie de comprendre pourquoi des gens n’utilisent pas, alors il y a une petite partie, effectivement, qui est un retour assez massif des vendeurs qui disent bah en fait il y a un certain nombre de personnes qui se satisfont bien de la version gratuite et qui ne voient pas trop l’intérêt de payer alors que si elle n’existait pas il serait prêt à payer. Pour il y a un 2ème point qui est l’impact, c’est à dire qu’on s’est aussi rendu compte que nous une des choses qui nous tenaient à cœur, sur le modèle gratuit, c’était de permettre à un certain nombre d’utilisateurs de pouvoir utiliser même s’ils avaient pas les moyens de payer pour cette solution. Et on s’est rendu compte que c’était finalement un cas assez faible. Et ensuite ça crée beaucoup de complexité interne, trop plus finalement que des coûts de serveur ou des coûts de de support utilisateur. On avait une grosse complexité interne liée à ce modèle là qui n’en valait finalement pas la chandelle au vu de ce qu’on observait.
– Marc — 15:33 :
Et ce que tu peux nous parler d’une décision, on va dire d’évolution produit qui aurait été prise grâce à la data.
– Laurent — 15:40 :
Ouais alors bon, c’est là-dessus qu’on est quand même les plus utilisateurs de données. Un exemple que j’ai beaucoup aimé, c’est un travail qui avait fait un élève en thèse cifre chez nous, Thomas, sur un travail de recherche qui montrait que si on aidait les élèves à mieux analyser quelle était leur niveau, ils allaient mieux progresser, c’est à dire en fait, on a des élèves qui sont en sur confiance et des élèves qui sont en sous confiance et donc une question qu’on peut poser à des élèves pour mesurer leur confiance en eux, c’est, est-ce que tu veux des exercices plus durs ou plus faciles? Et il y a certains élèves qui sont sur des exercices déjà trop durs pour eux pour bien progresser et qui vont avoir tendance à avoir des exercices encore plus durs, donc ils vont avoir tendance à encore plus échouer et des élèves qui finalement réussissent bien, mais veulent l’exercice plus facile parce qu’ils ont besoin d’être dans une certaine zone de confort. Donc ce qui est intéressant, c’est que c’est un type de question qui n’a rien à voir avec l’apprentissage de la lecture. C’est vraiment une compétence métacognitives quoi. C’est un un une fonction exécutive dont on a besoin pour bien apprendre mais qui n’est pas de l’apprentissage de la lecture directement. On a travaillé sur ces questions-là on en a analysé les résultats, on a fait des recommandations aux élèves sur fais attention, tu devrais plutôt mieux te modérer et on a constaté que le fait de proposer ce genre d’exercice faisait progresser les les élèves, ce qui est relativement contre intuitif et ce qui a mené vie sans data aurait mis énormément de temps à convaincre d’être utilisé pédagogiquement dans notre outil. Un 2ème exemple que j’ai, c’est, on produit nous-mêmes le contenu pédagogique qui va être proposé aux élèves, les questions, les activités que les élèves font. Et choisir quel contenu créer et pour nous, c’est très utilisé le d’avoir de la donnée, c’est qu’en fait on se rend souvent compte qu’on va passer du temps à créer du contenu pédagogique qui finalement ne va pas être utilisé parce que notre algorithme ne va pas vouloir proposer ces questions-là aux élèves pour différentes raisons. Parce qu’en fait, ce qu’on a créé comme contenu pédagogique est toujours inutile, ou alors est redondant par rapport à des choses qui existent déjà alors qu’il y a d’autres endroits où on aurait envie de créer une activité très précise avec des labels très précis qu’on a tendance à pas faire et donc la donnée. De quelle exercice notre algorithme aimerait poser, nous permettre de construire le le bon contenu et surtout de ne pas travailler inutilement d’un point de vue pédagogique?
– Marc — 17:56 :
Quelles sont les limites pour toi de l’utilisation de la data dans ce cadre?
– Laurent — 18:00 :
Il y a beaucoup de limites et on s’est pris ces limites là les unes après les autres pendant, pendant les 7 années qu’on a passé à créer la lilo, je sais pas si ça répond directement à la question de limite, mais je pense qu’on a eu tendance à s’appuyer beaucoup sur des utopies, de la data va être capable de tout nous faire. Notre premier réflexe justement sur la génération de contenus pédagogiques, ça a été de dire Bah en fait nous on va faire des algos qui vont générer des contenus à proposer aux élèves et on a une première approche qui était de dire bon bah voilà il faut leur faire lire des mots, on prend le dictionnaire et puis on va choisir avec certains critères les bons mots dans le dictionnaire. Puis en fait, on, on s’est rendu compte qu’on passait tellement de temps à corriger les erreurs de l’algorithme que ça prenait vraiment moins de temps d’avoir quelqu’un qui choisissait d’abord les mots et ensuite que notre algo choisisse dans ces mots là, donc c’est un premier écueil qui était de dire en fait c’est nos algos qui vont générer le le contenu à voir ce que ça donne maintenant avec les nouveaux outils comme chat GPT mais même là-dessus on a essayé un petit peu de voir ce que chat GPT pouvait nous apporter et en vrai c’est utopique aujourd’hui hein, je je sais pas demain mais aujourd’hui c’est utopique de considérer que le contenu peut être 100 % Générés par des intelligences artificielles, on a besoin de faire fonctionner les 2 ensemble. Les autres limites qu’on qu’on prend, alors moi, je suis encore utopiste là-dessus, mais c’est de voir jusqu’où peut aller notre algo de learning. Donc je disais, il y a beaucoup de sujets sur lesquels on aimerait améliorer notre algorithme, notamment être capable d’avoir une méthodologie d’apprentissage individualisé. Et là-dessus, je parlais pas de limite de faisabilité, mais en fait d’une limite prix, c’est à dire qu’en fait pousser nos algos plus loin ça coûte cher, ça prend du temps et la limite elle est liée à notre marché qui est pas un énorme marché ou je veux dire l’éducation nationale a pas? Des fonds infinis pour développer des algorithmes et payer des prestations. Et donc on doit faire avec le temps humain qu’on a pour développer les algorithmes qui vont bien et faire un bon arbitrage entre le temps qu’on passe et la qualité des algorithmes qui sont développés.
– Marc — 19:59 :
Si c’était à refaire, tu ferais quoi différemment?
– Laurent — 20:02 :
Euh Ben pour coup de choses parce que je pense qu’on a fait énormément d’erreurs. Je pense qu’il faudrait dix podcasts pour en faire le tour. Un exemple que j’ai là-dessus c’est qu’y a un moment je crois qu’on a passé un an à essayer d’optimiser un des aspects de notre algorithme qui consistait à améliorer ce qu’on appelle la zone proximale de développement. Donc en fait le niveau de difficulté d’une question qu’on pose un élève et on était tombé sur un sombre article qui et c’est la zone proximale de développement à 75 % de bonnes réponses. Donc on avait une très bonne capacité à prédire la capacité de bonne réponse d’un élève à une question donnée, et en fait, on s’est rendu compte qu’on avait passé un an sur cette question là alors qu’en fait ça s’appelle une zone proximale de développement? C’est une zone, on en a rien à faire que l’élève il donne des réponses 75 % du temps, bonne si c’est 80 c’est très bien, si 70 c’est bien je veux dire ce qu’on avait avant de travailler là-dessus était largement suffisant. Donc bref, je pense que ce que je ferais, je sais pas si on y arriverait, mais je pense que la capacité à prendre vraiment plus de recul sur qu’est ce qu’on veut vraiment et très importante, et je pense que de temps en temps y a des choses qui sont faciles à faire et qui créent pas énormément de valeur et sur lesquelles on va plutôt parce que c’est facile que parce que ça crée de la valeur et je pense que faut choisir ses batailles et temps en temps y a quelques batailles difficiles à aller prendre plus tôt parce qu’elles sont vraiment essentielles et un exemple de que j’ai là-dessus c’est plus ce que j’avais au début de l’épisode. Répondre à la question, qu’est-ce que c’est le progrès d’un élève, c’est une question qui est vraiment non triviale et je pense qu’il y a pas grand monde qui sait répondre à cette question là en regardant de la data de réponse. Il y a quelques tests sur le sujet qui sont très intéressantes mais très peu qui sont implémentés et parce que c’est un sujet dur. Je pense qu’on l’a évité pendant beaucoup trop longtemps avant de s’y mettre trop tardivement.
– Marc — 21:51 :
Il est question de la mesure de la métrique, alors vous avez été racheté, qu’est-ce que ça change de se faire racheter en termes d’intégration? Gestion des données. Je peux nous parler de ça un peu?
– Laurent — 22:02 :
Alors dans les aspects positifs, c’est que finalement, on n’est pas les seuls à avoir des data scientists dans notre organisation, donc ce qui est très agréable, c’est d’avoir accès à d’autres ressources, des gens parfois plus spécialisés sur un outil. Et quand on va avoir, voilà des questions sur un sujet donné, d’avoir des gens qui sont disponibles pour y répondre, c’est assez agréable. Il y a un 2ème aspect qui est-il y a pas mal d’outils, de data qui coûtent assez cher et sur lesquels. Je dis pas qu’on les aurait pas utilisés autrement, mais en tout cas on aurait passé beaucoup plus de temps à essayer d’arbitrer sur ce qu’on paye. Snowflake ou pas quoi. Et le fait de les avoir déjà payés par notre maison-mère. Bon bah ça nous permet d’essayer l’outil plus rapidement et de trancher plus rapidement sur l’intérêt de l’utiliser ou pas.
– Marc — 22:48 :
C’est quoi les trucs les plus contre-intuitifs que tu as vus dans dans cette analyse de données?
– Laurent — 22:55 :
J’ai pas beaucoup d’exemples là-dessus parce que je pense qu’on a un gros biais de confirmation à la kilo, c’est-à-dire qu’on va souvent aller chercher des réponses à des questions qu’on pose, et donc c’est assez rare d’être surpris. Mais je suis pas sûr que ce soit une très bonne chose. Les surprises qu’on a eues finalement, je trouve que c’est assez bon signe parce que ça montre qu’on est pas borné là-dessus. J’ai un exemple assez marrant, c’est qu’on a créé très tôt pour l’agglo, pour des raisons historiques, un outil sur 2 pays, les États-Unis et la France. On avait à peu près autant d’utilisateurs aux États-Unis qu’en France. Et en suivait les 2 usages et un beau jour, on s’est rendu compte qu’en fait l’endroit où on avait la plus grosse densité d’utilisateurs, c’était le Canada, c’était une Estonie, la France. Alors qu’on leur créait pas du tout d’outils pour eux et à posteriori, on a compris qu’on avait un énorme product Market fit là-bas parce qu’on crée un outil, justement pour apprendre à lire en français et à lire en anglais. C’est un pays qui est fédéralement, bilingue, qui est culturellement assez proche de ce qu’on faisait à la fois niveau français, niveau américain, et qui est très peu adressé parce que beaucoup plus petit que ces 30000000 d’habitants, c’est beaucoup plus petit que que le marché américain que le marché FR. Parfait donc finalement, on a eu un un très bon PMF localisé au Canada alors que je veux dire, on ça nous intéressait pas du tout comme comme pays.
– Marc — 24:09 :
Aujourd’hui, la lilo, c’est pour prendre à lire, est-ce que c’est votre ambition de faire les maths ou autre chose?
– Laurent — 24:14 :
Quand on a créé la Lilo avec Camille et Benjamin, on s’était dit Bon en quelques mois. En fait, apprentissage de la lecture et puis après on va aller faire d’autres d’autres trucs. 7 ans après, on fait de l’apprentissage de la lecture. On a toujours dans la roadmap de façon mouvante quoi dans 2 ans, on fera des maths mais ça fait 7 ans que dans 2 ans on fera des maths, on a fait des des maths pendant le COVID au moment de la fermeture des écoles, on a eu un très très gros pic d’usage partout en France et on nous a beaucoup demandé de mettre des exercices de maths. On les a mis, on s’est rendu compte assez vite que ça aidait bien pendant le COVID, mais c’était pas au standard de qualité qu’on voulait avoir d’un point de vue pédagogique à tout point de vue et donc on a fait le choix de retirer nos exercices de mathématiques. D’accord quand on demande à notre Communauté. Si on devrait faire des maths, c’est assez mitigé. On a des gens qui nous disent oui, on adore votre outil. On aimerait bien avoir la même chose. Vous faites ça bien, faites des maths et y en a qui disent bah non, on l’a dit, l’eau c’est la lecture, on veut de la lecture, donc on sait pas. On a plutôt eu tendance dernièrement à augmenter le scope de l’apprentissage de la lecture, donc apprentissage de la lecture, ça commence très tôt, ça commence en maternelle avec du langage oral comme je le disais, la compréhension orale c’est une une base de l’apprentissage de la lecture, ça va. Très en aval. Après sur je veux dire comprendre ce qu’on lit et comprendre ce qu’on lit, il y a des gens qui font des thèses sur ce sujet-là donc on a plus tendance à se concentrer sur l’apprentissage de la lecture et la compréhension plutôt que de se diversifier vers d’autres matières, mais on s’interdit pas de le faire.
– Marc — 25:44 :
Concernant la façon dont vous vendez votre produit, je reviens un peu sur les sujets, on va dire d’opinion, comment est-ce que vous communiquez l’usage de la data d’un point de vue marketing? Est-ce que c’est plutôt quelque chose que vous mettez en avant, ce que c’est quelque chose de plutôt utile?
– Laurent — 26:01 :
C’est assez intéressant, alors le premier point là-dessus, c’est que comme je le disais, on est sur 2 marchés principaux, les États-Unis et la France, et la perception de la communication sur ce sujet-là est assez différente dans les 2 pays, on a un sujet particulièrement en France qui est que notre client, c’est le ministère de l’éducation nationale. Notre utilisateur, c’est l’enseignant et notre client. On l’a trouvé principalement à travers un premier appel d’offres qui s’appelait partenariat d’innovation intelligence artificielle. Donc, le ministère demandait des outils qui utilisaient des technologies d’intelligence artificielle pour fonctionner. Dans un premier temps, nous, quand on a développé l’outil, on essayait de communiquer assez peu avec des grands mots comme ça. Intelligence artificielle et cetera, on en parlait plus de pédagogie, d’individualisation, de différenciation, de de s’adapter aux élèves. On avait des mots qui parlaient plus à nos utilisateurs. Mais on a eu besoin de parler d’intelligence artificielle pour notre client qui attendait ça, qui attendait de montrer qu’on savait utiliser des technologies poussées sur ce sujet-là et donc on a eu besoin de mieux expliquer ce qu’on faisait parce qu’on a été poussé à utiliser des des termes qui faisaient un petit peu peur. Et bien sûr, on parle du ministère de l’éducation nationale. Le but, c’était aussi d’être pédagogue sur ce que ça voulait dire. Intelligence artificielle. Donc on s’est retrouvé avec une petite mission annexe. Qui était de démocratiser la compréhension de ce que c’est que l’intelligence artificielle, d’expliquer comment fonctionnent nos algorithmes, d’expliquer pourquoi c’était utile aux enseignants et on se rend compte que c’est assez compliqué de travailler sur ces sujets là. Il y a une grosse peur sous-jacente que jamais très bien compris. Pour être assez honnête dans l’éducation qui est Ah mais alors vous faites de l’intelligence artificielle, du coup vous voulez remplacer les enseignants? Alors non, il n’y a aucune boîte de tech en France qui prétende ça. Et pourtant c’est une peur. C’est une peur sous-jacente. Alors je pense que ça se comprend peut-être un peu plus sur des études supérieures où j’où je sais pas, mais pour travailler avec des enfants de 6 ans, je pense que ce serait assez rigolo de pas avoir d’enseignants dans une salle de classe avec des élèves de 6 ans et d’avoir une intelligence artificielle qui essaie de seul de gérer des des en 36 ans. Je pense que les gens qui qui s’imaginent ça ont pas passé beaucoup de temps dans des dans des salles de classe et pour autant, ça ne évidemment on travaille là-dessus, donc c’est assez compliqué d’avoir un un discours différent. Je suis vraiment intimement convaincu que des outils modernes de gestion de la donnée. Qu’on peut appeler d’intelligence artificielle sont essentiels pour aider les enseignants à et notamment vis-à-vis de leurs élèves qui sont en retard, vont avoir du mal à raccrocher le train et vont se retrouver en situation d’échec scolaire plus tard.
– Marc —
Qu’est-ce que c’est les chantiers devant vous pour l’îlot?
– Laurent — 28:42 :
On a un premier chantier, évidemment, qui est de continuer à faire connaître notre outil et faire en sorte qu’un maximum d’enseignants utilise l’outil. Donc en France, on a à peu près 15 % des enseignants de CPCE 1CE 2 qui utilise la lilo chaque mois avec leurs élèves. Par contre, on a un pourcentage beaucoup plus faible d’élèves qui utilisent notamment parce que le cas d’usage remédiation est très présent. Donc on a un premier chantier qui consiste à à développer un usage plus adapté à la classe entière. Dans notre outil, on communique beaucoup sur les élèves en difficulté. Évidemment, c’est une démission qui nous tient à cœur. Mais on se rend bien compte avec notre outil, que l’agglo c’est pertinent pour tous les élèves, que ça diminue les écarts entre les élèves. Mais ça fait plus progresser tous les élèves, c’est à dire que c’est bénéfique pour tout le monde et principalement pour les élèves défavorisés. Donc on aimerait bien avoir un nombre d’élèves par prof dans les salles de classe qui augmentent. Le 2ème gros sujet qu’on a, c’est vraiment de mieux mesurer l’apport pédagogique qu’on a avec la lilo et de faire un maximum de mesures hors outil, c’est à dire qu’aujourd’hui on va avoir beaucoup d’indications à travers notre outil sur les progrès des élèves, mais on manque beaucoup d’analyses, d’efficience extra outils pour dire oui, effectivement, la lilo ça a tel impact sur les élèves et c’est probablement l’un des éléments qui nous manque aujourd’hui pour se développer de façon plus massive.
– Marc — 30:10 :
Merci Laurent.
– Laurent — 30:11 :
Merci Marc.
– Laurent — 30:12 :
Vous venez dans entendre Laurent Joly, directeur des opérations chez Lilo, sur Data driven One One. Dans le prochain épisode, je recevrai Olivier Gabriel, Head of Data Science chez Wam train, pour parler de maintenance d’ascenseur et de data.