L’intelligence artificielle sur la bonne voie
Le deep learning au service de la sécurité ferroviaire
Les CFF utilisent, entre autres, des trains de diagnostic pour garantir le bon fonctionnement de leurs infrastructures ainsi que la sécurité des usagers et de leurs employés. À bord, des caméras photographient les voies ferrées à la recherche du moindre changement. Afin d’optimiser l’évaluation des images saisies, les CFF recourent à l’intelligence artificielle et travaillent en étroite collaboration avec le CSEM.
Les rails représentent l’épine dorsale du chemin de fer. Encastrés pendant des décennies dans le lit des voies, ils sont chaque jour soumis à rude épreuve, et ce, non seulement par un incessant ballet de trains de voyageurs de différentes tailles et circulant à des vitesses variables, mais aussi par des convois de marchandises d’un poids considérable. En Suisse, la division Infrastructure des Chemins de fer fédéraux suisses (CFF) exploite un réseau de 3000 km, composé parfois de lignes à plusieurs voies. L’effort requis pour acheminer les clients en toute sécurité d’un point A à un point B est énorme. Malgré cette tâche difficile, les CFF affichent une ponctualité record en Europe, avec un taux de plus de 90%.
Chaque jour, des inspecteurs des voies des CFF parcourent à pied l’infrastructure ferroviaire pour vérifier visuellement son état et rechercher d’éventuelles anomalies (figure 1). En charge de l’intégralité du réseau ferroviaire, ces quelque 50 collaborateurs sont à la recherche d’environ 250 types de défauts. Chaque année, près de 23'000 anomalies, souvent encore complètement inoffensives, sont confirmées. Celles-ci sont classées en fonction de leur gravité et des mesures appropriées sont mises en œuvre.
Pour se révéler efficaces, les inspecteurs des voies doivent disposer d’une grande expérience et, idéalement, pouvoir bénéficier de la lumière du jour. Les trains circulant à une cadence de plus en plus élevée, leur travail devient toujours plus difficile, en particulier aux heures de pointe; et ce, à tel point que ce contrôle manuel n’est plus autorisé par la loi sur les tronçons à grande vitesse, comme le nouveau tunnel du Saint-Gothard, durant les heures d’exploitation. C’est pourquoi depuis quelques années, les CFF utilisent également des trains de mesure spéciaux, appelés véhicules de diagnostic, dotés des technologies de caméras et des techniques de mesure les plus modernes. La qualité de cette évaluation automatique n’arrive toutefois pas à égaler celle d’un expert. Les CFF et le CSEM, un centre suisse de recherche et de développement, se sont donc associés pour «transposer» l’œil averti des inspecteurs des voies dans un logiciel robuste.
Les véhicules de diagnostic
Les CFF exploitent actuellement deux types de véhicules de diagnostic: un véhicule automoteur (figure 2a) et un véhicule tracté (figure 2b). Ces véhicules se déplacent sur les rails à des vitesses pouvant atteindre 200 km/h, procédant à des mesures sur le lit de ballast, les voies, les lignes de contact et les tunnels. Équipés de 18 caméras et de 20 écrans, ils peuvent accueillir jusqu’à quatre ingénieurs de mesure. Toutes les données sont stockées en temps réel, mais peuvent également être affichées en direct pour contrôle dans le train de mesure (figure 3). Chaque kilomètre livre ainsi environ 10 GB de données, soit l’équivalent d’un livre de 5 millions de pages. Pas de doute, le stockage et le traitement de cette masse d’informations relèvent du «big data».
Les données
Jusqu’à présent, ces montagnes de données étaient traitées avec des méthodes traditionnelles, livrant trop de diagnostics erronés. Contrairement au contrôle de qualité dans un environnement industriel, ici les conditions d’observation varient, car les rails se trouvent à l’air libre et sont ainsi exposés à toutes sortes d’influences environnementales:
- la météo: pluie, neige, boue, givre;
- les abords: tunnel, gare, ville, forêt, pont;
- les artefacts: saleté, excréments d’animaux, plantes, chewing-gums ou mégots de cigarettes;
- les types: différences dans la géométrie des voies, des aiguillages et des profils.
Développer un algorithme classique pour l’évaluation de toutes ces variations est pratiquement impossible. De tels algorithmes sont certes faciles à appréhender et très puissants dans le traitement des données numériques, mais confrontés à des descriptions floues, ils sont inefficaces. Et c’est justement le cas lors de défauts à la surface des rails. Leur forme, leur texture ou leur ombrage se révèlent toujours inédits. Un expert peut très bien s’en accommoder, puisqu’il n’a pas besoin d’un modèle mathématique pour reconnaître un défaut. Il a en effet acquis beaucoup d’expérience au fil des années, ce qui l’aide à effectuer inconsciemment la classification. C’est dans ce type de situation que le deep learning (ou l’apprentissage profond) entre en scène.
Le deep learning
Le deep learning est un domaine de l’intelligence artificielle (AI ou artificial intelligence). De grands réseaux neuronaux (profonds) sont entraînés grâce à des méthodes d’apprentissage inspirées du fonctionnement du cerveau humain. Le deep learning permet de transférer les connaissances et l’expérience d’un expert dans un logiciel afin de former les algorithmes d’apprentissage. Pour ce faire, il faut de grandes quantités de données caractérisées, soit des images évaluées et étiquetées par des experts. Le grand avantage: l’algorithme identifie lui-même les caractéristiques importantes et détermine ainsi automatiquement le meilleur modèle mathématique; en bref, il développe sa propre expérience.
Pour livrer de meilleurs résultats, le nouveau logiciel du CSEM réalise un processus composé de plusieurs étapes (figure 4):
- prétraitement et clustering (partitionnement des données);
- détection d’anomalies;
- classification;
- fingerprinting: calcul des «empreintes digitales» des défauts ou anomalies;
- amélioration continue par l’implication d’experts (apprentissage continu).
L’un des principaux défis à relever réside dans le fait que les données étiquetées disponibles pour entraîner le système sont relativement peu nombreuses. Par ailleurs, pour certaines catégories de défauts, il est très difficile, même pour des experts, d’établir une classification claire. C’est pourquoi des outils spéciaux ont été développés pour aider ces derniers à exploiter au mieux leurs connaissances et leur expérience. Ces outils ont rapidement permis de décupler la base de données et de faire des recoupements entre experts. Les cas limites ont été discutés au sein de l’équipe avant d’être définitivement évalués. Cette étape essentielle montre que ces nouvelles technologies ne peuvent pas se passer de l’expertise humaine.
Prétraitement et clustering
Toutes les données relevées dans le train rejoignent une base de données centralisée des CFF où elles sont converties dans un format propre à la compagnie. Les CFF peuvent ainsi afficher différentes données en parallèle, indépendamment de leurs sources. Ainsi, outre les données livrées par les véhicules de diagnostic, des données de drones, des photos d’experts ou des données de mesure de laboratoire peuvent être combinées les unes avec les autres. Une fois sur le serveur, les données sont passées à travers différents filtres, standardisées et réparties dans différentes catégories (clustering). Les images prises dans un tunnel sont en effet traitées différemment de celles de rails prises à l’air libre ou dans une gare.
Détection d’anomalies
L’étape suivante consiste à rechercher les anomalies, à savoir tout ce qu’une personne non formée pourrait aussi remarquer en observant un rail: saleté, feuilles, chewing-gums, défauts, soudures, etc. Pour éviter qu’un défaut ne passe inaperçu, les algorithmes ont tendance à détecter trop d’anomalies. Ils peuvent gérer une variété de défauts quasi infinie et détecter de manière fiable des défauts inconnus. Pour maintenir le nombre d’alarmes à un bas niveau, l’étape suivante est primordiale.
Classification
Toutes les anomalies détectées ne présentent pas le même degré de dangerosité. Il est notamment crucial de distinguer les défauts les plus délicats: les «squats». Ces derniers sont très difficiles à détecter sur la surface des rails: de manière analogue à une carie dans une dent, une cavité apparaît à l’intérieur du rail et se développe toujours plus profondément. Si le «squat» est visible sur la surface, il doit être réparé relativement rapidement.
Afin de différencier les défauts réels des anomalies non critiques, une classification exacte est donc nécessaire (figure 5). Six classes différentes ont été répertoriées dans ce projet, allant de l’«absence de danger» (chewing-gum, fientes d’oiseaux) aux défauts plus importants («squats»). Cette étape représente la différence majeure avec les algorithmes classiques. Pour obtenir de bons résultats, le CSEM a travaillé pendant des mois en étroite collaboration avec les experts des CFF. C’est grâce aux connaissances de ces derniers qu’il a été possible d’entraîner un réseau neuronal à effectuer cette classification avec succès.
Fingerprinting
L’algorithme se révèle déjà très fiable pour identifier et classifier les défauts liés aux artefacts. Les CFF ne peuvent toutefois pas encore s’appuyer exclusivement sur lui, car le réseau de voies ferrées est un élément essentiel en matière de sécurité et il est soumis à une réglementation fédérale stricte. En conséquence, la décision finale quant à savoir si et quand un défaut doit être contrôlé sur place ou réparé reste du ressort des inspecteurs des voies.
Les véhicules de diagnostic empruntent le même itinéraire une fois par mois. De ce fait, les mêmes anomalies et défauts sont constamment détectés et devraient donc également toujours être évalués par un expert. Beaucoup de défauts se développant très lentement, l’intervention ne doit pas forcément être immédiate et sera planifiée opportunément. Afin d’éviter que des défauts déjà enregistrés dans le système de maintenance ne réapparaissent systématiquement, un procédé de suivi dans le temps, le fingerprinting, a été mis au point: lorsque l’AI détecte un défaut, son «empreinte digitale» est calculée de manière à le caractériser formellement. Dès lors, quand le train repasse à cet endroit, il est clairement reconnu et classifié en tant que donnée connue, ce qui permet de disposer d’un suivi temporel, ou d’un historique, de chaque défaut (figure 6). Pour ce faire, il s’agit de surmonter les problèmes d’imprécision de localisation du véhicule sur le rail (le GPS ne fonctionnant pas dans les tunnels) et d’évolution des caractéristiques environnementales locales; le lit de la voie et la position relative d’un défaut par rapport à la roche environnante ou aux colliers de serrage de la voie peuvent effectivement varier considérablement, et ce, particulièrement en cas de dilatation induite par la température (figure 7). Des techniques basées sur le deep learning sont donc également utilisées pour calculer l’empreinte digitale de manière fiable.
Apprentissage continu
Chaque jour, l’être humain apprend quelque chose de nouveau grâce à ses sens. Il élargit ainsi continuellement ses connaissances. Nous attendons la même chose de l’intelligence artificielle. En tant qu’enseignant dans un processus continu destiné à assurer sécurité et fiabilité sur les rails, l’expert restera indispensable. Ce n’est que grâce à son apport que le logiciel pourra constamment apprendre et réagir à de nouveaux défauts. Il en découle une véritable symbiose entre l’homme et la machine.
L’intelligence artificielle peut non seulement acquérir des connaissances, mais aussi les transférer. Les réseaux neuronaux développés sont en effet déjà utilisés par les CFF pour la formation des jeunes inspecteurs de voies. L’ordinateur leur montre ce que sont les défauts et quels sont les cas limites pour lesquels les experts eux-mêmes ne sont pas unanimes.
Résultats
Le projet a démarré il y a deux ans et se trouve maintenant dans la phase cruciale de l’évaluation. La vérification et l’appréciation statistique des algorithmes ne sont pas faciles. Un tronçon d’essai a été défini, sur lequel de multiples trajets ont été réalisés avec différents véhicules de diagnostic pour relever de nombreuses données (figure 8). En parallèle, le même tracé a fait l’objet d’une évaluation indépendante par plusieurs inspecteurs des voies. Le nouveau logiciel de deep learning a été mis en concurrence avec les algorithmes classiques, perfectionnés depuis plus de 10 ans et utilisés dans le monde entier. La solution du CSEM améliore le taux de détection d’un facteur 10 et réduit en outre les fausses alertes de 50% en plein air et de 95% dans les tunnels. Qui plus est, ces excellents résultats ont été obtenus sans l’optimisation du réseau neuronal. Ce dernier va à présent être affiné quasi automatiquement dans la phase suivante du projet grâce à un grand nombre de données provenant directement du terrain.
Perspectives
En quelques années, les nouveaux véhicules de diagnostic permettront de multiplier par quatre les kilomètres de tronçons mesurés. Pour maîtriser ce flux de données, des logiciels tels que celui du CSEM sont requis. Aujourd’hui le contrôle des voies est traditionnellement réactif. Un défaut ne peut être réparé qu’une fois détecté. Et selon sa gravité, l’intervention peut nécessiter à court terme la fermeture d’un tronçon.
En misant sur la détection automatique et le fingerprinting, on espère à l’avenir pouvoir anticiper et planifier la maintenance bien à l’avance. En comprenant mieux comment et où les défauts surgissent, en tirant des conclusions et en prenant les mesures nécessaires, on peut même aspirer à réduire fondamentalement le nombre de ces défauts. L’objectif ultime serait d’utiliser ce logiciel en temps réel, dans un système de surveillance embarqué à bord de chaque train.
Commentaire