Knowledge-Enhanced Machine Learning for Diagnosis - Equipe diagnostic, supervision et COnduite
Thèse Année : 2024

Knowledge-Enhanced Machine Learning for Diagnosis

Apprentissage machine guidé par des connaissances pour le diagnostic

Résumé

Model-based diagnosis requires full knowledge about the analyzed system. On the other hand, data-driven diagnosis lacks explanations about the cause of a fault. Many applications require reliable and explainable fault diagnosis and would benefit from knowing the cause of faults in order to avoid them. In this thesis, the focus is on developing new methods combining model-based and data-driven diagnosis in a synergistic way. Specifically, the emphasis is on structural analysis as a model-based method that requires only knowledge of the system's structure. For that purpose, a novel explainable method has been designed called DT4X (Diagnosis Tree for eXplainability). It leverages decision trees where decisions are informed by diagnosis meta knowledge, specifically focusing on the properties of diagnosis indicators. This knowledge is used at each node to articulate a symbolic classification problem, outputting discriminating functions. The outcome is a multivariate decision tree that produces a compact model for diagnosis. The use of decision trees increases the explainability of the outcome, all the more so as one discovers the explicit formal expressions of diagnosis indicators, structured in the form of analytical redundancy relations. On simple systems, DT4X proves to output expressions that could previously only be found with full physical knowledge of the system. Its accuracy is higher than traditional machine learning algorithms. On more complex dynamic systems, DT4X reaches very high accuracy but lacks interpretable insight about the studied system. On logical circuits, a preprocessing of the data is proposed to remove samples corresponding to masked faults. DT4X finds logical expressions that possess all the properties of model-based diagnosis indicators. A variant of DT4X has been developed called PI-DT4X (Physics Informed DT4X). It is an alternative that requires more physical insight about the system but has higher accuracy and capacity to find relevant diagnosis indicators. PI-DT4X takes as input the structural model of the system and injects specific structural sub-models in the decision tree to guide and focus symbolic regression, so that diagnosis indicators are discovered faster and easier.
Le diagnostic basé modèle requiert une connaissance complète du système analysé. Par ailleurs, le diagnostic basé sur les données manque d'explications sur la cause d'une défaillance. De nombreuses applications nécessitent un diagnostic de panne fiable et explicatif, et bénéficieraient de connaître la cause des défaillances afin de les éviter. Dans cette thèse, l'accent est mis sur le développement de nouvelles méthodes combinant le diagnostic basé sur le modèle et le diagnostic basé sur les données de manière synergique. Plus précisément, l'accent est mis sur l'analyse structurelle en tant que méthode basée sur le modèle qui ne nécessite que la connaissance de la structure du système. Dans ce but, une nouvelle méthode explicative a été conçue, appelée DT4X (Diagnosis Tree for eXplainability). Elle exploite les arbres de décision où les critères de décision sont construits à partir de méta-connaissance des méthodes de diagnostic, se concentrant spécifiquement sur les propriétés des indicateurs de diagnostic. Cette connaissance est utilisée à chaque nœud pour articuler un problème de classification symbolique, produisant des fonctions discriminantes. Le résultat est un arbre de décision multivarié qui produit un algorithme de diagnostic. L'utilisation d'arbres de décision augmente l'explicabilité du résultat, d'autant plus que l'on découvre les expressions formelles explicites des indicateurs de diagnostic, structurées sous forme de relations de redondance analytique. Sur des systèmes simples, DT4X s'avère produire des expressions qui ne pouvaient auparavant être trouvées qu'avec une connaissance physique complète du système. Sa précision est supérieure à celle des algorithmes d'apprentissage automatique traditionnels. Sur des systèmes dynamiques plus complexes, DT4X atteint une précision trè! s élevée mais manque d'aperçu interprétable sur le système étudié. Sur les circuits logiques, un prétraitement des données est proposé pour supprimer les échantillons correspondant à des défaillances masquées. DT4X trouve des expressions logiques qui possèdent toutes les propriétés des indicateurs de diagnostic basés modèle. Une variante de DT4X a été développée, appelée PI-DT4X (Physically Informed Diagnosis Tree for eXplainability). Il s'agit d'une alternative qui nécessite une meilleure compréhension physique du système mais présente une précision plus élevée et une meilleure capacité à trouver des indicateurs de diagnostic pertinents. PI-DT4X prend en entrée le modèle structurel du système et injecte des sous-modèles structurels spécifiques dans l'arbre de décision pour guider et concentrer la régression symbolique, de sorte que les indicateurs de diagnostic soient découverts plus rapidement et plus assurément.
Fichier principal
Vignette du fichier
GOUPIL Louis.pdf (14.12 Mo) Télécharger le fichier
Origine Fichiers produits par l'(les) auteur(s)

Dates et versions

tel-04714648 , version 1 (30-09-2024)

Identifiants

  • HAL Id : tel-04714648 , version 1

Citer

Louis Goupil. Knowledge-Enhanced Machine Learning for Diagnosis. Automatic. INSA TOULOUSE, 2024. English. ⟨NNT : ⟩. ⟨tel-04714648⟩
77 Consultations
26 Téléchargements

Partager

More