top of page

Méthodes d’Entraînement de GPTPrevent par GenAISafety

Photo du rédacteur: Mario DeshaiesMario Deshaies



GenAISafety a pour mission de permettre aux entreprises d'intégrer de l'intelligence artificielle (IA) fiable et spécialisée dans la gestion des risques liés à la sécurité, l'environnement, et la qualité. Grâce à un environnement complet composé de méthodes et d'outils personnalisables, GenAISafety s'intègre dans n'importe quel processus de gestion des risques pour renforcer la sécurité opérationnelle.


Pour y parvenir, GenAISafety lève les obstacles associés à l'industrialisation de l'IA, tels que la création de modèles IA hautement fiables, l'utilisation de données synthétiques pour améliorer la précision des prédictions, et l'optimisation de l'interaction entre l'utilisateur et le système basé sur l'IA pour instaurer une confiance maximale.



Chez GenAISafety, nous repoussons les limites de la technologie pour garantir des solutions de santé et sécurité au travail (SST) de pointe, grâce à l’intelligence artificielle.


Notre modèle GPTPrevent a été développé en suivant des méthodes d’entraînement avancées, assurant des résultats précis, conformes aux normes et adaptés aux besoins spécifiques des entreprises.




 

Étapes Clés de l’Entraînement du Modèle GPTPrevent


Section 1 : Pré-entraînement auto-supervisé avec Intégration des Lois Québécoises en SST


La première phase de l’entraînement de GPTPrevent repose sur le pré-entraînement auto-supervisé, durant lequel des millions de pages de textes réglementaires en matière de santé et sécurité au travail (SST) sont utilisées pour permettre au modèle de développer une compréhension approfondie des lois et des règlements SST. En particulier, nous avons intégré les principales lois québécoises en SST, notamment :


  • La Loi sur la santé et la sécurité du travail (LSST) : C’est la loi fondamentale qui régit la prévention des accidents et des maladies professionnelles au Québec. Elle s’applique à toutes les entreprises de compétence provinciale, visant à établir des mesures préventives.

  • Le Règlement sur la santé et la sécurité du travail (RSST) : Ce règlement, issu de la LSST, définit les normes minimales de sécurité sur les lieux de travail, notamment en matière d'environnement (niveaux de bruit, éclairage) et de prévention des risques.

  • La Loi sur les accidents du travail et les maladies professionnelles (LATMP) : Elle fixe les modalités de réparation des lésions professionnelles, en assurant que les travailleurs reçoivent une indemnisation adéquate en cas de blessure ou de maladie liée au travail.

  • La Loi modernisant le régime de santé et de sécurité du travail (LMRSST) : Adoptée en 2021, cette loi introduit des modifications à la LSST et à la LATMP, notamment en imposant un programme de prévention obligatoire pour toutes les entreprises, renforçant ainsi les exigences en matière de sécurité.


Ces lois sont appliquées et surveillées par la Commission des normes, de l’équité, de la santé et de la sécurité du travail (CNESST). En intégrant ces textes, GPTPrevent devient une source fiable et juridiquement conforme pour la génération de contenus SST en temps réel, tels que des procédures de sécurité, des rapports d’audit ou des conseils réglementaires spécifiques à l’industrie.




 

Section 2 : Affinage supervisé (Fine-tuning) avec Données Annotées Spécifiques par Secteur


Le modèle GPTPrevent est affiné en utilisant des jeux de données annotés spécifiques par secteur industriel, conformes aux exigences légales et réglementaires de chaque domaine d'activité. Voici quelques exemples de secteurs et des données utilisées :

  • Construction (basé sur le Code de sécurité pour les travaux de construction - CSTC) :

    • Données sur les risques spécifiques (travail en hauteur, excavation, utilisation de grues)

    • Procédures de sécurité pour l’utilisation d’équipements lourds (bulldozers, pelles mécaniques)

    • Protocoles d’intervention d’urgence pour les accidents sur chantiers

    • Exigences en matière d’équipements de protection individuelle (EPI), en lien avec les normes du CSTC


  • Industrie manufacturière (basé sur le RSST) :

    • Données sur la sécurité des machines, prévention des accidents liés à la machinerie

    • Protocoles de manutention sécuritaire des matériaux

    • Normes de gestion des substances dangereuses et ergonomie au poste de travail


  • Secteur minier (basé sur le Règlement sur la santé et la sécurité dans les mines) :

    • Données sur la ventilation et la qualité de l'air dans les mines souterraines

    • Procédures de soutènement et contrôle des terrains pour éviter les effondrements

    • Protocoles d’évacuation et de sauvetage minier


  • Industrie chimique (basé sur le RSST et le SIMDUT) :

    • Données sur la manipulation et l’entreposage des produits chimiques

    • Protocoles d’intervention en cas de déversement

    • Exigences de communication des dangers (étiquetage, fiches de données de sécurité)


  • Secteur de la santé :

    • Données sur la prévention des infections nosocomiales

    • Procédures de manipulation sécuritaire des patients

    • Normes de gestion des déchets biomédicaux


Pour chaque secteur, nous avons collecté et annoté des jeux de données basés sur les réglementations existantes, telles que la LSST, le RSST et les directives sectorielles spécifiques. Ces données sont validées par des experts SST et associations partenaires pour garantir leur pertinence et conformité. En collaboration avec des experts en santé et en sécurité du travail) et les données ouvertes du gouvernement du Québec, nous avons enrichi les datasets pour répondre aux besoins industriels.



 

Section 3 : Apprentissage par renforcement avec Feedback Humain (RLHF) et Contribution des Experts


Le modèle GPTPrevent bénéficie d’une phase d’apprentissage par renforcement avec feedback humain. Cette étape est cruciale pour affiner les réponses générées par le modèle et s’assurer qu’elles sont parfaitement alignées avec les exigences du terrain. Pour ce faire, nous avons sollicité des experts SST industriels, notamment :


  • Clients et utilisateurs finaux : Représentant des entreprises dans les secteurs de la construction, de l'énergie, de l'industrie manufacturière, et des services de santé, ils testent et valident l’utilité du modèle dans leurs environnements spécifiques.

  • Membres partenaires fournissent des retours sur la pertinence des contenus générés.

  • Équipe de Preventera : Une équipe d’experts SST internes participe à l’évaluation continue du modèle, en fournissant des retours réguliers pour affiner les prédictions, les rapports et les analyses de GPTPrevent.


Cette contribution collective garantit que GPTPrevent s'améliore en continu, fournissant des réponses contextuelles et précises, tout en réduisant les écarts par rapport aux meilleures pratiques.




 

Section 4 : Modèles de Prompts Avancés de GenAISafety

Pour adapter le modèle à des scénarios spécifiques, nous avons développé des modèles de prompts avancés, capables de générer des réponses adaptées à des situations industrielles variées. Voici quelques exemples :


Pour adapter le modèle à des scénarios spécifiques en ingénierie de prompts, voici quelques techniques avancées que vous pourriez utiliser :

  1. Prompts à plusieurs étapes (Chain-of-Thought Prompting) :


    Cette technique consiste à décomposer une tâche complexe en une série d'étapes logiques. Par exemple :

"Étape 1 : Identifiez les principaux risques SST dans le secteur de la construction.


Étape 2 : Pour chaque risque, listez les mesures préventives recommandées par le CSTC.


Étape 3 : Proposez un plan d'action pour implémenter ces mesures sur un chantier type."


  1. Prompts avec contexte spécifique :


    Fournissez un contexte détaillé propre à l'industrie ou au scénario. Par exemple :

"Vous êtes un expert SST spécialisé dans l'industrie chimique au Québec. En tenant compte des réglementations SIMDUT et des normes de la CNESST, élaborez un protocole de manipulation sécuritaire pour le produit X dans un laboratoire de recherche."


  1. Prompts avec rôle assigné :


    Attribuez un rôle spécifique au modèle pour obtenir des réponses plus ciblées. Par exemple :

"Agissez en tant que responsable SST d'une entreprise manufacturière. Vous devez présenter un rapport sur les incidents de l'année dernière et proposer des améliorations. Structurez votre réponse comme un rapport formel."


  1. Prompts avec exemples (Few-shot learning) :


    Fournissez des exemples concrets pour guider le modèle. Par exemple :

"Voici deux exemples d'analyses de risques pour des tâches de soudage :


[Exemple 1]


[Exemple 2]


Maintenant, réalisez une analyse similaire pour la tâche de découpe au plasma."

  1. Prompts avec contraintes :


    Imposez des contraintes spécifiques pour obtenir des réponses plus précises. Par exemple :

"Générez une procédure de travail en hauteur en 10 étapes maximum, conforme au CSTC, et n'utilisant que des termes définis dans le lexique SST standard."


Ces techniques permettent d'adapter finement le modèle à des scénarios SST spécifiques, en lui fournissant le contexte, les contraintes et les exemples nécessaires pour générer des réponses pertinentes et conformes aux exigences du domaine.


Grâce à ces techniques d’entraînement innovantes, GPTPrevent est devenu un atout incontournable pour les entreprises souhaitant automatiser et personnaliser la formation en SST, tout en respectant les réglementations en vigueur.




 

Section 1 : Pré-entraînement auto-supervisé avec le HSE Data Hub


Lors de la phase de pré-entraînement auto-supervisé de notre modèle GPTPrevent, nous avons utilisé le HSE Data Hub (Hub de données Santé, Sécurité et Environnement) comme source principale de données. Cette plateforme centralise des millions de pages de documents réglementaires, de rapports d'incidents et de bonnes pratiques issues de divers secteurs industriels, garantissant que le modèle GPTPrevent soit formé sur une base solide et diversifiée.



Comment le HSE Data Hub intervient dans l’entraînement :


  1. Accès à des données réglementaires riches et spécifiques

    Le HSE Data Hub contient des documents essentiels tels que la Loi santé sécurité du travail, des guides SST, des normes ISO, et des rapports d’audit en matière de sécurité au travail. Ces données sont intégrées dans le corpus d'entraînement de GPTPrevent, permettant au modèle d'apprendre à partir de contenus réglementaires précis et actuels.


  2. Sélection de données par domaine

    Le HSE Data Hub est organisé en différents domaines (ex. : construction, manufacturier, chimie), permettant une formation sectorielle adaptée. Le modèle est ainsi capable de comprendre les spécificités de chaque secteur et de générer des réponses pertinentes pour des environnements de travail variés.


  3. Nettoyage et transformation des donnéesAvant d'être utilisées pour l'entraînement, les données du HSE Data Hub sont soigneusement filtrées et anonymisées pour garantir qu'aucune information personnelle ou sensible ne soit intégrée dans les données d'entraînement. Cela assure le respect des normes de confidentialité, notamment la Loi 25 au Québec.


  4. Formation continue basée sur les mises à jour du HSE Data HubLe HSE Data Hub est régulièrement mis à jour avec de nouvelles régulations, des modifications légales et des rapports d'incidents récents. GPTPrevent bénéficie de ces mises à jour pour s'adapter en permanence aux évolutions réglementaires, garantissant que les procédures de sécurité générées soient toujours conformes aux normes actuelles.


En utilisant le HSE Data Hub pour le pré-entraînement, GPTPrevent devient non seulement un modèle génératif puissant, mais aussi une source de confiance pour les entreprises cherchant à automatiser et optimiser leur gestion des risques et de la sécurité au travail en temps réel.




 

Feuille de Route des Méthodes d’Entraînement des LLM de GenAISafety avec Technologies et Cadre Réglementaire Québécois en SST



  1. Détails par Phase :

    1. Pré-entraînement auto-supervisé :

      • Utilisation des lois québécoises en SST (LSST, RSST, LATMP, LMRSST) et de millions de pages de documents du HSE Data Hub pour former le modèle à comprendre, prédire et générer du contenu spécifique aux cadres légaux du Québec. Cette phase prépare le modèle à gérer des textes réglementaires complexes en SST.


    2. Affinage supervisé (Fine-tuning) :

      • Collecte de jeux de données annotés spécifiques à chaque secteur industriel, en se basant sur les réglementations pertinentes (CSTC pour la construction, RSST pour le manufacturier, SIMDUT pour la chimie). Le modèle est affiné pour répondre aux exigences légales et pratiques dans chaque industrie.


    3. Apprentissage par renforcement (RLHF) :

      • Grâce à l’intervention d’experts SST et à des retours d’expérience terrain, le modèle est aligné avec les besoins concrets des entreprises. Cette étape permet au modèle de s’améliorer continuellement en fonction des retours des utilisateurs et des experts du domaine.


    4. Adaptation par prompts :

      • Adaptation rapide et précise aux contextes spécifiques des secteurs (construction, chimie, santé, manufacturier). Le modèle ajuste ses réponses pour respecter les normes réglementaires et les meilleures pratiques propres à chaque industrie, grâce à des prompts sectoriels optimisés.



 

Feuille de Route des Méthodes d’Entraînement des LLM de GenAISafety avec Technologies et Cadre Réglementaire Québécois en SST


Phase

Intrants (Données, Algorithmes, etc.)

Extrants

Indicateurs de qualité

1. Pré-entraînement auto-supervisé

- Textes réglementaires (ex : Loi S-2.1, RSST, LATMP, LMRSST, normes ISO, guides SST)

- Modèle de base capable de prédire et générer des contenus liés à la SST

- Perplexité du modèle (mesure de la cohérence statistique)


- Algorithmes d’apprentissage non-supervisé (Word2Vec, GPT)

- Compréhension générale des normes SST

- Diversité du vocabulaire spécifique SST


- Millions de pages de textes du HSE Data Hub


- Cohérence et fluidité des générations textuelles

2. Affinage supervisé (Fine-tuning)

- Jeux de données annotés spécifiques par secteur industriel (ex : construction, chimie, manufacturier, minier, santé)

- Modèle spécialisé capable de générer des contenus SST adaptés à chaque secteur

- Précision sur les tâches spécifiques SST


- Données spécifiques (ex : risques chantiers, machines, gestion des produits chimiques)

- Génération de modules de formation spécialisés

- Conformité réglementaire des contenus générés


- Modèle pré-entraîné de l’étape 1

- Capacités améliorées pour suivre des instructions précises

- Pertinence des réponses à des requêtes SST

3. Apprentissage par renforcement (RLHF)

- Feedback d’experts SST industriels (construction, chimie, manufacturier, minier, santé)

- Modèle aligné avec les préférences des experts SST

- Scores d’évaluation humaine (qualité des réponses)


- Évaluations humaines et retours des utilisateurs finaux

- Réponses nuancées et contextuelles

- Réduction des réponses inappropriées


- Algorithme PPO pour l'apprentissage par renforcement


- Amélioration de la pertinence contextuelle et sectorielle

4. Adaptation par prompts

- Prompts spécifiques par secteur industriel (construction, chimie, manufacturier, minier, santé)

- Modèle capable de s’adapter rapidement à des contextes SST spécifiques

- Précision et pertinence des réponses sectorielles


- Techniques d'ingénierie de prompts (few-shot learning, chain-of-thought)

- Réponses personnalisées par secteur industriel

- Temps d’adaptation à de nouveaux contextes ou secteurs industriels


- Modèle optimisé de l’étape 3


- Niveau de satisfaction des utilisateurs dans chaque secteur industriel


 

Outils de GenAISafety pour implanter l'IA générative

Le Safety Data Hub AI Aggregator (SDH-AI) est un outil d'intelligence artificielle conçu pour centraliser et analyser les données relatives à la sécurité au sein des organisations. Sa fonction principale est de collecter, traiter et interpréter des indicateurs clés de performance (KPIs) liés à la sécurité, afin d'évaluer et d'améliorer les mesures de sécurité en place





Le Safety Innovation Journey de GenAISafety est un outil interactif complet conçu pour aider les organisations à intégrer des solutions d'intelligence artificielle (IA) dans leurs protocoles de santé et sécurité au travail (SST). Voici les étapes clés du guide pour intégrer l'IA dans les protocoles existants :

  1. Évaluation des besoins actuels en SST

    • Objectif : Identifier les domaines où l'IA peut ajouter de la valeur, en particulier pour les tâches répétitives et à haut risque.

    • Actions : Analyse approfondie des pratiques actuelles en SST et utilisation des analyses de données pour identifier les tendances.

    • Résultat : Rapport complet des domaines où l'IA peut améliorer la sécurité et l'efficacité.

  2. Collecte et préparation des données

    • Objectif : Rassembler et préparer les données nécessaires pour l'analyse par IA.

    • Actions : Collecte de données provenant de différentes sources (rapports d'incidents, inspections) et leur normalisation pour assurer leur précision.

    • Résultat : Jeu de données sécurisé et prêt pour le traitement de l'IA.

  3. Identification des applications IA

    • Objectif : Adapter les solutions IA aux défis spécifiques de sécurité dans chaque secteur.

    • Actions : Recherche des technologies IA disponibles, telles que la maintenance prédictive et la détection d'anomalies.

    • Résultat : Liste des applications IA potentielles et des solutions à mettre en œuvre.

  4. Programmes pilotes et tests

    • Objectif : Tester les solutions IA dans un environnement contrôlé.

    • Actions : Développement de programmes pilotes et recueil de retours des employés.

    • Résultat : Solutions IA validées avec des métriques de performance.

  5. Renforcement des compétences en IA

    • Objectif : Former les employés à l'utilisation de l'IA en SST.

    • Actions : Programmes de formation axés sur les applications IA dans la sécurité au travail et partage de connaissances.

    • Résultat : Main-d'œuvre qualifiée en IA et sécurité au travail.



 



L'Analyste IA du Hub de Données HSE : Rôle Clé et Responsabilités




L'Analyste IA du Hub de Données HSE au sein de la plateforme Preventera HSE DataHub joue un rôle essentiel dans l'amélioration de la sécurité au travail, le respect des réglementations, et la prise de décisions basées sur des données complètes en matière de santé et sécurité au travail (SST).



Exemple d'Application : Intégration des Données CNESST

Scénario : Intégration et analyse des données de blessures pour le secteur "Entrepreneurs en travaux de vitrage et de vitrerie".

Étapes impliquées :

  1. Extraction des données : Utilisation d'outils de web scraping pour extraire les données depuis le site de la CNESST.

  2. Transformation des données : Nettoyage et standardisation des données brutes (types de blessures, dates, lieux).

  3. Chargement des données : Les données transformées sont chargées dans le référentiel centralisé du HSE DataHub.

  4. Analyse et rapports : Génération de rapports sur les types de blessures les plus fréquentes, le nombre moyen de jours d'absence, et l'efficacité des mesures préventives.

  5. Modélisation prédictive : Utilisation de modèles de machine learning pour prédire les tendances futures des blessures, permettant de prendre des mesures proactives de sécurité.


Voici un résumé des principales responsabilités de ce rôle spécialisé :


1. Intégration des Données

  • Identification des sources de données : Recherche des données liées à la SST provenant d'organismes tels que la CNESST, l'OSHA, le NIOSH, l'ANSI, ainsi que des enregistrements internes de l'entreprise.

  • Collecte de données : Récupère les données en temps réel et historiques via des APIs, du web scraping, des capteurs IoT, et par saisie manuelle.

  • Référentiel centralisé : S'assure que toutes les données collectées sont stockées dans un lac de données ou entrepôt de données sécurisé et évolutif.


2. Gestion des Données

  • Processus ETL (Extraction, Transformation, Chargement) : Met en œuvre des pipelines ETL pour nettoyer, standardiser et structurer les données brutes afin qu'elles soient prêtes à être analysées.

  • Qualité des données : Surveille la qualité des données et corrige les problèmes tels que les données en double, manquantes ou incohérentes.

  • Gouvernance des données : Établit des politiques de gouvernance des données pour garantir leur intégrité, leur sécurité et le respect des réglementations sur la confidentialité.


3. Analyses Avancées

  • Analyses descriptives : Analyse les données historiques pour générer des rapports détaillés et des tableaux de bord sur les incidents, les évaluations des risques et les indicateurs de conformité.

  • Analyses prédictives : Utilise des modèles de machine learning pour prédire les incidents de sécurité et évaluer les risques en fonction des tendances historiques.

  • Analyses prescriptives : Propose des mesures préventives et des stratégies basées sur les insights des données pour réduire les dangers sur le lieu de travail.


4. Intégration de l'IA

  • Automatisation de l'intégration des données : Utilise des algorithmes d'IA pour automatiser l'intégration des données, réduisant ainsi les efforts manuels et augmentant l'efficacité.

  • Détection d'anomalies : Applique des modèles de machine learning pour détecter des schémas inhabituels dans les données (ex : pics soudains d'incidents), signalant ainsi de nouveaux risques potentiels.

  • Traitement du langage naturel (NLP) : Analyse les données non structurées (rapports d'incidents, feedbacks des employés) pour en extraire des informations utiles.

  • Surveillance en temps réel : Utilise des capteurs IoT et l'IA pour surveiller les données en temps réel et générer des alertes immédiates en cas de dépassement des seuils de sécurité.


5. Distribution et Visualisation des Données

  • Tableaux de bord et rapports : Crée des tableaux de bord personnalisables et des outils de visualisation pour présenter les insights aux responsables de la sécurité et aux cadres.

  • Rapports automatisés : Configure des systèmes de reporting automatisés pour assurer une diffusion rapide des informations critiques.

  • Accès API : Fournit des API pour intégrer facilement les données à d'autres systèmes et plateformes, facilitant ainsi l'échange d'informations.


6. Amélioration Continue

  • Mises à jour régulières : Veille à ce que les données et les modèles d'analyse soient régulièrement mis à jour pour maintenir leur précision et leur pertinence.

  • Formation des parties prenantes : Offre des programmes de formation pour aider les parties prenantes à interpréter les insights des données et à les intégrer dans les protocoles de sécurité.

  • Intégration de nouvelles sources de données : Recherche en permanence et intègre de nouvelles sources de données pour enrichir les analyses SST.


L'Analyste IA du Hub de Données HSE est essentiel pour centraliser, analyser et visualiser les données de sécurité afin de créer une culture proactive de la sécurité basée sur les données. Grâce aux analyses prédictives et prescriptives, ce rôle aide à prévenir les incidents, à améliorer la conformité et à permettre une prise de décision plus éclairée en matière de santé et sécurité au travail.





2 vues0 commentaire

Comments


© Droit d'auteur Canada GenAISafety © Copyright Canada GenAISafety

© Droit d'auteur GenAISafety, © Copyright GenAISafety, © Derechos de autor GenAISafety, © Urheberrecht GenAISafety, © Diritti d'autore GenAISafety, © 著作権 GenAISafety, © 版权 GenAISafety, © Direitos autorais GenAISafety,© 저작권 GenAISafety, © Авторское право GenAISafety, © Telif hakkı GenAISafety, © حقوق الطبع والنشر GenAISafety,© कॉपीराइट GenAISafety, © Hak cipta GenAISafety, © Auteursrecht GenAISafety, © Πνευματικά δικαιώματα GenAISafety.

bottom of page