Selon ResearchAndMarkets, l’IA pourrait générer une utilisation commerciale de 1 800 milliards de dollars dans le monde en 2027. La demande des techniciens de l’IA : data scientists, data engineers et data architects explose, notamment dans la Banque assurance, secteur très consommateur de données client. Fort de ses 4 années d’expérience, l’IA ACADEMIE a décidé d’enrichir son offre de formation continue avec une formation de :
DATA ENGINEER EN SCIENCE DES DONNÉES ET INTELLIGENCE ARTIFICIELLE APPLIQUÉ A LA BANQUE-ASSURANCE
Cette formation fait l’objet d’une demande de certification déposée au RNCP auprès de France Compétence.
Cette formation apporte de solides connaissances théoriques complétées par de multiples expériences pratiques sur des cas d’usage dans les métiers de la banque assurance. Elle couvre les domaines suivants :
— Les données, leur nature, leur structure, leur gouvernance et leur gestion, notamment dans le cas de données massives.
— Les fondamentaux de l’Intelligence Artificielle, le Machine Learning, les différents type d’apprentissage automatique et le Deep Learning. Tous les algorithmes sont étudiés avec leurs fondements mathématiques et leurs particularités.
— Le code, les principaux langages (Python, Java script, C++), les navigateurs et les librairies en open source. Tous les principaux algorithmes du Machine Learning et du Deep Learning sont développés en Python sur des cas d’usage réels en local et sur le Cloud.

— Les sujets d’architecture de données : les technologies noSQL, les origines du Big data, son évolution et ses applications actuelles, les architectures datalakes et lakehouses, le traitement des données massives sur les grandes plateformes et sur le Cloud.
— La stratégie IA dans une banque ou une société d’assurances : les spécificités d’un projet ou d’un ensemble de projets d’IA, les principaux freins à leur intégration et comment les lever, l’identification des cas d’usage et des données utiles, le passage à l’échelle d’un Poc à l’industrialisation, les techniques d’acculturation des décideurs métiers et des utilisateurs.
— Les applications concrètes de l’IA dans le secteur de la Banque/Assurance incluant les Fintechs et les Insurtechs ainsi qu’aux problématiques d’éthique et de réglementation. Les apprenants bénéficient d’une compréhension globale de la data science, de l’Intelligence Artificielle et des dispositifs complexes d’architecture, mais acquièrent aussi des méthodes de développement de soft skills leur permettant d’impliquer efficacement les managers et les décideurs métier dans les projets.
Programme Détaillé :
Les apprenants bénéficient d’une compréhension globale de la data science, de l’Intelligence Artificielle et des dispositifs complexes d’architecture, mais acquièrent aussi des méthodes de développement de soft skills leur permettant d’impliquer efficacement les managers et les décideurs métier dans les projets. Le programme comprend les cours suivants :
— Les dispositifs de gestion et de gouvernance des données (nature,intégrité, historique, fiabilité, localisation et administration).
— Les nouvelles architectures de données (Bases NoSQL, technologies Big Data -Hadoop, Spark…) et leur localisation (SI, Cloud public, Cloud privé). Etude de cas et ROI.
— Conception et déploiement d’une architecture de données.
— Analyse des risques et cybersécurité.
— Compatibilité avec les dispositifs réglementaires (RGPD, IA Act, DMA, DSA).
— Données massives, données non structurées et introduction aux algorithmes du Deep Learning.

— Schéma et étapes de construction d’un POC (proof of concept) relatif à un projet de data sciences intégrant de l’IA.
— Identification des cas d’usage (veille technologique, animation interne, Insurtechs et Fintechs des marchés de la banque assurance) et des données utiles à forte contribution (Experts et cognitique, fouilles de données).
— Construction des bases de travail (entraînement et test/validation croisée)
— Les principaux langages informatiques de la datascience.
— Les librairies Python open source (SKlearn, Numpy, Pandas, TensorFlox, Keras,…) et les navigateurs open source (Google Collab, Anaconda, Spyder, Jupyter).
— Panorama des outils non open source du marché (prestataires spécialistes, Plateformes AWS, Google, Azure,…).

— Data analyse et pre processing.
— Fondamentaux mathématiques des algorithmes du Machine Learning (Régressions et classifications. Logistique, forêts aléatoires, boosting, KNN, Kmeans, ACP, Gradient Boosté, arbres de décision) et du Deep Learning (réseaux de neurones ANN, CNN, RNN, GAN).
— Techniques de choix du meilleur algorithme (indicateurs de performances, boosting) et méthodes de régularisation contre le sur apprentissage (Linéarisation, dropout,…).
— Méthodes d’explicabilité (Lime, Shap,…).
— Analyse de la rentabilité d’un projet de data sciences.

— Code d’algorithmes sur navigateur et librairies Python sur études de cas.
— Analyse des biais et de la variance (performances et robustesse) au regard des objectifs fixés.
— Outils de reporting techniques et métier.
— Principes de conduite d’un projet de data science intégrant de l’IA du POC à son industrialisation au sein de l’entreprise en intégrant les spécificités des secteurs de la banque et de l’assurance
— Evaluation de la faisabilité d’un projet d’intégration de l’Intelligence Artificielle (maturité, besoins, moyens techniques et financiers)
— Méthode d’implication et d’engagement des directions métiers et des niveaux hiérarchiques indispensables à la réussite du projet
— Cadrage budgétaire

Organisation :
Le parcours d’étude se déroule en distanciel afin d’éliminer les barrières géographiques. Il démarre en novembre et comprend 8 mois d’enseignement pour un total de 300 heures comprenant des cours théoriques et des projets professionnalisant sur des cas concrets. L’apprenant doit suivre 6 heures de cours par semaine à distance avec des enseignants, à raison de 2 X 3h de 17h00 à 20h00 et effectuer 6 travaux personnels sur des projets thématiques dont le temps de travail est évalué à 3h40 heures par semaine sur la durée de la formation.
Prérequis, vérifier l’une au moins des conditions suivantes :
— Titulaire d’un Master I ou II en informatique, en mathématiques ou en statistiques.
— Diplômé d’une école d’ingénieur ou d’actuariat.
— Titulaire d’un Master I ou II ou d’une école de commerce et ayant travaillé dans un département type R&D d’une banque ou d’une compagnie d’assurance pendant au moins 3 ans.
— Un entretien préalable et obligatoire permettra d’évaluer si le niveau mathématique du postulant est suffisant pour pouvoir être inscrit.

Matériel de l’apprenant :
Ordinateur (PC ou Mac), muni d’un microphone, une webcam et une bonne connexion internet. L’ordinateur doit aussi posséder les spécifications suivantes :
- Micro-processeurs Core Intel i3 (idéal Core intel i7) plus AMD Ryzen 3 (idéal AMD Ryzen 7) ou Nvidia Geforce GTX.
- Mémoire vive de 16 Go idéalement, 8 Go minimum.
- Espace disque disponible 300 Go.
