1 jour
Présentiel
Distanciel
Français

Pré-requis

Aucun

Dates

Aucune

Ecosystème Big Data

avec Clément Sirvente
Être rappelé
1 jour - Présentiel - Distanciel - Français

Pré-requis

Aucun

Dates

Aucune
Être rappelé

Objectifs

  • L’objectif de la formation est de fournir une vue d’ensemble de l’écosystème Big data, les technologies et les acteurs, et de comprendre les différentes problématiques du secteur. Nous aborderons les points théoriques tout en gardant un aspect pratique avec des questions de compréhension et des exercices guidés. Il est nécessaire de venir avec son PC/Mac pour suivre le séminaire.

Programme

Introduction au Big data

Qu’est ce que le big data

  • Pourquoi parle-t-on de big data
  • Le big data dans la révolution numérique
  • Une définition par les « 5V » de Gartner

Les type de données par l’exemple

  • Les données structurées et non structurées
  • Les différentes sources de données o Les bases de données « no sql »

L’informatique distribué

  • Dalake : le stockage distribué
  • Cloud stockage & calcul clusterisé

Les enjeux actuels du big data 2

  • Tendances actuelles : cloud, cyber, self service
  • Cartographie des technologies

Faire parler la data

  • L’exploratory data analysis (EDA)
  • Visualisation et data storytelling

Questionnaire de compréhension

Introduction à l’IA

Qu’est-ce que l’intelligence artificielle (IA) ?

  • L’IA et la data science o L’IA et machine learning (ML)
  • Le machine learning expliqué par l’exemple

Comment entraîne-t-on un modèle de ML

Les différents types de machine learning

  • Supervisé, non supervisé, par renforcement
  • La boite à outils du data scientist

Le processus du Machine Learning

Qu’est-ce que le machine learning supervisé ?

  • Les modèles de régression
  • Les modèles de classification avancés

Qu’est-ce que le machine learning non supervisé ?

  • L’exemple du clustering “KMeans”
  • Le text mining / natural language processing

Qu’est-ce que le deep learning / l’apprentissage profond ?

  • Le deep learning vs le machine learning
  • Les usages du deep learning

Les problématiques du maching learning

  • Trouver les données
  • Eviter le surapprentissage

Du machine learning predictif au prescritif

Questionnaire de compréhension

Construction d’un projet data

Les étapes et les acteurs d’un projet data :

  • Les acteurs d’un projet data
    • Le cycle de vie de la donnée
    • Les métiers et les compétences dans la data
  • Les étapes d’un projet data
    • Le processus complet de création d’un modèle de machine learning
    • La méthodologie de projet data

Du projet au succès :

  • Contrôler les risques liés aux projets data
    • Contrôler les biais des modèles
    • Valider sa conformité RGPD
  • Comment dépasser l’étape du POC
    • Evaluer la maturité data et consolider
    • L’importance d’une vision claire et d’un sponsor C-level

Atelier de design thinking data

Présentation de la méthodologie de design thinking

Atelier de design thinking express

  • Définir le problème
  • Trouver des idées et solutions
  • Partager les idées
  • Affiner la solution

La data pour le future de la finance

Le big data dans la finance de demain

  • La data pour une finance « data driven »
  • Le big data au service des équipes asset management

Analyse de cas d’usage du big data dans la finance et échange sur les enjeux actuels

  • Analyse de risques, création de scorings

Compétences

  • L’objectif est de développer votre capacité à prendre des décisions sur des projets orientés « Data ». Vous serez capables de communiquer avec des Data Scientist, Data Analyst et Data Engineer. Vous serez à même comprendre sous-jacent technologiques, les problématiques et les rôles à attribuer à chacun pour mener à bien les projets d’analyse de données massives.