Formation Data Science et Machine Learning avec R

Public admis

  • Salarié en Poste
  • Demandeur d'emploi
  • Entreprise
  • Etudiant

Financements

Eligible CPF Votre OPCO Financement personnel

Objectifs de la formation

  • Utiliser les spécificités du langage R pour l'exploration des données
  • Réaliser des analyses en composantes, des modélisations
  • Maîtriser les algorithmes supervisés et non-supervisés
  • Connaître les procédures d'évaluation de modèles
  • Pouvoir réaliser une analyse de données textuelles

Sparks


Tout l'IT, vraiment tout
Voir la fiche entreprise

Tarif

A partir de 3 000,00 €

Durée 4 jours
Modes
  • Centre
  • Entreprise
  • Distance
Sessions
Lieux Partout en France

Sparks


Tout l'IT, vraiment tout
Voir la fiche

Tarif

A partir de 3 000,00 €

Durée 4 jours
Modes
  • Centre
  • Entreprise
  • Distance
Sessions
Lieux Partout en France

Description

Statistiques descriptives, prédictives ou exploratoires, la Data Science repose sur la maîtrise de diverses techniques pour l'exploration des données. Cette formation vous permettra d'appréhender leur utilisation et de comprendre le principe de modélisation statistique. Les stagiaires seront en mesure de faire un choix entre régression et classification, ainsi que d'évaluer la performance d'un modèle.

Programme

Introduction à la formation et rappels sur le langage R

Les types de données dans R
Importation-exportation de données
Techniques pour tracer des courbes et des graphiques

Analyse en composantes

Analyse en Composantes Principales
Analyse Factorielle des Correspondances
Analyse des Correspondances Multiple
Exercices

Modélisation

Les algorithmes supervisés et non supervisés
Le choix entre la régression et la classification
Les étapes de construction d’un modèle

Algorithmes non supervisés

Le clustering hiérarchique
Le clustering non hiérarchique
Les approches mixtes
Exercices

Algorithmes supervisés

Le principe de régression linéaire univariée
La régression multivariée
La régression polynomiale
La régression logistique
Le Naive Bayes
L’arbre de décision
Les K plus proches voisins
Exercices

Procédures d’évaluation de modèles

Les techniques de ré-échantillonnage en jeu d’apprentissage, de validation et de test
Mesures de performance des modèles prédictifs
Matrice de confusion, de coût et la courbe ROC et AUC
Exercices

Analyse de données textuelles

Quelques packages utiles
Cas de la régression linéaire multiple
Cas de l’analyse en composantes principales ACP
Cas de la classification CAH

Prérequis

Connaissances fondamentales en statistiques et sur le langage R

Public

Data scientists,

Ces formations pourraient vous intéresser

Objectifs de la formation

  • Pendant la formation, le formateur évalue la progression pédagogique des participants via des QCM, des mises en situation et des travaux pratiques. Les participants passent un test de positionnement avant et après la formation pour valider leurs compétences acquises.
Tarif

Contacter l'organisme

Durée

4 jours (28 heures)

Modes
  • Centre
  • Distance

Objectifs de la formation

Cette formation Big Data Analyse vous apportera les connaissances et compétences nécessaires pour:

  • Comprendre le fonctionnement d'Hadoop Distributed File System (HDFS) et YARN/MapReduce
  • Explorer HDFS
  • Suivre l’exécution d’une application YARN
  • Maitriser le fonctionnnement et l'utilisation des différents outils de manipulation de la donnée :
    • Hue : Utilisation de l’interface unifiée
    • Hive, Pig : Les générateurs de MapReduce
    • Tez : L’optimisation des générateurs de MapReduce
    • Sqoop : Comment importer les données de l’entreprise dans un cluster Hadoop?
    • Oozie : Comment organiser les exécutions des différentes applications ?
Tarif

A partir de 2 400,00 €

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Présenter l'ensemble des concepts d'Oracle Data Integrator
  • Installer et configurer le produit suivant vos besoins
  • Mener à terme une démarche de développement d'un projet ODI.
Tarif

Contacter l'organisme

Durée

2j / 14h

Modes
  • Centre
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Décrire les composants physiques et virtuels et identifier les principales technologies des systèmes basés sur le Cloud
  • Définir les rôles et les responsabilités des clients, des fournisseurs, des partenaires, des courtiers et des divers professionnels techniques qui prennent en charge les environnements Cloud Computing
  • Identifier et expliquer les cinq caractéristiques requises pour répondre à la définition du NIST (National Institute of Standards and Technology) du Cloud Computing
  • Différencier les modèles de prestation de services et les frameworks qui sont incorporés dans l'architecture de référence du Cloud Computing
  • Discuter des stratégies de sauvegarde des données, de classification des données, de protection de la confidentialité, de conformité avec les organismes de réglementation et de collaboration avec les autorités lors d'enquêtes judiciaires
  • Différencier l'analyse forensic dans les Data Centers d'entreprise et les environnements Cloud Computing
  • Evaluer et mettre en oeuvre les contrôles de sécurité nécessaires pour garantir la confidentialité, l'intégrité et la disponibilité dans le cadre du Cloud Computing
  • Identifier et expliquer les six phases du cycle de vie des données
  • Expliquer les stratégies de protection des données au repos et des données en mouvement
  • Décrire le rôle du cryptage dans la protection des données et les stratégies spécifiques de gestion des clés
  • Comparer diverses stratégies Business Continuity et Disaster Recovery basées sur le Cloud et sélectionner une solution appropriée aux besoins spécifiques de l'entreprise
  • Comparer les aspects de sécurité du SDLC (Software Development Life Cycle) dans les environnements standard du Data Center et du Cloud Computing
  • Décrire comment les solutions de gestion des identités fédérées et des accès atténuent les risques dans les systèmes du Cloud Computing
  • Effectuer une analyse des écarts entre les pratiques de référence et les bonnes pratiques du secteur
  • Développer des SLA (Service Level Agreements) pour les environnements Cloud Computing
  • Réaliser des évaluations de risques des environnements Cloud existants et proposés
  • Enoncer les normes professionnelles et éthiques de (ISC)² et de la certification CCSP.
Tarif

A partir de 4 250,00 €

Durée

5j / 35h

Modes
  • Centre
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Concevoir des stories avancées avec l'utilisation du scripting pour assurer une interaction et une navigation personnalisées avec l'utilisateur.
Tarif

A partir de 3 280,00 €

Durée

4j / 28h

Modes
  • Centre
  • Distance

Objectifs de la formation

  • Comprendre ce qu’est l’IA, la data, et être en mesure d’interagir avec confiance avec les équipes data d’une organisation
  • Analyser le potentiel et les limites de la GenAI dans la gestion de projet
  • Concevoir des workflows et des processus efficaces alimentés par l'IA
  • Appliquer des techniques de prompt engineering pour résoudre des défis réels de project management
  • Évaluer les outils et les solutions d'IA générative et déterminer s'ils conviennent à des contextes de projet spécifiques
  • Créer un plan d'intégration des outils IA pour des frameworks ou référentiels de gestion de projet existants
Tarif

A partir de 1 800,00 €

Durée

2 jours

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Définir et préparer l'environnement de développement
  • Préparer les données pour la modélisation
  • Effectuer l'ingénierie des fonctionnalités
  • Développer des modèles
Tarif

Contacter l'organisme

Durée

4j / 28h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

À l'issue de cette formation Projet Data/IA vous aurez acquis les connaissances et les compétences nécessaires pour :

  • Repérer les potentiels d’utilisation de la donnée au sein de votre organisation
  • Repérer votre patrimoine data (interne et externe) et ses limites
  • Challenger les attendus d’un projet d’analyse prédictive : la question est elle bien posée ? sait on décrire l’usage qui sera fait des résultats ? Y a-t-il une vocation à industrialiser ou s’agit-il de diagnostiquer un comportement ?
  • Anticiper les biais inhérents à tout projet data : les détecter, les évaluer : peut-on les corriger ? sinon sont-ils assumés ?
  • Sécuriser le respect des règles du RGPD
  • Piloter le gain économique du projet au-delà des métriques spécifiques à l’IA
  • Comprendre les infrastructures sous-jacentes aux projets d’IA (Big Data)
  • Comprendre l’écosystème d’outils mobilisés : Python / scikit learn / Tensorflow / …
  • Identifier les approches analytiques pertinentes (supervisé, non supervisé, principaux modèles)
  • Rythmer et piloter le projet au sein des équipes techniques (méthodes agiles, devops, ML Ops)
  • Comprendre les enjeux et ressources de la datavisualisation
  • Arbitrer la poursuite ou l’arrêt du projet, sauvegarder les acquis
Tarif

A partir de 1 995,00 €

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Décrire la palette des métiers de la Data et leurs spécificités
  • Dimensionner et structurer une équipe de talents de la Data
  • Utiliser les clés pour optimiser l'efficacité de ces talents dans l'entreprise.
Tarif

A partir de 1 520,00 €

Durée

2j / 14h

Modes
  • Centre
  • Distance

Objectifs de la formation

  • Identifier les responsabilités et compétences clés d'un Data Analyst
  • Comprendre les méthodes de collecte, de traitement et d'analyse des données
  • Connaître les outils et technologies couramment utilisés par les Data Analysts
Tarif

A partir de 700,00 €

Durée

1 jour

Modes
  • Centre
  • Entreprise
  • Distance

Je cherche à faire...