La Data est considérée comme l’or noire des entreprises. Son exploitation réussie passe par la mise en place d’une stratégie de Business Intelligence. Dans cet article nous allons définir la BI (Business Intelligence), data et les différents types de data.
La BI peut être définie comme une combinaison d’outils, de processus, méthodologies et stratégies pour l’analyse de données afin d’améliorer la prise de décisions.
***Data***
La data fait référence à un ensemble de faits généralement obtenus à la suite d’expériences, d’observations, de transactions ou d’expériences.
Exemples : nom, prénom, âge, adresse, nombres de connexion à votre compte bancaire), moyen de paiement en caisse d’un supermarché (espèces, CB, etc.)
***Les différents types de data***
En BI et en Data Analyse, on distingue trois types de données :
1-Les données structurées
Elles sont formatées et divisées en deux : les données catégorielles dites discrètes et les données numériques dites continues.
*Au sein des données catégorielles on distingue les données nominales et les données ordinales. Les données nominales ne peuvent être classées dans un ordre. Exemples : sexe (homme, femme), le statut marital (célibataire, union libre, marié, divorcé, etc), la couleur (bleu, vert, orange, etc). Les données ordinales peuvent être classées par ordre. Exemples : taille (grand, moyen, petit), niveau d’éducation (bac, licence, master, doctorat).
*Parmi les données numériques on distingue celles de type intervalle et celles de type ratio.
2-Les données non structurées
Elles ne sont pas formatées.
Cela peut être des fichiers multimédia, une zone de texte libre ou des fichiers de type XML.
3-Les données semi structurées
Les données semi structurées sont à mi-chemin entre structurées et non structurées.
Un exemple est l’email. L’entête de l’email est structuré (destinataire, expéditeur, objet de l’email) tandis que le corps de l’email est non structuré (zone libre de texte + pièces jointes).
Ces trois types de données peuvent être ensuite classées en données internes (générées et collectées par l’entreprise qui les exploite) ou externes (non générées directement par l’entreprise).
Chaque type de données revêt une importance particulière car les moyens de collecte, de stockage et de traitement dépendent de la nature de la donnée.