Dans notre travail, mes collègues et moi voyons souvent comment les entreprises sont confrontées au problème de la gestion des données - quand il y a beaucoup de tables et de requêtes et qu'il est très difficile de gérer tout cela. Dans de telles situations, nous vous recommandons de modéliser les données. Pour comprendre ce que c'est, j'ai traduit un article-critique sur la modélisation des données de Towards Data Science, dans lequel, en plus des termes et concepts de base, vous pouvez trouver un exemple illustratif de l'utilisation de la modélisation des données dans le commerce de détail. En avant sous la coupe!
Si vous regardez une application logicielle, vous verrez qu’à un niveau fondamental, elle organise, traite et présente les données pour répondre aux besoins de l’entreprise.
Un modèle de données est une représentation conceptuelle permettant d'exprimer et de communiquer les exigences métier. Il montre visuellement la nature des données, les règles métier qui régissent les données et comment les données seront organisées dans la base de données.
La modélisation des données peut être comparée à la construction d'une maison. Disons qu'ABC a besoin de construire une maison d'hôtes (base de données). L'entreprise appelle l'architecte (modeleur de données) et explique les exigences du bâtiment (exigences métier). L'architecte (modeleur de données) élabore le plan (modèle de données) et le soumet à ABC. Enfin, ABC fait appel à des ingénieurs civils (DBA et DBA) pour construire une maison.
Termes clés de la modélisation des données
Entités et attributs. Les entités sont des «choses» dans l'environnement commercial sur lesquelles nous voulons stocker des données, telles que les produits, les clients, les commandes, etc. Les attributs sont utilisés pour organiser et structurer les données. Par exemple, nous devons stocker certaines informations sur les produits que nous vendons, telles que les prix de vente ou les quantités disponibles. Ces éléments de données sont des attributs de l'entité Product. Les entités sont généralement des tables de base de données et les attributs sont des colonnes de ces tables.
Relation . La relation entre les entités décrit comment une entité est liée à une autre. Dans le modèle de données, les entités peuvent être liées comme un à un, plusieurs à un ou plusieurs à plusieurs.
. « », , « » « ».
: 2 — . , .
, « »:
ER . ER- , .
, . :
— . , , , - -. :
, , , . , , — . :
:
vs
- . — , . , . 3- . OLTP .
. , .
ABC 200 . , « », «», « », « » .. 20 000 . (SKU). 6 000 -, . - (UPC). POS- 2 : , , .
, . , , ..
.
1. -
, POS-. , , , . , , .
2:
. . , . :
Date Dimension
Product Dimension
Store Dimension
Promotion Dimension
, (, , .), .
3:
, . :
4:
. :
Date Dimension:
Product:
Store:
Promotion:
Sales Fact:
.
(, ).
: * .
: , .
: - .
:
Étape 5: création de tables physiques dans la base de données
À l'aide d'un outil de modélisation de données ou de scripts personnalisés, vous pouvez désormais créer des tables physiques dans la base de données.
Je pense qu'il est devenu assez évident maintenant que la modélisation des données est l'une des tâches les plus importantes dans le développement d'une application logicielle. Et il jette les bases de l'organisation, du stockage, de la récupération et de la présentation des données.