Lac, entrepôt et data mart

Considérons trois types de stockage de données dans le cloud, leurs différences et leurs applications.







Lac de données



Un lac de données est un vaste référentiel de données brutes brutes, à la fois non structurées et semi-structurées. Les données sont collectées à partir de diverses sources et simplement stockées. Ils ne sont pas modifiés dans un but précis et ne sont convertis dans aucun format. L'analyse de ces données nécessite une préparation, un nettoyage et un formatage prolongés pour les rendre homogènes. Les lacs de données sont d'excellentes ressources pour les administrations municipales et d'autres organisations qui stockent des informations liées aux perturbations de l'infrastructure, au trafic, à la criminalité ou à la démographie. Les données peuvent être utilisées ultérieurement pour apporter des modifications budgétaires ou réviser les ressources allouées aux services publics ou aux services d'urgence.



Magasin de données



Un entrepôt de données est constitué de données agrégées de différentes sources dans un référentiel central unique qui les unifie en termes de qualité et de format. Les scientifiques des données peuvent exploiter les données du stockage dans des domaines tels que l'exploration de données , l' intelligence artificielle (IA) , l'apprentissage automatiqueet, bien sûr, en intelligence d'affaires. Les entrepôts de données peuvent être utilisés dans les grandes villes pour collecter des informations sur les transactions électroniques de divers services, y compris des données sur les contraventions pour excès de vitesse, les taxes d'accise, etc. Les entrepôts de données peuvent également être utilisés par les développeurs pour collecter des téraoctets de données générées par des capteurs automobiles. Cela les aidera à prendre les bonnes décisions lors du développement de technologies de conduite autonome.



Vitrine des données



Un data mart est un data warehouse conçu pour un cercle spécifique d'utilisateurs d'une entreprise ou de sa division. Le data mart peut être utilisé par le service marketing d'une entreprise de fabrication pour identifier les publics cibles lors de l'élaboration de plans marketing. Il peut également être utilisé par le département de fabrication pour analyser les performances et les taux d'erreur afin de créer les conditions d'une amélioration continue des processus. Les ensembles de données d'un data mart sont souvent utilisés en temps réel pour des analyses et des résultats exploitables.



Lac, entrepôt et magasin de données: différences clés



Tous les référentiels mentionnés sont utilisés pour stocker des données, mais il existe des différences significatives entre eux. Par exemple, un entrepôt de données et un lac de données sont de grands référentiels, mais un lac est généralement plus rentable en termes de coûts de mise en œuvre et de maintenance car il stocke principalement des données non structurées. 



L'architecture du lac de données a évolué au cours des dernières années et est désormais capable de prendre en charge davantage de données et de cloud computing. De grandes quantités de données circulent de différentes sources vers un référentiel centralisé. 



Un entrepôt de données peut être organisé de trois manières:



  1. En tant que service géré proposé par les fournisseurs de cloud.
  2. , .
  3. , , .


Les données d'un entrepôt sont plus faciles à utiliser à des fins différentes que les données d'un lac. En effet, les données de l'entrepôt sont structurées et plus faciles à récupérer et à analyser.



Un magasin de données contient une petite quantité de données par rapport à un entrepôt et un lac, qui sont catégorisés pour être utilisés par un groupe spécifique de personnes ou une division d'une entreprise. Un magasin de données peut être représenté par divers schémas (étoiles, flocons de neige ou voûtes) définis par une structure de données logique. Le format du coffre-fort de données est le plus flexible, le plus polyvalent et le plus évolutif.



Il existe trois types de data marts:



  1. Un magasin de données dépendant qui se compose de parties d'un entrepôt de données d'entreprise. Il contient des ensembles de données primaires pour l'entrepôt.
  2. , , .
  3. , . .


Le choix du type et de la structure du référentiel de données dépend largement des besoins et des exigences de l'entreprise. Si c'est ce qui compte pour vous, profitez du stockage dans le cloud hybride , qui est flexible et évolutif, ainsi que d'une approche plus complète et informée de la résolution de problèmes et de la prise de décision.



IBM propose une variété de solutions de stockage cloud et d'exploration de données. Tanmay Sinha Directeur du programme, Db2 Portfolio Blog Link


























All Articles