Modelisation et manipulation de donnees historisees et archivees dans un entrep^ot oriente objet

Reading time: 6 minute
...

📝 Original Info

  • Title: Modelisation et manipulation de donnees historisees et archivees dans un entrep^ot oriente objet
  • ArXiv ID: 1005.0219
  • Date: 2010-05-03
  • Authors: Franck Ravat, Olivier Teste

📝 Abstract

This paper deals with temporal and archive object-oriented data warehouse modelling and querying. In a first step, we define a data model describing warehouses as central repositories of complex and temporal data extracted from one information source. The model is based on the concepts of warehouse object and environment. A warehouse object is composed of one current state, several past states (modelling value changes) and several archive states (summarising some value changes). An environment defines temporal parts in a warehouse schema according to a relevant granularity (attribute, class or graph). In a second step, we provide a query algebra dedicated to data warehouses. This algebra, which is based on common object algebras, integrates temporal operators and operators for querying object states. An other important contribution concerns dedicated operators allowing users to transform warehouse objects in temporal series as well as operators facilitating analytical treatments.

💡 Deep Analysis

Deep Dive into Modelisation et manipulation de donnees historisees et archivees dans un entrep^ot oriente objet.

This paper deals with temporal and archive object-oriented data warehouse modelling and querying. In a first step, we define a data model describing warehouses as central repositories of complex and temporal data extracted from one information source. The model is based on the concepts of warehouse object and environment. A warehouse object is composed of one current state, several past states (modelling value changes) and several archive states (summarising some value changes). An environment defines temporal parts in a warehouse schema according to a relevant granularity (attribute, class or graph). In a second step, we provide a query algebra dedicated to data warehouses. This algebra, which is based on common object algebras, integrates temporal operators and operators for querying object states. An other important contribution concerns dedicated operators allowing users to transform warehouse objects in temporal series as well as operators facilitating analytical treatments.

📄 Full Content

De nos jours, les entreprises ont recours à des systèmes décisionnels (OLAP), basés sur l'approche des entrepôts de données [28] pour exploiter d'importants volumes d'information à des fins d'analyse et d'aide à la décision. Un entrepôt [7,18,28] permet de stocker les données nécessaires à la prise de décision ; il est alimenté par des extractions de données portant sur des bases opérationnelles, appelées sources de données. Nos travaux de recherche [20,21,22,23,26] se placent dans le contexte des systèmes d'aide à la décision basés sur l'approche des entrepôts de données. Nos travaux s'intègrent dans le cadre du projet REANIMATIC 1 et visent plus particulièrement à développer des systèmes décisionnels aptes à supporter efficacement des analyses, afin d'améliorer la qualité des soins et le devenir des patients en réanimation. Notre approche se base sur une dichotomie entre deux espaces de stockage au sein du système décisionnel [3] : -L'entrepôt de données (data warehouse) est le lieu de stockage centralisé d'un extrait des bases de production. Cet extrait concerne les données pertinentes pour le support à la décision. Elles sont intégrées et historisées. L'organisation des données est faite selon un modèle qui facilite la gestion efficace des données et leur historisation. -Le magasin de données (data mart) est un extrait de l'entrepôt. Les données extraites sont adaptées à une classe de décideurs ou à un usage particulier (recherche de corrélation, logiciel de statistiques,...). L'organisation des données suit un modèle spécifique qui facilite les traitements décisionnels. L'objet de nos travaux est donc de spécifier des modèles de représentation et des langages de manipulation dédiés aux entrepôts et aux magasins de données complexes et évolutives. Peu de recherches traitent de cette double problématique dans le cadre des systèmes décisionnels : fournir des modèles de données complexes et évolutives, et spécifier les langages de manipulation associés.

Nos premiers travaux ont permis de définir l’architecture fonctionnelle d’un système d’aide à la décision [26] distinguant les problématiques de recherche (cf. figure 1). -L’intégration se propose de résoudre les problèmes d’hétérogénéité (modèles, formats et sémantiques des données, systèmes,…) des différentes sources de données en intégrant celles-ci dans une source globale. Cette dernière est décrite au moyen du modèle de données orientées objet standard de l’ODMG [6]. Le choix du paradigme objet se justifie car il s’avère parfaitement adapté pour l’intégration de sources hétérogènes [4] couramment utilisées dans le milieu médical [18]. Cette source globale est virtuelle : les données utilisées pour la décision restent stockées dans les sources et sont extraites au moment des mises à jour de l’entrepôt. L’intégration s’appuie sur des techniques de bases de données fédérées [24] et/ou réparties [17]. -La construction consiste à extraire les données pertinentes pour la prise de décision, puis à les recopier dans l’entrepôt, tout en conservant, le cas échéant, les changements d’états des données. Par conséquent, l’entrepôt constitue une collection centralisée, de données matérialisées et historisées (conservation des évolutions), disponibles pour les applications décisionnelles. Le modèle de l’entrepôt doit supporter des structures complexes [18] et l’évolution des données au cours du temps [18,31]. -La structuration réorganise l’information dans des magasins de données afin de supporter efficacement les processus d’interrogation et d’analyse, tels que les applications OLAP (On-Line Analytical Processing) [8] et la fouille de données (data mining) [10] ; les industriels proposent de nombreux outils permettant une telle activité (Express, Warehouse Builder, Business Object, Impromptu,…). Pour ce faire, les données importées dans les magasins sont souvent organisées de manière multidimensionnelle [1,22]. Cette organisation des systèmes décisionnels offre deux visions :

-La vision informatique, dédiée à l’entrepôt, permet

Interrogation directe

Les travaux relatifs aux entrepôts de données abordent globalement deux problématiques.

-La première traite essentiellement de l’organisation des données. Cette organisation dite multidimensionnelle [1,13,15,19,22] vise à supporter efficacement les analyses OLAP en offrant une vision des données adaptées et les temps de réponse sont accélérés en calculant de nombreux pré-agrégats. -La deuxième étudie principalement la sélection et la maintenance incrémentale des vues matérialisées [12,27,28,30,31,32] afin de collecter les données utiles aux décideurs, de les stocker dans l’entrepôt et de les maintenir cohérentes avec les données source. Ces travaux se focalisent sur des aspects physiques ou logiques (vues, index,…). Cependant, ces travaux ne sont pas suffisants et les aspects plus conceptuels restent peu étudiés [11]. Des limites subsistent dans l’élaboration d’un système décisionnel basé sur la dualité entre un ent

…(Full text truncated)…

📸 Image Gallery

cover.png

Reference

This content is AI-processed based on ArXiv data.

Start searching

Enter keywords to search articles

↑↓
ESC
⌘K Shortcut