Principes et règles de Data Management
Principes et règles : définition
- Un principe est un moyen souple de sécuriser le résultat d'une action, en définissant les résultats à atteindre et non les moyens pour y parvenir.
- A l'inverse, une règle est un moyen rigide pour encadrer une action, sans nécessairement en sécuriser le résultat.
- De par sa lourdeur et sa complexité, l'empilement de nombreuses règles est plutôt un obstacle à l'atteinte d'un résultat.
- Un principe est une affirmation générale faisant consensus qui guide l'action.
- Généralement, un ensemble de principes d'appliquent à une action donnée.
- Une règle peut être un moyen d'atteindre la conformité à un principe.
Un ensemble de principes doit répondre à 5 conditions
- Compréhensible : clair et sans ambiguïté afin d'éviter les violations non intentionnelles.
- Robuste : chaque principe doit être abouti et précis afin de permettre une prise de décision cohérente dans des situations sujettes à controverses.
- Complet : les principes couvrent toutes les situations possibles.
- Cohérent : l'ensemble de principes doit avoir une marge de flexibilité pour permettre un équilibre entre principes antagonistes. Les principes ne doivent pas être contradictoires au point que l'adhésion à un principe en violerait nécessairement un autre.
- Stable : les principes doivent être durables, mais ils doivent s'adapter aux changements.
Sommaire
Principes
Définition, système de principesPrincipes TOGAF
Business, donnée, application, technoPrincipes de management SI
Innovation, qualité, partagePrincipes de gestion de la donnée
Bonnes pratiquesPrincipes d'architecture des données
Principes basiques, qualité des donnéesRègles de Codd
SGBDR et gestion des données
Le framework de principes TOGAF
Principes d'achitecture : le business (TOGAF)
- Maximiser le bénéfice pour l'entreprise.
- La gestion de l'information est l'affaire de tous.
- Le continuité des opérations est vitale.
- Préférer des applications partagées dans toutes l'entreprise plutôt que des développements multiples dans différents département.
- La structure de l'offre de services de l'organisation IT reflète l'organisation de l'entreprise dans le monde physique.
- La gestion de l'information est conforme aux lois, règlementations et politiques.
- L'organisation IT est responsable de ses processus et de ses infrastructures.
- L'organisation IT participe à la protection de la propriété intellectuelle
Principes pour les données (TOGAF)
- La donnée est un actif de l'entreprise ayant une valeur. Elle est gérée en conséquence
- La donnée est partagée entre fonctions et organisations selon leurs besoins dans l'accomplissement de leurs missions
- La donnée est accessible aux utilisateurs selon leurs besoins dans l'éxécution de leurs tâches
- Chaque donnée est placée sous la responsabilité d'un mandataire redevable pour la qualité des données
- Les données sont définies de façon cohérente à l'échelle de l'entreprise. Les définitions et metadata sont accessibles à tous et explicites.
- Les données sont protégées de toute utilisation ou diffusion non-autorisée.
Principes pour les applications (TOGAF)
- Les applications peuvent fonctionner sur diffférentes plateformes technologiques.
- Les applications sont faciles à utiliser pour les employés.
Principes pour les technologies (TOGAF)
- Les changements applicatifs ou technologiques interviennent uniquement en réponse à des spécifications du business.
- Le système d'information évolue de façon réactive et dans les délais requis.
- La diversité technologique est maitrisée et minimisée afin d'optimiser les coûts des expertises correspondantes.
- Les matériels et les logiciels doivent se conformer aux standards pour l'interopérabilité des technologies, des applications et des données.
5 autres jeux de principes de gestion de l'information
Principes généraux de la gestion de l'information (IBM)
- Inovation : encourager l'innovation, être agile
- Qualité : gouverner la qualité des données, cartographier les informations, gérer leur signification et leur classification
- Partage : inciter au résultat, gérer le feed-back, gérer les spécifications à long-terme, encourager le stewardship, veiller à la conformité, protéger l'information.
Principes généraux de la gestion de la donnée (UK)
- Eviter de collecter à nouveau des données qui existent déjà
- Manager soigneusement les données pendant l'intégralité de leur cycle de vie
- Formaliser la politique de gestion des données, rédiger un framework
- Identifier clairement les propriétaires de données
- Prendre soin des metadata
- Définir et contrôler les standard de qualité des données
- Pour chaque jeu de données, faire rédiger par leur propriétaire un plan de gestion à long-terme
- Disposer de procédures pour les traitements complexes et délicats, afin d'en sécuriser le résultat
- Maîtriser l'accès aux données et leur dissémination
- Auditer régulièrement les pratiques de data management
Principes généraux de qualité des données (WMDC)
Les critères de mesure de la qualité des données ont aussi valeur de principes
- Conformité à la réalité
- Conformité à des standards et des normes d'échange de fichiers
- Cohérence des données entre systèmes
- Intégralité, complétude des données
- Cohérence technique des données
- Perception subjective et confiance
Lire l'article sur la qualité des données
Les 12 règles de Codd pour un système d'information relationnel
Les 12 règles de Codd furent rédigées par E.F. Codd en 1985 pour arbitrer les polémiques sur les vrais et les faux SGBDR (systèmes de gestion de bases de données relationnelles). Chaque traduction contient une part d'interprétation. Cette version se veut fidèle au texte d'origine en anglais. Ces règles peuvent paraitre éloignées du sujet, mais elles font leur part du travail.
Règle 0 : système 100% relationnel
Pour tout système présenté comme un système de gestion de base de données relationnelle doit être capable de gérer les bases de données entièrement grâce à ses capacités relationnelles.
Règle 1
Toutes les informations d'une base de données relationnelle sont représentées explicitement au niveau logique ET par des valeurs uniques dans une des tables.
Règle 2
Chaque donnée (valeur atomique) dans une base de données relationnelle doit pouvoir être logiquement accessible en la désignant par une combinaison de nom de table, de valeur de clé primaire et de nom de colonne.
Règle 3
Les valeurs nulles (distinctes de la chaîne de caractères vide, d'une chaîne d'espaces, de zéro ou de tout autre nombre) sont traitées systématiquement comme des informations manquantes et inutilisables, indépendamment du type de données.
Règle 4
Le catalogue des descriptions des données est également stocké dans la base de données relationnelle et il peut être manipulé par requêtes comme les données elles-mêmes.
Règle 5
Un système relationnel peut prendre en charge plusieurs langues et différents modes d'utilisation du terminal (par exemple, le mode fill-in-the-blanks). Cependant, il doit y avoir au moins un langage dont les instructions sont des chaînes de caractères compréhensibles et dont la syntaxe et claire, pour prendre en charge les opérations suivantes :
- Définir des données
- Consulter la définition des données
- Manipuler les données (de façon interactive et par programmation)
- Gérer les contraintes d'intégrité
- Maintenir les autorisations
- Gérer les transactions (début, validation et annulation)
Règle 6 :
Toutes les vues théoriquement modifiables doivent également pouvoir être mises à jour par le système.
Règle 7 :
La capacité de manipuler une relation de base (table) ou une relation dérivée (vue) avec une seule instruction s'applique non seulement à l'extraction de données mais aussi à l'insertion, la mise à jour et la suppression de données.
Règle 8 :
Les modifications apportées à la représentation des données à l'accès physique aux données n'impactent pas l'accès logique aux données par les programmes ou les applications interactives.
Règle 9 :
Les modifications apportées aux tables de base (exemple : fractionnement) n'impactent pas l'accès logique aux données par les programmes ou les applications interactives.
Règle 10 :
Toutes les contraintes d'intégrité, même spécifiques à une application particulière, doivent pouvoir être définies et stockées dans la base de données, pas dans les programmes d'application.
Règle 11 :
Un SGBDR doit supporter de manière transparente la distribution des données sur plusieurs sites physiques.
Règle 12 :
Si un système relationnel a un langage de bas niveau (un seul enregistrement à la fois), ce bas niveau ne peut pas être utilisé pour contourner les règles et contraintes d'intégrité exprimées dans le langage relationnel de niveau supérieur (enregistrement simultané d'enregistrements).
Principe d'architecture de données au niveau opérationnel
Source : l'expérience personnelle
Création des données
- Qualité des données par le design
- Prise en compte du cycle de vie de la donnée dans son design
- Un seul propriétaire par donnée
- Capture de l'information à la véritable source
- Fidélité des données à la réalité
- Unicité de la donnée maintenue
- Pureté de l'information stockée vis-à-vis des besoins spécifiques des cas d'emploi
- Intégration des différents niveaux de granularité requis
Distribution des données
- Cohérence de la donnée entre ses différentes instances
- Traçabilité des données et des modifications
- Automatisation des tâches manuelles
- Réduction au strict nécessaire des transformations
- Traduction des informations originales plutôt que des contenus par média
Consommation des données
- Facilité d'accès et clarté des metadata
- Disponibilité de l'information avec stricte gestion des autorisations
En savoir plus :
Index des définitions Data Consultant Principes et règles
Dernière mise à jour : 2 septembre 2022