techniques de modélisation des données a expliqué comment tirer le meilleur parti de vos données

Steve Hoberman est l'auteur de plusieurs livres sur les techniques de modélisation des données. y compris son plus récent: Modélisation des données pour MongoDB: bâtiment bien conçu et justifiables MongoDB bases de données. Hoberman est également un consultant en modélisation de données de premier plan et l'instructeur qui a formé plus de 10.000 personnes sur les cinq continents. Dans cette interview, il explique les défis communs que les entreprises doivent faire face à la création de modèles de données et offre des conseils sur les techniques de modélisation des données qui peuvent aider à l'élaboration de modèles de données utiles et précises pour des applications de renseignement opérationnelles et commerciales, y compris ceux en cours d'exécution sur des bases de données NoSQL telles que MongoDB .







Steve Hoberman: Dans la modélisation des données pour MongoDB. l'un des thèmes clés est le modeleur à faire preuve de souplesse sur la forme visuelle du modèle prend, et parfois, il exige un effort de ne pas modéliser avec la notation de modélisation des données traditionnelles. Lorsque vous travaillez avec des rôles de développement d'applications avec des « données, » « développeur » ou « base de données » dans leur titre d'emploi, il est correct d'utiliser la notation de modélisation des données traditionnelles des boîtes et des lignes, telles que la notation de l'ingénierie de l'information (par exemple, le pied de corbeau ) ou langage de modélisation unifié. Pour ces rôles, j'utilise souvent cette notation cohérente pour les trois niveaux de modèles - conceptuels, logiques et physiques.

Quels sont les plus grands défis auxquels sont confrontées les entreprises dans la création d'un modèle de données, et quelles sont vos suggestions pour éviter ou les résoudre?

Hoberman: Le plus grand défi est la capture correctement les exigences sur le modèle de données. Souvent, lorsque le projet démarre, il n'y a que des exigences vagues (si les exigences du tout), et le modèle de données doivent représenter ces exigences complètement et avec précision. Par conséquent, il est une tâche très difficile d'aller de l'ambiguïté ou l'imprécision de précision. doivent être posé beaucoup de questions et les résultats doivent être consignés sur le modèle. Cela prend du temps et dont la connaissance des questions à poser, et souvent des projets manquent de temps, ainsi que l'expertise nécessaire pour répondre à ces questions. La modélisation des données est le processus d'apprentissage sur l'entreprise, et il est temps et difficile processus.







Comme différentes utilisations pour la modélisation tels que l'atténuation des risques et d'inverser la popularité de gain de l'ingénierie, comment therole d'un modelerchange et d'adapter?

Hoberman: Avec l'ingénierie inverse, au lieu de commencer avec une ardoise propre et conduire les modèles de données de nouvelles exigences du système, nous organisons des attributs et des règles en fonction de systèmes fonctionnent aujourd'hui. Ainsi, le processus de pensée et les réalisations attendues sont les mêmes pour le nouveau développement comme avec l'ingénierie inverse, mais les points de départ sont différents. Souvent, les mesures d'atténuation des risques et l'ingénierie inverse, nous jouons le rôle de « données de l'archéologue, » en utilisant les compétences de détective pour déterminer le sens d'un champ système existant et les relations du terrain à d'autres domaines.

Avez-vous des recommandations sur la façon d'établir la précision quand il y a conflit sur les définitions et les spécifications?

Hoberman: Il y a un certain nombre de techniques qui fonctionnent bien, et je vais décrire brièvement deux que je préfère. Un modeleur Je sais écrit tous ses propres définitions, et elle écrit ces définitions avec une telle précision qu'elle sait qu'ils sont incorrectes - puis elle leur donne à l'entreprise à corriger. Elle trouve qu'il est plus facile pour un utilisateur d'affaires pour corriger une définition existante que de venir avec une définition à partir de zéro. Une autre modeleur Je sais insiste pour que les équipes de développement définissent les termes avant de nommer le terme. Pour nommer un concept, il faut savoir ce qu'il est. Donc, définir d'abord, et nommez-le. Les deux approches sont très efficaces pour venir avec des définitions précises.

Quelles sont les différences majeures dans la modélisation avec une base de données relationnelle par rapport à une NoSQL?

Comment le schéma moins ou schéma nature Lite des bases de données NoSQL affectent le processus de modélisation des données?

Hoberman: Les bases de données NoSQL nous permettent d'ajouter de nouveaux champs que nous ajoutons les données (appelées « schéma moins » ou « lite schéma »), et cela nous permet de prototyper plus facilement et de construire itérativement la base de données avant la fin (et parfois même à partir) le modèle de données. Dans certains efforts, la conception de base de données est terminée, puis la logique et sont construits conceptuelle à des fins de documentation et de soutien. Donc, avoir un environnement de schéma moins fait parfois une approche ascendante (à partir de la physique) possible.

En prenant le temps de créer un modèle de données, quels avantages pourraient une expérience professionnelle ou quelles complications pourraient-ils éviter?

Hoberman: Le bénéfice sous-jacent de la création d'un modèle de données est que les données deviennent réellement compréhensibles, comme d'autres peuvent le lire et apprendre. Avoir ce document précis qui explique les données conduit à des avantages commerciaux tangibles tels que des économies sur les développeurs et les coûts de support et la construction de systèmes de qualité supérieure qui répondent aux exigences et fonctionnent bien.

Prochaines étapes

En savoir pourquoi les concepts de modélisation des données sont importantes pour la réussite des entreprises dans un extrait du dernier livre de Steve Hoberman.







Articles Liés