Руководство пользователя Semantic MDM
×
Меню
Индекс
  • Введение в Semantic MDM
  • Модель данных в Semantic MDM. Требования к разработке онтологического классификатора

Модель данных в Semantic MDM. Требования к разработке онтологического классификатора

 
В классической теории баз данных, моде́ль данных – это формальная теория представления и обработки данных в системе управления базами данных (СУБД), которая включает, по меньшей мере, три аспекта:
Таким образом, модель данных — абстрактное, самодостаточное, логическое определение объектов, операторов и прочих элементов, в совокупности составляющих абстрактную машину доступа к данным, с которой взаимодействует пользователь. Эти объекты позволяют моделировать структуру данных, а операторы — поведение данных.
Применительно к системе Semantic MDM будем рассматривать модель данных как структуру, в которой данные представлены в виде некоторых упорядоченных множеств (доменов) расположенных в иерархической последовательности. Причем модель данных в системе может быть одна и только одна! В рамках системы пользователь имеет возможность манипулировать составом модели за счет создания новых и модификации существующих доменов, изменения состава характеристик (атрибутов) каждого домена и входящих в него нижележащих уровней с учётом наследования, а также управлять целостностью за счет создания ограничений и проверок.
Для разработки иерархической последовательности доменов используется механизм онтологического моделирования, а сама иерархия доменов (справочных групп) называется в Системе онтологическим классификатором. Онтология в информационных системах — это попытка всеобъемлющей и подробной формализации некоторой области знаний с помощью концептуальной схемы. Схема состоит из структуры данных, содержащей все релевантные классы объектов, их связи и правила (теоремы, ограничения), принятые в этой области.  Упрощенно можно говорить о том, что в Системе данные хранятся в онтологическом классификаторе, сложность и содержание которого определяется областью / областями его применения. Причем вне зависимости от количества областей применения модель данных будет единственной, а различия в описаниях данных, хранящихся в разных доменах обеспечиваются набором используемых характеристик (атрибутов), продекларированных в каждом из доменов.
Исходя из изложенного выше, а также руководствуясь принципами разработки классификаторов, приведенными в  ГОСТ Р ИСО 22274—2016 "СИСТЕМЫ УПРАВЛЕНИЯ ТЕРМИНОЛОГИЕЙ, БАЗАМИ ЗНАНИЙ И КОНТЕНТОМ. Концептуальные аспекты разработки и интернационализации систем классификации", при разработке модели данных в Semantic MDM необходимо соблюдать следующие правила и ограничения:
Рассмотрим структуру мастер-данных в Semantic MDM на примере Единого номенклатурного справочника (ЕНС), который содержит представления объектов, применяемых в производстве продукции - от сырья до оборудования. На рисунке ниже показана сокращенная диаграмма классов (одна справочная группа), которая демонстрирует взаимосвязи, как внутри ЕНС, так и связи с другими справочными группами.
 
Диаграмма классов (сокращенная) для Единого номенклатурного справочника
 
Из представленной диаграммы классов следует, что для создания в Semantic MDM справочника необходимо определить атрибутивный состав справочных групп, т.е. набор характеристик (свойств), при помощи которых будут описываться объекты (позиции) хранящиеся в них.
Атрибуты родительского уровня справочника наследуются дочерними группами, что позволяет условно разделить атрибуты на общие для всех позиций справочника и частные, используемые только для определенных категорий объектов. Такое деление на первоначальном этапе может помочь в определении необходимого количества справочных групп и разработке структуры справочника.