Модель данных в Semantic MDM. Требования к разработке онтологического классификатора
-
аспект структуры: методы описания
типов и логических структур данных в
базе данных. Аспект структуры определяет, что из себя логически представляет база данных;
-
аспект манипуляции: методы манипулирования данными. Аспект манипуляции определяет способы перехода между состояниями базы данных (то есть способы модификации данных) и способы извлечения данных из базы данных;
-
аспект целостности: методы описания и поддержки
целостности базы данных. Аспект целостности определяет средства описаний корректных состояний базы данных.
Таким образом, модель данных — абстрактное, самодостаточное, логическое определение объектов, операторов и прочих элементов, в совокупности составляющих абстрактную машину доступа к данным, с которой взаимодействует пользователь. Эти объекты позволяют моделировать структуру данных, а операторы — поведение данных.
Применительно к системе Semantic MDM будем рассматривать модель данных как структуру, в которой данные представлены в виде некоторых упорядоченных множеств (доменов) расположенных в иерархической последовательности. Причем модель данных в системе может быть одна и только одна! В рамках системы пользователь имеет возможность манипулировать составом модели за счет создания новых и модификации существующих доменов, изменения состава характеристик (атрибутов) каждого домена и входящих в него нижележащих уровней с учётом наследования, а также управлять целостностью за счет создания ограничений и проверок.
Для разработки иерархической последовательности доменов используется механизм онтологического моделирования, а сама иерархия доменов (справочных групп) называется в
Системе онтологическим классификатором. Онтология в информационных системах — это попытка всеобъемлющей и подробной
формализации некоторой области
знаний с помощью
концептуальной схемы. Схема состоит из
структуры данных, содержащей все
релевантные классы объектов, их связи и правила (
теоремы, ограничения), принятые в этой области. Упрощенно можно говорить о том, что в
Системе данные хранятся в
онтологическом классификаторе, сложность и содержание которого определяется областью / областями его применения. Причем вне зависимости от количества областей применения модель данных будет единственной, а различия в описаниях данных, хранящихся в разных доменах обеспечиваются набором используемых характеристик (атрибутов), продекларированных в каждом из доменов.
Исходя из изложенного выше, а также руководствуясь принципами разработки классификаторов, приведенными в ГОСТ Р ИСО 22274—2016 "СИСТЕМЫ УПРАВЛЕНИЯ ТЕРМИНОЛОГИЕЙ, БАЗАМИ ЗНАНИЙ И КОНТЕНТОМ. Концептуальные аспекты разработки и интернационализации систем классификации", при разработке модели данных в Semantic MDM необходимо соблюдать следующие правила и ограничения:
-
справочные группы, составляющие домены, в модели должны
четко отделяться друг от друга, а области их применимости
не должны пересекаться;
-
правила создания справочных групп и формулирования определений должны быть задокументированы и доступны для пользователей. Явному определению подлежат уровни онтологического классификатора и их разбиения на отдельные справочные группы. Должны быть четко задокументированы критерии или правила создания новых уровней иерархической структуры и новых справочных групп;
-
справочные группы должны создаваться на том уровне иерархии, которая надлежащим образом отражает их отношения с уже существующими справочными группами. При работе со справочными группами требуется к минимуму свести их перемещение по дереву онтологического классификатора;
-
каждая промежуточная в иерархии справочная группа должна объединять нижележащие уровни исходя из однородности их метаинформации и потенциальной возможности определения для дочерних справочных групп общей метаинформации;
-
количество уровней иерархии в онтологическом классификаторе должно быть минимальным. Избыточная детализация (увеличение вложенности более 5 уровней) приводит к перегрузке системы. Каждый новый уровень (справочной группа) должен появляться только тогда, когда это действительно необходимо для управления или автоматизации , то есть востребовано в бизнес-процессах. Суммарное количество классов (справочных групп) в онтологическом классификаторе не должно превышать 10 тысяч. При превышении данного уровня стабильная и предсказуемая работа
Системы возможна, но не гарантируется;
-
для каждой справочной группы с учетом наследования "сверху-вниз" в модели данных должны быть определены следующие сущности:
-
Атрибутивный состав – характеристики, которые должны заполняться для позиции данной справочной группы (класса);
-
-
Права доступа – к справочной группе (классу), позициям, атрибутам и их значениям, для пользователей, ролей и групп пользователей;
-
-
Рассмотрим структуру мастер-данных в Semantic MDM на примере Единого номенклатурного справочника (ЕНС), который содержит представления объектов, применяемых в производстве продукции - от сырья до оборудования. На рисунке ниже показана сокращенная диаграмма классов (одна справочная группа), которая демонстрирует взаимосвязи, как внутри ЕНС, так и связи с другими справочными группами.
Диаграмма классов (сокращенная) для Единого номенклатурного справочника
Из представленной диаграммы классов следует, что для создания в Semantic MDM справочника необходимо определить атрибутивный состав справочных групп, т.е. набор характеристик (свойств), при помощи которых будут описываться объекты (позиции) хранящиеся в них.
Атрибуты родительского уровня справочника наследуются дочерними группами, что позволяет условно разделить атрибуты на общие для всех позиций справочника и частные, используемые только для определенных категорий объектов. Такое деление на первоначальном этапе может помочь в определении необходимого количества справочных групп и разработке структуры справочника.