Создание варианта поиска дубликатов
Поиск дубликатов настраивается в раскрывающейся области (разделе) Дубликаты карточки справочной группы, позиции и классификатора. Вариант поиска дубликатов, настроенный на родительском уровне, наследуется дочерними объектами. Из карточки позиции разрешается только запуск настроенных вариантов поиска
Область Дубликаты в карточке объекта с настроенными вариантами поиска
Для создания варианта поиска дубликатов необходимо выполнить следующую последовательность действий:
|
|
Для поиска дубликатов пользователь должен иметь роль с привилегией "Поиск дубликатов". Привилегии для ролей настраиваются системным администратором Semantic MDM
|
-
раскрыть область
Дубликаты, нажав кнопку

в левой части заголовка;
-
нажать кнопку
Добавить вариант поиска 
в правой части строки
Варианты поиска дубликатов;
-
в открывшемся списке заполнить поля
Наименование и
Проверяемая группа. По умолчанию проверяемой группой является текущая (то есть, та группа, на которой в данный момент установлен курсор в дереве);
-
-
Поиск дубликатов – в текущей справочной группе содержаться оригиналы, в проверяемой группе выполняется поиск дубликатов;
-
Поиск оригиналов – в текущей справочной группе содержаться дубликаты, в проверяемой группе выполняется поиск оригиналов. Данный вид применяется, в том числе, для поиска позиций при заполнении заявки. Для данного направления поиска доступны опции:
Опции поиска оригиналов позиций
-
Использовать при сопоставлении при импорте – установка данного маркера означает, что при выполнении импорта в
Semantic MDM из внешней ИС по данному варианту будут определяться дубликаты записей. Функция применяется в том числе, при поиске записей, имеющих композиции с другими объектами;
-
Использовать для автоматического слияния – дубликаты, найденные при импорте из внешней ИС, будут автоматически объединены с записью в
Semantic MDM;
-
в разделе
Предварительная фильтрация можно выполнить отбор позиций по статусу или значениям атрибутов, среди которых осуществляется поиск дублей:
-
Текущей группы – группа, в которой выполняется настройка поиска дубликатов;
-
Проверяемой группы – группа, в которой будет осуществляться поиск,
при этом, если установлено направление поиска Поиск оригиналов, то для проверяемых групп определяют условия по которым находят оригинал, а для текущей группы указывают условия поиска позиций, считающихся дубликатами, для которых подбирается оригинал. Если направление поиска Поиск дубликатов, то всё наоборот;
-
добавить атрибут поиска, нажав кнопку
Добавить атрибут 
в правой части строки
Атрибуты поиска;
|
|
В выпадающем списке действует механизм быстрого поиска, то есть достаточно начать вводить наименование нужного атрибута для сокращения видимого списка выбора . Выполнять поиск по атрибутам-связи типа «композиция", а также "текст" и "изображение" запрещено!
|
-
указать атрибуты текущей и проверяемой группы путём выбора из выпадающего списка под кнопкой

или путём выбора в окне
Классификатор атрибутов, которое открывается нажатием кнопки

в правой части строки. Если декларация атрибута, выбранного в качестве критерия поиска дубликата, будет удалена из справочной группы, а в поиске дубликатов использование этого атрибута останется, то такой поиск дубликатов будет промаркирован как невалидный

и не будет доступен для использования.
Для атрибутов связи типа "агрегация", если они были выбраны в качестве ключа для поиска дубликатов, дополнительно устанавливается
Режим сравнения множественных значений:
|
|
Поиск дубликатов по агрегируемым позициям выполняется только в справочных группах, указанных в области, настроенной в декларации атрибута проверяемого справочника.
|
-
Совпадает хотя бы одна (хотя бы для одной позиции "слева" найдена позиция "справа") - среди множества значений атрибута у позиции - оригинала ("слева") и позиции - дубликата ("справа) есть хотя бы одно совпадающее;
-
Совпадают все слева (для каждой позиции "слева" найдена позиция "справа") - для всего множества значений атрибута у позиции - оригинала ("слева") найдены соответствующие значения у позиции - дубликата ("справа), при этом значений у атрибуты позиции - дубликата может быть больше;
-
Полное соответствие (для каждой позиции "слева" найдена позиция "справа") - для всего множества значений атрибута у позиции - оригинала ("слева") найдены соответствующие значения у позиции - дубликата ("справа), при этом количество значений атрибута у позиций "слева" и "справа" одинаковое;
Настройка режима сравнения множественных значений для атрибутов связи
-
установить режим сравнения пустых значений:
-
<пусто> =
<пусто> – объект признается дубликатом, если значение атрибута у оригинала и дубликата пустые;
-
<пусто> <>
<пусто> – объект не признается дубликатом, если значение атрибута у обоих сравниваемых позиций пустое;
|
|
В Semantic MDM поддерживается сравнение наименований позиций в поиске дубликатов, которые имеют разделитель "/" указанный как символ и указанный через тэг "<ДробнаяЧерта>".
|
-
в строке с наименованием атрибута типа "
Строка" можно указать процент совпадения (релевантности) значений атрибута у оригинала и дубликата (100% соответствует полному совпадению и устанавливается по умолчанию, значение 80% является минимально допустимым);
|
|
Поиск дублей по атрибутам с типами данных, отличных от строки, осуществляется всегда по точному совпадению, независимо от выставленного процента.
|
-
добавить и настроить необходимое количество атрибутов поиска.
Настроенные варианты поиска дубликатов можно экспортировать / импортировать в файлы формата XML. Для этого в окне настройки экспорта предусмотрена специальная опция. Загрузка вариантов поиска происходит автоматически после выбора нужного файла, без дополнительных настроек.
Запрос на экспорт справочной группы в файл XML с опцией выгрузки настроенных варинтов поиска дубликатов
-
нажать кнопку
Запустить поиск рядом с наименованием варианта поиска;
-
если необходимо запустить поиск дубликатов сразу по нескольким вариантам, то следует установить опцию
Входит в группу вариантов поиска, расположенную в строке с наименованием варианта поиска. В этом случае появится кнопка
Запустить групповой поиск дубликатов в строке
Варианты поиска дубликатов.
Настройка и запуска группового поиска дубликатов
|
|
Объединить в группу можно только варианты поиска дубликатов, имеющие одинаковое направление поиска - только "Поиск дубликатов" или только "Поиск оригиналов".
|
Поиск дубликатов ведётся в фоновом режиме. О чём сообщает специальная пиктограмма в панели инструментов. Нажатие на пиктограмму позволяет открыть специальное окно, где отображается дата и время запуска поиска и процент готовности операции. Аналогичные сведения можно увидеть в компактном режиме в разделе Дубликаты рядом с наименованием варианта поиска.
Выполнение поиска дубликатов в фоновом режиме
Сведения о процессе поиска дубликатов
Результат поиска дубликатов сохраняется в зависимости от того, как был запущен поиск дубликатов – в рамках
открытого пакета изменений или без открытого пакета изменений. Если поиск дубликатов был запущен в рамках открытого пакета изменений, то поиск выполняется
только по измененным позициям, а результат поиска дубликатов сохраняется в рамках открытого пакета изменений. После публикации или отмены пакета изменений, результаты такого поиска дубликатов будут удалены. Если поиск дубликатов был запущен в режиме чтения (без активного пакета изменений), то результаты поиска сохраняются в базу данных и доступны всем пользователям, имеющим
привилегию на редактирование данных.
Варианты поиска дубликатов наследуются вниз по дереву справочника. Изменить настройки унаследованного варианта поиска дубликатов нельзя. Для унаследованного варианта поиска дубликатов доступны только возможности просмотра настроек и запуск варианта поиска.
Удаление варианта поиска дубликатов осуществляется нажатием кнопки

в правой части строки с наименованием варианта поиска.