При заполнении Системы справочными данными разными пользователями на протяжении длительного периода времени появляется риск повторного внесения справочной информации, когда одно и тоже понятие предметной области описывается несколькими объектами НСИ. Такие объекты называются дубликатами. Дубликаты понижают качество справочной информации и могут запутать пользователя, использующего такие данные.
Перед экспертами системы управления НСИ Semantic MDM стоит задача выявления дубликатов, определения оригинального объекта и удаления дублирующих. Стоит учесть, что удаляемые дубликаты могут быть применены ранее во внешних информационных системах, поэтому при их удалении Система должна запоминать идентификаторы удаляемых объектов.
Для автоматизации процесса дедубликации данных в Semantic MDM присутствуют соответствующие функции.