Основными задачами , решаемыми на вкладке Данные для проверки являются:
-
формирование проверочных данных, на основе которых будет оцениваться качество машинного обучения;
-
поиск групп с недостаточным количеством проверочных позиций;
-
автоматическое и ручное назначение проверочных позиций.
На вкладке расположена таблица со справочными группами, для которых в подсистему машинного обучения были загружены данные. В таблице доступны следующие колонки:
-
Группа – полный путь к группе, начиная от общей родительской группы для всех имеющихся в таблице групп. По щелчку левой кнопкой мыши на группе открывается вкладка
Данные для обучения с включенным фильтром по выбранной группе;
-
Доступно для проверки – количество позиций с полной информацией по атрибутам, для которых установлен маркер
Содержит значения всех атрибутов;
-
Проверочных позиций – количество позиций, выбранных для проверки качества машинного обучения. Выбор позиций осуществляется только среди тех, которые содержат полные данные по атрибутам;
-
% проверочных – процентное соотношение проверяемых позиций к общему количеству позиций в группе.
Настройка видимых колонок таблицы выполняется по кнопке Настройка таблицы.
Вкладка данных для проверки качества обучения
В Системе могут быть позиции, для которых не указана группа, но они содержат данные по сквозным атрибутам. Для таких позиций в таблице с группами выведена системная группа Группа не задана. Это системное значение также доступно в фасетной фильтрации по группам.
Сортировка доступна по всем колонкам таблицы. По умолчанию включена сортировка по колонке Группа. Сортировка по колонке Группа выполняется по наименованию полного пути.
Фасетная фильтрация на этой вкладке доступна только по колонке
Группа. При раскрытии диалога с фасетами отображается
«худое» дерево групп с возможностью выбора конечных или промежуточных групп в иерархии.
Вид «худого» дерева в фасетном поиске по группам
Над таблицей с группами расположена кнопка Автоматически назначить проверочные позиции выбранным группам. По кнопке поднимается окно Автоназначение проверочных позиций, в котором пользователь может указать процент проверочных позиций. Процент должен находится в диапазоне 0–25%. 0% – означает сброс маркера со всех позиций выбранных групп. 25% – максимально допустимый процент позиций, которые можно выделить для проверки. Количество проверяемых записей по заданному проценту определяется путем округления вниз.
Диалог указания процентного показателя проверочных позиций
Справа от таблицы групп располагается таблица позиций, в которой отображаются доступные для проверки позиции с полными данными по атрибутам со следующими колонками:
-
Полное наименование – наименование позиции. По этому полю доступна сортировка;
-
ID позиции – идентификатор позиции (GUID) с возможностью выделить и скопировать данный идентификатор как текст;
-
Источник – наименование источника, из которого была загружена позиция. По этому полю доступна сортировка и фасетная фильтрация.
Все позиции для выделенной в таблице слева группы по умолчанию отсортированы по наименованию. Над таблицей позиций расположена кнопка
Показать только проверочные позиции, при нажатии на которую в таблице останутся только проверочные позиции. Проверочные позиции промаркированы «галочкой»
светло–зеленого цвета справа. Назначение / снятие проверочной позиции осуществляется двойным кликом мыши по позиции. Если для позиции имеется список альтернативных наименований, то справа от наименования позиции отображен значок с пиктограммой

, при наведении на который будет отображена подсказка со списком альтернативных наименований.
Если под таблицей позиций видна строка

, то это означает, что идет синхронизация данных между сервисами
Системы. Время синхронизации зависит от показателей системно-технической инфраструктуры.
Для выполнения поиска, над таблицей позиции предусмотрено поле быстрого поиска. Поиск выполняется по ID позиции, полному наименованию, значению любого атрибута и альтернативному наименованию.