Creatio base
Это документация Creatio версии 7.12.0. Мы рекомендуем использовать новую версию документации.

Как создать модель прогнозирования значения справочного поля

Вы можете создать модель машинного обучения, которая будет выполнять прогнозирование значения заданного справочного поля. Поле будет заполняться автоматически на основании данных текущей записи и решений, принятых пользователями ранее в аналогичных ситуациях. Например, вы можете настроить модель, которая будет предсказывать наиболее вероятную категорию контрагента.

Чтобы создать модель прогнозирования значения справочного поля:

1.Откройте в дизайнере системы раздел [Модели машинного обучения] и нажмите кнопку [Добавить].

2.Заполните мини-карточку создания модели (Рис. 1):

Рис. 1 — Мини-карточка создания модели прогнозирования значения справочного поля

chapter_predicting_lookup_value_model_minicard.png 

a.[Название] — введите название модели, по которому ее будет легко найти в реестре раздела [Модели машинного обучения] и при настройке элемента [Прогнозирование данных].

b.[Тип] — укажите задачу, которую необходимо решить при помощи модели машинного обучения. Например, “Прогнозирование справочного поля”.

c.[Объект] — выберите объект, по записям которого будет выполняться прогнозирование. Например, для использования модели в разделе [Контрагенты] выберите объект "Контрагент".

3.После заполнения обязательных полей перейдите на вкладку [Параметры] и укажите дополнительные параметры модели (Рис. 2):

Рис. 2 — Дополнительные параметры модели машинного обучения

chapter_predicting_lookup_value_model_additional_parameters.png 

a.[Какое значение необходимо прогнозировать?] — выберите поле, для которого будет выполняться прогнозирование значения. Например, для прогнозирования категории контрагента выберите из списка поле [Категория] В списке представлены все справочные поля, которые есть на странице указанного объекта. В результате прогнозирования поле будет автоматически заполнено одним из значений справочника [Категории контрагентов].

b.[От каких колонок зависит прогнозируемое значение?] — укажите колонки, которые будут использоваться системой для определения алгоритмов поведения, связанных с прогнозируемым полем. Например, если обычно вы определяете категорию контрагента, исходя из количества сотрудников, оборота и отрасли, в которой работает контрагент, — укажите колонки [Количество сотрудников], [Годовой оборот] и [Отрасль]. Система изучит значения этих колонок в исторических записях и их соотношение со значениями колонки [Категория].

c.[Добавить дополнительные колонки расширенными средствами?] — можно также написать запрос, который расширит список колонок, учитываемых при обучении модели. Написание запроса выполняется разработчиком. Подробнее о написании запросов для моделей машинного обучения читайте в статье “Составление запросов на выборку данных для модели машинного обучения” документации по разработке.

d.[Какие записи должны попасть в обучающую выборку?] — настройте фильтр для формирования выборки данных, на которых будет обучаться модель. Система использует эти записи для определения соотношения прогнозируемого значения и колонок, на которых основывается прогноз. Например, для обучения модели определения категории контрагента необходимо использовать только те записи раздела [Контрагенты], где заполнено поле [Категория].

НА ЗАМЕТКУ

Для обучения модели вы можете указывать колонки как текущего, так и связанных объектов.

e.[В какую колонку сохранять результат прогнозирования?] — обычно прогнозное значение сохраняется в колонку, значение которой требовалось предсказать. Если вы не хотите, чтобы система изменяла значение прогнозируемой колонки, укажите другую колонку для сохранения прогноза.

4.Заполните настройки автоматического обучения модели. Bpm’online будет периодически проводить переобучение модели на обновленных исторических данных.

a.В поле [Переобучать через, дней] укажите длительность перерыва между переобучениями. По истечении указанного количества дней модель будет отправлена на переобучение с использованием исторических данных, которые соответствуют настроенным фильтрам. Первое переобучение модели выполняется автоматически после установки признака [Автоматически обновлять модель].

b.В поле [Нижний порог допустимого качества] укажите наименьшее допустимое значение точности прогноза. При первом обучении модели это значение определит точность прогноза, по достижении которой экземпляры модели могут применяться для работы в системе. Экземпляры, не достигшие нижнего порога допустимого качества, системой не используются. Рекомендуется указывать нижний порог допустимого качества более 0,5. Точность прогноза варьируется от 0,00 до 1,00, где 1,00 — это максимально точный прогноз, а 0,00 — наименее точный. Точность прогноза рассчитывается как отношение количества правильно спрогнозированных значений к общему количеству исторических данных, на которых проводилось обучение. Подробно о механизме расчета точности прогнозов читайте в документации Google.

НА ЗАМЕТКУ

Качество прогнозов активной модели может ухудшиться при переобучении, например, в тех случаях, когда значения колонок, указанных в поле [От каких колонок зависит погнозируемое значение?], при создании новых записей остаются незаполненными. Чтобы избежать понижения точности прогнозов, перед запуском переобучения модели убедитесь, что список колонок, используемых для обучения модели, актуален.

5.Нажмите кнопку [Сохранить].

6.Установите признак [Прогнозирование активно] для включения прогнозирования в разделе. Рекомендуется полностью настроить модель перед активацией прогнозирования. Для моделей, которые активируются впервые, после установки признака будет запущено обучение. Прогнозирование в разделе будет выполняться только после того, как будет получен экземпляр модели, точность прогнозов которого превышает нижний порог допустимого качества.

В результате в bpm’online  будет создана новая модель. При запуске бизнес-процесса будет производиться прогнозирование и автозаполнение полей для выбранных записей.

В нашем примере модель прогнозирования категории контрагента проанализирует значения колонок [Количество сотрудников], [Годовой оборот] и [Отрасль] для контрагентов, у которых заполнена колонка [Категория]. Чем больше исторических данных используется для обучения модели, тем выше точность прогноза.

После получения экземпляра модели с достаточно высокой точностью прогноза в разделе будет доступно прогнозирование категории контрагента на основании данных в полях [Количество сотрудников], [Годовой оборот] и [Отрасль].

НА ЗАМЕТКУ

Получить информацию об истории обучения модели в целом и каждого сеанса переобучения в отдельности вы можете на вкладке [Обучение] страницы модели.

Смотрите также

Основные термины предиктивного анализа данных

Как создать модель прогнозирования значения числового поля

Как настроить определение рейтинга записей

Как настроить бизнес-процесс с прогнозированием

Обучение моделей

Был ли данный материал полезен?

Как можно улучшить эту статью?