Как настроить определение рейтинга записей
Вы можете создать модель машинного обучения, которая будет выполнять скоринг (прогнозирование рейтинга) записей в любом разделе системы. Предиктивный рейтинг рассчитывается по шкале от 0 до 100 баллов. Вы можете отобразить рассчитанное значение на странице записи в виде числового поля или графика. Подробно о добавлении графиков на страницу записи читайте в статье “Аналитика на странице записи”. Например, вы можете создать модель, которая будет оценивать перспективность ваших лидов на основании данных о бюджете и успешности перевода в продажу исторических записей. В этом случае скоринг будет выполняться по данным колонок [Стадия лида], [Бюджет] и [Годовой оборот].
НА ЗАМЕТКУ
В bpm’online по умолчанию настроена модель предиктивного скоринга лидов. Эта модель реализована при помощи запросов и применения средств разработки. В данной статье мы рассмотрим пример настройки аналогичной модели пользовательскими средствами.
НА ЗАМЕТКУ
Раздел [Лиды] доступен не во всех продуктах bpm’online.
Чтобы создать модель предиктивного скоринга:
1.Откройте в дизайнере системы раздел [Модели машинного обучения] и нажмите кнопку [Добавить].
2.Заполните мини-карточку создания модели (Рис. 1):
a.[Название] — введите название модели, по которому ее будет легко найти в реестре раздела [Модели машинного обучения] и при настройке элемента [Прогнозирование данных].
b.[Тип] — укажите задачу, которую необходимо решить при помощи модели машинного обучения. Например, “Предиктивный скоринг”.
c.[Объект] — выберите объект, по записям которого будет выполняться прогнозирование. Например, для использования модели в разделе [Лиды] выберите объект “Лид”.
3.После заполнения обязательных полей перейдите на вкладку [Параметры] и укажите дополнительные параметры модели (Рис. 2):
a.[Какие записи считать успешными?] — настройте фильтр, на основании которого система определит наиболее “успешные” записи, то есть, записи, которым изначально можно установить высокий рейтинг. В нашем примере лид считается успешным, если его бюджет превышает 50 000 долларов и лид был переведен в продажу (Рис. 2).
b.[От каких колонок зависит прогнозируемое значение?] — укажите колонки, которые будут проанализированы для определения рейтинга лида. Например, если рейтинг лида зависит от бюджета, годового оборота и положения лида в воронке, — выберите колонки [Бюджет], [Годовой оборот] и [Стадия лида]. Система проанализирует, каким образом эти колонки были заполнены в исторических записях, сравнит их с данными успешных лидов и рассчитает предиктивный рейтинг.
c.[Добавить дополнительные колонки расширенными средствами?] — можно также написать запрос, который расширит список колонок, учитываемых при обучении модели. Написание запроса выполняется разработчиком. Подробнее о написании запросов для моделей машинного обучения читайте в статье “Составление запросов на выборку данных для модели машинного обучения” документации по разработке.
НА ЗАМЕТКУ
Если значения полей [Выражение для выборки дополнительных данных обучения] и [Выражение для выборки дополнительных данных прогнозирования] идентичны, то вы можете заполнить только поле [Выражение для выборки дополнительных данных обучения].
d.[Какие записи должны попасть в обучающую выборку?] — настройте фильтр для формирования выборки данных, на которых будет обучаться модель. Система использует эти записи для определения соотношения предиктивного рейтинга лида и колонок, на которых основывается прогноз. Например, для обучения модели предиктивного скоринга лидов необходимо использовать только те записи, в которых заполнено поле [Бюджет].
НА ЗАМЕТКУ
Для обучения модели вы можете указывать колонки как текущего, так и связанных объектов.
e.[В какую колонку сохранять результат прогнозирования?] — обычно прогнозное значение сохраняется в колонку, значение которой требовалось предсказать. Если вы хотите, чтобы прогноз сохранялся в другой колонке, укажите ее в этом поле. Например, вы можете добавить колонку [Предиктивный бюджет] на страницу лида и сохранять в нее полученный прогноз.
НА ЗАМЕТКУ
Добавить специальную колонку для сохранения результата прогнозирования можно в мастере разделов.
4.Заполните настройки автоматического обучения модели. Bpm’online будет периодически проводить переобучение модели на обновленных исторических данных.
a.В поле [Переобучать через, дней] укажите длительность перерыва между переобучениями. По истечении указанного количества дней модель будет отправлена на переобучение с использованием исторических данных, которые соответствуют настроенным фильтрам. Первое переобучение модели выполняется автоматически после установки признака [Автоматически обновлять модель].
b.В поле [Нижний порог допустимого качества] укажите наименьшее допустимое значение точности прогноза. При первом обучении модели это значение определит точность прогноза, по достижении которой экземпляры модели могут применяться для работы в системе. Экземпляры, не достигшие нижнего порога допустимого качества, системой не используются. Рекомендуется указывать нижний порог допустимого качества более 0,5. Точность прогноза варьируется от 0,00 до 1,00, где 1,00 — это максимально точный прогноз, а 0,00 — наименее точный. Точность прогноза рассчитывается как отношение количества правильно спрогнозированных значений к общему количеству исторических данных, на которых проводилось обучение. Подробно о механизме расчета точности прогнозов читайте в документации Google.
НА ЗАМЕТКУ
Качество прогнозов активной модели может ухудшиться при переобучении, например, в тех случаях, когда значения колонок, указанных в поле [От каких колонок зависит погнозируемое значение?], не заполняются при создании новых записей. Чтобы избежать понижения точности прогнозов, перед запуском переобучения модели убедитесь, что список колонок, используемых для обучения модели, актуален.
5.Нажмите кнопку [Сохранить].
6.Если вы хотите, чтобы система запускала предиктивный скоринг для всех существующих записей, установите признак [Выполнить фоновое обновление результатов прогнозирования в период окна обслуживания] и настройте фильтр (Рис. 3). В результате предиктивный скоринг будет выполняться в фоновом режиме, последовательно для всех лидов, которые соответствуют условиям фильтрации. Например, предиктивный рейтинг будет рассчитываться для всех лидов, которые еще не были переведены в продажи. Настройки на детали [Настройка фонового обновления результатов прогнозирования] позволяют запускать пакетное прогнозирование данных для всех записей раздела, которые соответствуют условиям фильтра этой детали. Настройка запуска предиктивного скоринга может выполняться как в бизнес-процессе, так и на странице модели.
НА ЗАМЕТКУ
Пакетное прогнозирование выполняется в период окна обслуживания системы. Настройка временного интервала, в котором система наименее загружена и может выполнять ресурсоемкие процессы, выполняется в справочнике [Окна обслуживания системы].
7.Установите признак [Прогнозирование активно] для включения прогнозирования в разделе. Рекомендуется полностью настроить модель перед активацией прогнозирования.
Нажмите кнопку [Обучить модель] для начала обучения. Прогнозирование в разделе будет выполняться только после того, как будет получен экземпляр модели, точность прогнозов которого превышает нижний порог допустимого качества.
В результате в bpm’online будет создана новая модель. При запуске бизнес-процесса будет производиться расчет предиктивного рейтинга для выбранных записей.
В нашем примере модель предиктивного скоринга лидов проанализирует данные в колонках [Бюджет], [Годовой оборот] и [Стадия лида] для всех лидов, у которых заполнено поле [Бюджет], и сравнит их с данными лидов, переведенных в продажи. Чем больше исторических данных используется для обучения модели, тем выше точность прогноза.
Когда будет получен экземпляр модели с точностью прогноза, равной или превышающей нижний порог допустимого качества, в разделе будет доступно прогнозирование категории контрагента на основании данных полей [Бюджет] [Годовой оборот] и [Стадия лида].
Смотрите также
•Основные термины предиктивного анализа данных
•Как создать модель прогнозирования значения справочного поля
•Как создать модель прогнозирования значения числового поля