Как настроить определение рейтинга записей
Вы можете создать модель машинного обучения, которая будет выполнять скоринг (прогнозирование рейтинга) записей в любом разделе системы. Предиктивный рейтинг рассчитывается по шкале от 0 до 100 баллов. Вы можете отобразить рассчитанное значение на странице записи в виде числового поля или графика. Подробно о добавлении графиков на страницу записи читайте в статье “Аналитика на странице записи”. Например, вы можете создать модель, которая будет оценивать перспективность ваших лидов на основании данных о бюджете и успешности перевода в продажу исторических записей. В этом случае скоринг будет выполняться по данным колонок [Стадия лида], [Бюджет] и [Годовой оборот].
НА ЗАМЕТКУ
В bpm’online по умолчанию настроена модель предиктивного скоринга лидов. Эта модель реализована при помощи запросов и применения средств разработки. В данной статье мы рассмотрим пример настройки аналогичной модели пользовательскими средствами.
НА ЗАМЕТКУ
Раздел [Лиды] доступен не во всех продуктах bpm’online.
Чтобы создать модель предиктивного скоринга:
1.Откройте в дизайнере системы раздел [Модели машинного обучения] и нажмите кнопку [Добавить].
2.Заполните мини-карточку создания модели (Рис. 1):
a.[Название] — введите название модели, по которому ее будет легко найти в реестре раздела [Модели машинного обучения] и при настройке элемента [Прогнозирование данных].
b.[Тип] — укажите задачу, которую необходимо решить при помощи модели машинного обучения. Например, “Предиктивный скоринг”.
c.[Объект] — выберите объект, по записям которого будет выполняться прогнозирование. Например, для использования модели в разделе [Лиды] выберите объект “Лид”.
3.После заполнения обязательных полей перейдите на вкладку [Параметры] и укажите дополнительные параметры модели (Рис. 2):
a.[Какие записи считать успешными?] — настройте фильтр, на основании которого система определит наиболее “успешные” записи, то есть, записи, которым изначально можно установить высокий рейтинг. В нашем примере лид считается успешным, если его бюджет превышает 50 000 долларов и лид был переведен в продажу (Рис. 2).
b.[От каких колонок зависит прогнозируемое значение?] — укажите колонки, которые будут проанализированы для определения рейтинга лида. Например, если рейтинг лида зависит от бюджета, годового оборота и положения лида в воронке, — выберите колонки [Бюджет], [Годовой оборот] и [Стадия лида]. Система проанализирует, каким образом эти колонки были заполнены в исторических записях, сравнит их с данными успешных лидов и рассчитает предиктивный рейтинг.
c.[Добавить дополнительные колонки расширенными средствами?] — можно также написать запрос, который расширит список колонок, учитываемых при обучении модели. Написание запроса выполняется разработчиком. Подробнее о написании запросов для моделей машинного обучения читайте в статье “Составление запросов на выборку данных для модели машинного обучения” документации по разработке.
d.[Какие записи должны попасть в обучающую выборку?] — настройте фильтр для формирования выборки данных, на которых будет обучаться модель. Система использует эти записи для определения соотношения предиктивного рейтинга лида и колонок, на которых основывается прогноз. Например, для обучения модели предиктивного скоринга лидов необходимо использовать только те записи, в которых заполнено поле [Бюджет].
НА ЗАМЕТКУ
Для обучения модели вы можете указывать колонки как текущего, так и связанных объектов.
e.[В какую колонку сохранять результат прогнозирования?] — обычно прогнозное значение сохраняется в колонку, значение которой требовалось предсказать. Если вы не хотите, чтобы система изменяла значение прогнозируемой колонки, укажите другую колонку для сохранения прогноза.
4.Заполните настройки автоматического обучения модели. Bpm’online будет периодически проводить переобучение модели на обновленных исторических данных.
a.В поле [Переобучать через, дней] укажите длительность перерыва между переобучениями. По истечении указанного количества дней модель будет отправлена на переобучение с использованием исторических данных, которые соответствуют настроенным фильтрам. Первое переобучение модели выполняется автоматически после установки признака [Автоматически обновлять модель].
b.В поле [Нижний порог допустимого качества] укажите наименьшее допустимое значение точности прогноза. При первом обучении модели это значение определит точность прогноза, по достижении которой экземпляры модели могут применяться для работы в системе. Экземпляры, не достигшие нижнего порога допустимого качества, системой не используются. Рекомендуется указывать нижний порог допустимого качества более 0,5. Точность прогноза варьируется от 0,00 до 1,00, где 1,00 — это максимально точный прогноз, а 0,00 — наименее точный. Точность прогноза рассчитывается как отношение количества правильно спрогнозированных значений к общему количеству исторических данных, на которых проводилось обучение. Подробно о механизме расчета точности прогнозов читайте в документации Google.
НА ЗАМЕТКУ
Качество прогнозов активной модели может ухудшиться при переобучении, например, в тех случаях, когда значения колонок, указанных в поле [От каких колонок зависит погнозируемое значение?], не заполняются при создании новых записей. Чтобы избежать понижения точности прогнозов, перед запуском переобучения модели убедитесь, что список колонок, используемых для обучения модели, актуален.
5.Нажмите кнопку [Сохранить].
6.Если вы хотите, чтобы система запускала предиктивный скоринг для всех существующих записей, установите признак [Выполнить фоновое обновление результатов прогнозирования в период окна обслуживания] и настройте фильтр (Рис. 3). В результате предиктивный скоринг будет выполняться в фоновом режиме, последовательно для всех лидов, которые соответствуют условиям фильтрации. Например, предиктивный рейтинг будет рассчитываться для всех лидов, которые еще не были переведены в продажи. Настройки на детали [Настройка фонового обновления результатов прогнозирования] позволяют запускать пакетное прогнозирование данных для всех записей раздела, которые соответствуют условиям фильтра этой детали. Настройка запуска предиктивного скоринга может выполняться как в бизнес-процессе, так и на странице модели.
НА ЗАМЕТКУ
Пакетное прогнозирование выполняется в период окна обслуживания системы. Настройка временного интервала, в котором система наименее загружена и может выполнять ресурсоемкие процессы, выполняется в справочнике [Окна обслуживания системы].
7.Установите признак [Прогнозирование активно] для включения прогнозирования в разделе. Рекомендуется полностью настроить модель перед активацией прогнозирования. Для моделей, которые активируются впервые, после установки признака будет запущено обучение. Прогнозирование в разделе будет выполняться только после того, как будет получен экземпляр модели, точность прогнозов которого превышает нижний порог допустимого качества.
В результате в bpm’online будет создана новая модель. При запуске бизнес-процесса будет производиться расчет предиктивного рейтинга для выбранных записей.
В нашем примере модель предиктивного скоринга лидов проанализирует данные в колонках [Бюджет], [Годовой оборот] и [Стадия лида] для всех лидов, у которых заполнено поле [Бюджет], и сравнит их с данными лидов, переведенных в продажи. Чем больше исторических данных используется для обучения модели, тем выше точность прогноза.
Когда будет получен экземпляр модели с точностью прогноза, равной или превышающей нижний порог допустимого качества, в разделе будет доступно прогнозирование категории контрагента на основании данных полей [Бюджет] [Годовой оборот] и [Стадия лида].
Смотрите также
•Основные термины предиктивного анализа данных
•Как создать модель прогнозирования значения справочного поля
•Как создать модель прогнозирования значения числового поля