Прогнозирование рейтинга записей
Вы можете создать модель машинного обучения, которая будет выполнять скоринг (прогнозирование рейтинга) записей в любом разделе системы. Предиктивный рейтинг рассчитывается по шкале от 0 до 100 баллов. Вы можете отобразить рассчитанное значение на странице записи в виде числового поля или графика. Подробно о добавлении графиков на страницу записи читайте в статье “Аналитика на странице записи”. Помимо рейтинга, предиктивный скоринг на основании исторических данных может выполнять прогнозирование вероятности того, что в будущем произойдет или не произойдет определенное событие.
В Creatio по умолчанию настроена модель предиктивного скоринга лидов. Эта модель реализована при помощи запросов и применения средств разработки. В данной статье мы рассмотрим пример настройки аналогичной модели пользовательскими средствами.
Пример
Необходимо создать модель, которая будет оценивать перспективность ваших лидов на основании данных о бюджете и успешности перевода в продажу исторических записей. В этом случае скоринг будет выполняться по данным колонок [Стадия лида], [Бюджет] и [Годовой оборот].
Раздел [Лиды] доступен в следующих продуктах Creatio: Marketing Creatio, Sales Creatio, team edition, Sales Creatio, commerce edition и Sales Creatio, enterprise edition.
I. Создание модели предиктивного скоринга
1.Перейдите в дизайнер системы, например по кнопке .
2.Откройте раздел [Модели машинного обучения] и нажмите кнопку [Добавить].
3.Заполните мини-карточку создания модели (Рис. 1).
a.[Название] — введите название модели, по которому ее будет легко найти в реестре раздела [Модели машинного обучения] и при настройке элемента [Прогнозирование данных].
b.[Тип] — укажите задачу, которую необходимо решить при помощи модели машинного обучения. Например, “Предиктивный скоринг”.
c.[Объект] — выберите объект, по записям которого будет выполняться прогнозирование. Например, для использования модели в разделе [Лиды] выберите объект “Лид”.
II. Параметры модели предиктивного скоринга
1.После заполнения обязательных полей перейдите на вкладку [Параметры] и укажите дополнительные параметры модели (Рис. 2):
a.[Какие записи считать успешными?] — настройте фильтр, на основании которого система определит наиболее “успешные” записи, то есть, записи, которым изначально можно установить высокий рейтинг. В нашем примере лид считается успешным, если его бюджет превышает 50 000 долларов и лид был переведен в продажу (Рис. 2).
b.[От каких колонок зависит прогнозируемое значение?] — укажите колонки, которые будут проанализированы для определения рейтинга лида. Например, если рейтинг лида зависит от бюджета, годового оборота и положения лида в воронке, — выберите колонки [Бюджет], [Годовой оборот] и [Стадия лида]. Система проанализирует, каким образом эти колонки были заполнены в исторических записях, сравнит их с данными успешных лидов и рассчитает предиктивный рейтинг.
c.[Добавить дополнительные колонки расширенными средствами?] — можно также написать запрос, который расширит список колонок, учитываемых при обучении модели. Написание запроса выполняется разработчиком. Подробнее о написании запросов для моделей машинного обучения читайте в статье “Составление запросов на выборку данных для модели машинного обучения” документации по разработке.
Если значения полей [Выражение для выборки дополнительных данных обучения] и [Выражение для выборки дополнительных данных прогнозирования] идентичны, то вы можете заполнить только поле [Выражение для выборки дополнительных данных обучения].
d.[Какие записи должны попасть в обучающую выборку?] — настройте фильтр для формирования выборки данных, на которых будет обучаться модель. Система использует эти записи для определения соотношения предиктивного рейтинга лида и колонок, на которых основывается прогноз. Например, для обучения модели предиктивного скоринга лидов необходимо использовать только те записи, в которых заполнено поле [Бюджет].
На заметку
Для обучения модели вы можете указывать колонки как текущего, так и связанных объектов.
e.[В какую колонку сохранять результат прогнозирования?] — обычно прогнозное значение сохраняется в колонку, значение которой требовалось предсказать. Если вы хотите, чтобы прогноз сохранялся в другой колонке, укажите ее в этом поле. Например, вы можете добавить колонку [Предиктивный бюджет] на страницу лида и сохранять в нее полученный прогноз. Добавить специальную колонку для сохранения результата прогнозирования можно в мастере разделов.
2.Заполните настройки автоматического обучения модели. Creatio будет периодически проводить переобучение модели на обновленных исторических данных.
a.В поле [Переобучать через, дней] укажите длительность перерыва между переобучениями. По истечении указанного количества дней модель будет отправлена на переобучение с использованием исторических данных, которые соответствуют настроенным фильтрам. Первое переобучение модели выполняется автоматически после установки признака [Автоматически обновлять модель].
b.В поле [Нижний порог допустимого качества] укажите наименьшее допустимое значение точности прогноза. При первом обучении модели это значение определит точность прогноза, по достижении которой экземпляры модели могут применяться для работы в системе. Экземпляры, не достигшие нижнего порога допустимого качества, системой не используются. Рекомендуется указывать нижний порог допустимого качества более 0,5. Точность прогноза варьируется от 0,00 до 1,00, где 1,00 — это максимально точный прогноз, а 0,00 — наименее точный. Точность прогноза рассчитывается как отношение количества правильно спрогнозированных значений к общему количеству исторических данных, на которых проводилось обучение. Подробно о механизме расчета точности прогнозов читайте в документации Google.
На заметку
Качество прогнозов активной модели может ухудшиться при переобучении, например, в тех случаях, когда значения колонок, указанных в поле [От каких колонок зависит погнозируемое значение?], не заполняются при создании новых записей. Чтобы избежать понижения точности прогнозов, перед запуском переобучения модели убедитесь, что список колонок, используемых для обучения модели, актуален.
3.Если вы хотите, чтобы система запускала предиктивный скоринг для всех существующих записей, установите признак [Выполнить фоновое обновление результатов прогнозирования в период окна обслуживания] и настройте фильтр (Рис. 3). В результате предиктивный скоринг будет выполняться в фоновом режиме, последовательно для всех лидов, которые соответствуют условиям фильтрации. Например, предиктивный рейтинг будет рассчитываться для всех лидов, которые еще не были переведены в продажи. Настройки на детали [Настройка фонового обновления результатов прогнозирования] позволяют запускать пакетное прогнозирование данных для всех записей раздела, которые соответствуют условиям фильтра этой детали. Настройка запуска предиктивного скоринга может выполняться как в бизнес-процессе, так и на странице модели.
Пакетное прогнозирование выполняется в период окна обслуживания системы. Настройка временного интервала, в котором система наименее загружена и может выполнять ресурсоемкие процессы, выполняется в справочнике [Окна обслуживания системы].
4.Признак [Прогнозирование активно] устанавливается автоматически. Снимите признак, если вы хотите остановить прогнозирование.
III. Расширенные настройки модели предиктивного скоринга
Перейдите на вкладку [Расширенные настройки], если вы хотите указать дополнительные параметры модели прогнозирования.
1.В области [Добавить дополнительные колонки расширенными средствами?] вы можете средствами разработки сформировать запрос на выборку дополнительных колонок, от которых зависит прогнозируемое значение. Подробнее читайте в статье “Составление запросов на выборку данных для модели машинного обучения”.
2.В группе полей [Расширенные параметры модели] значения заполняются автоматически. При необходимости вы можете их редактировать и заменять другими значениями.
a.[Минимальное количество записей для обучения] — минимальное количество записей, на основании которых может проводиться обучение модели. Если в системе недостаточно исторических записей, то обучение не будет выполнено.
b.[Максимальное количество записей для обучения] — максимальное количество записей, на основании которых может проводиться обучение модели. Если в выборку по настроенному фильтру попадает больше записей, чем указано в этом поле, то будет взято то количество, которое указано в поле, остальные записи будут отсечены.
3.Нажмите кнопку [Сохранить].
4.Нажмите кнопку [Обучить модель] для начала обучения. Прогнозирование в разделе будет выполняться только после того, как будет получен экземпляр модели, точность прогнозов которого превышает нижний порог допустимого качества.
В результате в Creatio будет создана новая модель. При запуске бизнес-процесса будет производиться расчет предиктивного рейтинга для выбранных записей.
В нашем примере модель предиктивного скоринга лидов проанализирует данные в колонках [Бюджет], [Годовой оборот] и [Стадия лида] для всех лидов, у которых заполнено поле [Бюджет], и сравнит их с данными лидов, переведенных в продажи. Чем больше исторических данных используется для обучения модели, тем выше точность прогноза.
Когда будет получен экземпляр модели с точностью прогноза, равной или превышающей нижний порог допустимого качества, в разделе будет доступно прогнозирование категории контрагента на основании данных полей [Бюджет] [Годовой оборот] и [Стадия лида].
Смотрите также
•Основные термины предиктивного анализа данных
•Прогнозирование значения справочного поля
•Прогнозирование значения числового поля
•Рекомендательное прогнозирование