Обучение моделей производится в облачном сервисе. В результате анализа исторических данных выявляются закономерности, которые впоследствии используются для прогнозирования. В облачном сервисе не сохраняются данные, на которых обучался экземпляр модели, сохраняются только типичные закономерности.
Количество записей для обучения
Сервис предиктивного анализа позволяет обучать модели на выборках, содержащих до 75 тысяч исторических записей. Если выборка содержит большее количество записей, то сервис выберет из нее в произвольном порядке 75 тысяч записей.
Для достижения нижнего порога допустимого качества прогнозирования в 50% рекомендуется использовать для обучения моделей, выполняющих анализ текстовых данных, не менее 20 тысяч исторических записей, а для моделей, выполняющих анализ числовых данных, не менее 1 тысячи исторических записей.
Увеличение количества исторических данных повышает точность прогнозов, поэтому все модели рекомендуется регулярно переобучать.
Статус обучения модели
Индикатор состояния обучения на странице модели позволяет следить за текущим статусом обучения модели (Рис. 1).
Когда обучение завершено, в системе сохраняется экземпляр модели, который активируется автоматически и в дальнейшем используется для прогнозирования данных. Переобучение моделей и сохранение новых экземпляров происходит автоматически в фоновом режиме. Периодичность переобучения настраивается в разделе Модели машинного обучения.
Факторы, влияющие на прогнозирование
Факторы, влияющие на прогноз или качество обучения модели, отображаются в верхней части вкладки Обучение (Рис. 2). Цифры указывают, насколько каждый из факторов влияет на результат прогнозирования. Факторы отобразятся после завершения обучения модели.
После обучения моделей прогнозирования, использующих текстовые данные, на вкладке Обучение вы можете получить информацию о ТОП-20 слов и фраз, которые влияют на результат прогноза (Рис. 3).
Вы можете использовать эти данные, чтобы проанализировать принципы работы и результат прогнозирования моделей, а также выполнить отладку их параметров при необходимости.