Основные термины предиктивного анализа данных
Предиктивный анализ данных — класс методов анализа данных, позволяющих спрогнозировать будущее поведение объекта анализа в заданных условиях. Использует статистические методы для анализа текущих и исторических данных и составляет прогноз о будущих событиях.
Прогнозирование значения справочного поля является одним из инструментов предиктивного анализа данных, позволяет предсказать значение справочного поля на основании анализа существующих в системе данных. Подробнее >>>
Предиктивный скоринг является одним из инструментов предиктивного анализа данных, используется для формирования рейтинга записи на основании анализа исторических и современных данных. Подробнее >>>
Прогнозирование значения числового поля — позволяет предсказать значение числового поля на основании анализа существующих в системе данных. Подробнее >>>
Задача машинного обучения — набор команд, описывающий проблему, которую необходимо решить при помощи предиктивного анализа. Перечень задач машинного обучения содержится в справочнике [Задачи машинного обучения].
Модель машинного обучения — алгоритм, который определяет, на основании каких данных должен производиться предиктивный анализ для решения указанной задачи. Перечень моделей машинного обучения содержится в разделе [Модели машинного обучения].
Экземпляр модели машинного обучения — набор закономерностей, полученных моделью машинного обучения в результате обработки исторических данных.
Исторические данные — выборка, созданная из записей системы для получения модели. Историческими модель считает записи, которые были созданы и заполнены данными до обучения нового экземпляра.
Обучение модели — процесс, в ходе которого модель машинного обучения обрабатывает исторические данные для выявления закономерностей, позволяющих решить задачу машинного обучения. В результате обучения создается новый экземпляр модели машинного обучения. Периодичность переобучения моделей настраивается в разделе [Модели машинного обучения].
Прогноз — перечень возможных значений справочного поля с учетом их вероятности. Вероятность данных в прогнозе указана в процентах с округлением до целых чисел.
Нижний порог допустимого качества — точность прогноза, по достижении которой экземпляры модели могут применяться для решения задач машинного обучения. Экземпляры, не достигшие нижнего порога допустимого качества, системой не используются и отправляются в очередь на переобучение. Рекомендуется указывать нижний порог допустимого качества более 0,5 (50%). Значение нижнего порога допустимого качества для каждой из моделей устанавливается в разделе [Модели машинного обучения].
Смотрите также
•Как создать модель прогнозирования значения справочного поля
•Как создать модель прогнозирования значения числового поля
•Как настроить определение рейтинга записей