Четыре вида аналитики данных: дескриптивная, диагностическая, предиктивная, прескриптивная. Чем отличаются и для чего используются
Способность извлекать максимальную ценность из данных положительно влияет на успех бизнеса и конкурентоспособность компании.
Данные используются для мониторинга и оптимизации бизнес-процессов, помогают лучше понять потребности и поведение клиентов, позволяют управлять рисками и принимать эффективные управленческие решения.Аналитика данных помогает обосновать эти решения на разных уровнях:
- Описательном — объяснить, что произошло
- Диагностическом — понять, почему это произошло
- Предиктивном — оценить, что может произойти в будущем
- Предписывающем — получить варианты решения проблем

В процессе аналитики данные преобразуются в информацию и формируют знания, помогающие действовать своевременно и эффективно в ответ на вызовы рынка.
В материале разбираемся, чем данные отличаются от информации и рассказываем о четырех уровнях анализа данных, которые превращают данные в ценные инсайты.
Разница между данными, информацией и знаниями
Зачастую три этих определения используют взаимозаменяемо, что некорректно.
С точки зрения места в принятии решений данные локализованы во всем мире, знания — в людях, компаниях, устройствах, а информация выступает связующим звеном между ними. Сами по себе они не указывают на причины того или иного события и не помогают определить дальнейшие действия. Данные могут поступать из внутренних и внешних источников, быть объективными и субъективными, качественными, количественными и так далее. Например, набор чисел «10, 20, 30» — это данные, но без дополнительной информации они не говорят о чем-то конкретном. Если набор чисел «10, 20, 30» означает количество продукта 1, продукта 2 и продукта 3, проданного за период, это уже информация, на основе которой можно сделать выводы («Продукт 3 был продан в количестве 30 штук, он продается лучше остальных»). Знания всегда полезны для практических действий. Для демонстрации получения ценности в процессе обработки данных используется концепция DIKW: Понимая, как данные трансформируются в мудрость, можно сделать вывод о том, что главную ценность представляет собой информация, которую мы получаем, когда данные: С этой целью проводится аналитика данных — процесс уменьшения неопределенности данных, их описания, интерпретации и извлечения полезной информации. Аналитика данных может включать в себя применение статистических и логических методов, инструментов визуализации (BI) и машинного обучения (ML) для изучения данных, поиска закономерностей, трендов и зависимостей. Существует два уровня развития аналитики данных: Что такое BI, и зачем компаниям система бизнес-аналитики? >> Каждый уровень аналитики делится на виды в зависимости от бизнес-вопросов, на которые он отвечает.
На схеме ниже продемонстрированы разные виды аналитики, а также зависимость эффективности анализа от его уровня сложности. Чем выше сложность проводимой аналитики, тем больше выгода для бизнеса от нее. Отвечает на вопрос «Что случилось?». Наиболее общий и простой с точки зрения методов и технологий вид аналитики данных. Для проведения анализа используют методы описательной или дескриптивной статистики: Информация о событии отображается с помощью таблиц регламентной отчетности и аналитических панелей (дашбордов) с визуализациями в виде ключевых показателей. Примеры описательной аналитики:
Отвечает на вопрос «Почему это произошло?». Помогает выяснить причины произошедших событий, глубже понять проблемы и находить пути их решения. В этом виде аналитики применяют поиск корреляций (взаимосвязей), регрессионный анализ, анализ временных рядов, определение выбросов и аномалий, фильтрацию. Для диагностической аналитики используют self-service BI-инструменты, позволяющие пользователю без знаний ИТ самостоятельно проводить исследование данных и создавать визуализации.
Примеры диагностической аналитики:
Предсказательная аналитика отвечает на вопрос «Что вероятнее всего случится дальше?». Исторические данные используются для формирования прогнозов и выявления будущих трендов. Для анализа используют разные виды регрессии — исследования влияния одной или нескольких независимых переменных на зависимую переменную, а также классификацию, кластеризацию, тестирование гипотез и само прогнозирование. В предиктивной аналитике применяют языки программирования R и Python, инструменты машинного обучения и искусственный интеллект.
Примеры предиктивной аналитики:
Прескриптивная аналитика отвечает на вопрос «Что мы должны делать?». Это продвинутый вид аналитики, основанный на предыдущих четырех видах. Наименее структурированный и наиболее комплексный вид аналитики, когда система помогает построить возможные сценарии событий и выбрать наиболее эффективный. Первостепенную роль в предписательном анализе играет опыт и накопленные знания людей в сочетании с ИИ-ассистентами и методами машинного обучения.
Примеры прескриптивной аналитики: ***
В зависимости от задач конкретных подразделений разные виды аналитики могут использоваться параллельно. Для простых задач будет достаточно диагностической аналитики. Продвинутая аналитика принесет больше результата в работе с большими объемами данных, но потребует разработки регламентов их обработки и хранения, внедрения ML и привлечения экспертов Big Data. По-настоящему полезной и удобной аналитика данных становится тогда, когда она упрощает повторяющиеся процессы, подстраивается под нужды пользователей и масштабируется вместе с бизнесом. Это возможно в рамках единой аналитической системы в сочетании с внедрением корпоративного хранилища данных.
Что такое аналитика данных
Виды аналитики данных
Традиционная аналитика
Дескриптивная (описательная) аналитика
Диагностическая аналитика
Продвинутая аналитика
Предиктивная (прогнозная, предсказательная) аналитика
Прескриптивная (предписательная) аналитика
Извлекайте ценные инсайты из данных