Искусство создания качественного анализа данных

Искусство создания качественного анализа данных мастер-класс для профессионалов

Тремя словами: своевременность, методология и усвояемость

Несколько недель назад я писал о построении систем для генерации более качественных исследований. Я показал, как увеличить результативность вашей команды, работая над такими областями, как процессы, инструменты, культура и прочее, но я никогда не определил, что я подразумеваю под “качеством” – поэтому на этой неделе мы проведем глубокий анализ этого понятия.

Обычно, когда кто-то говорит о качестве в отношении исследования данных, мы сразу же переходим к “гарантии того, что анализ данных звучен и результаты надежны”. Я считаю, что это лишь часть определения. Из моего опыта работы более 8 лет в аналитике для того, чтобы анализ данных можно было назвать “хорошей работой”, он должен быть смесью трех основополагающих элементов:

  • Отвечать на реальную потребность с точностью и своевременностью.
  • Быть основан на прочной, проверенной методологии.
  • Быть понятным для организации.

Давайте окунемся в это!

Что включает успешный анализ данных - изображение автора

Отвечая на реальную потребность с точностью и своевременностью

Для того, чтобы анализ данных имел действительно значительное влияние, крайне важно, чтобы он решал реальную, четко определенную потребность. Это означает понимание того, какая проблема решается, кого она затрагивает, почему она актуальна в данный момент и ясность в том, как результаты анализа будут конкретно использованы. Точность этого понимания прямо влияет на ценность вашего анализа для конечных пользователей.

Важно определить реальную потребность, а не воспринимаемую. Это гарантирует, что анализ не только теоретически полезен, но и практически применим. Это гарантирует, что в конце проекта, когда вы представляете его заинтересованным сторонам, у вас не возникает вопросов вроде “и что теперь?”. Это четко определяет разницу между предоставлением понятных и конструктивных данных и предложением информации, которая, хотя и интересна, может быть не сразу полезной.

Например, розничная компания может представлять, что необходимо проанализировать демографические данные клиентов в общем, но действительная потребность может заключаться в понимании покупательских привычек определенной возрастной группы. Последнее непосредственно влияет на маркетинговые стратегии и принятие решений о товарном запасе, что имеет более глубокий эффект на операции бизнеса.

Равным образом важна своевременность анализа. Этот аспект включает два ключевых элемента: актуальность потребности в настоящее время и скорость предоставления анализа.

  • Актуальность потребности: Потребности бизнеса часто зависят от времени и могут быстро изменяться – особенно если вы работаете в быстром темпе организации. Анализ, который решает актуальную насущную проблему, является намного более ценным, чем тот, который поступает слишком поздно или выполнен слишком рано. Например, анализ тенденций потребительского спроса перед крупным праздничным сезоном может быть бесценным для бизнеса в плане формирования запасов и маркетинга, но если он поступает после начала сезона, то упущена возможность.
  • Скорость предоставления анализа: Критически важна скорость, с которой предоставляется анализ, так как это влияет на актуальность потребности. И этот фактор следует учесть, так как иногда вам может приходиться идти на компромиссы между полнотой исследования и скоростью (например, если появляется новый тренд в социальных сетях и ваша компания хочет анализировать его в своих интересах, вы не можете потратить 2 месяца, чтобы предоставить результаты).

В заключение – шансы на успех вашего анализа данных значительно возрастают, если он точно идентифицирует и решает реальную, актуальную потребность, и если он предоставляется в своевременной манере, обеспечивая максимальную актуальность и воздействие.

Иметь структурированную методологию

Слишком часто я вижу анализы данных, которые не используют какую-либо стандартную методологию. И хотя это не обязательно означает, что исследование будет плохим, вы значительно уменьшаете шансы создания высококачественной работы, если не следуете проверенной методологии.

Структурированный / стандартизированный подход гарантирует тщательность и также повышает надежность и воспроизводимость анализа.

Одной из методологий, которую я нахожу легкой для следования, является фреймворк CRoss Industry Standard Process for Data Mining (CRISP-DM). После почти десяти лет работы в этой области, это по-прежнему мой основной фреймворк при старте анализа с нуля. Этот фреймворк, который считается стандартным процессом “науки о данных” / “анализа данных”, имеет 6 основных фаз:

  • Понимание бизнеса: Во время этой фазы аналитик данных должен тщательно понять “бизнес-контекст” запроса: какую проблему мы пытаемся решить, что мы делали раньше, кто является “актерами”, какие есть риски, ресурсы и т. д. — и очень важно, какие будут критерии успеха для проекта.
  • Понимание данных: Эта фаза включает знакомство с данными — это описательный и исследовательский анализ данных и выявление проблем качества данных. Это ваш собственный “предварительный обзор”, где вы начинаете понимать нюансы и потенциал данных.
  • Подготовка данных: Эта фаза связана с выбором данных, с которыми вы хотите работать, с обоснованием их включения/исключения, а затем с очисткой и преобразованием данных в формат, подходящий для анализа. Это похоже на подготовку ингредиентов перед приготовлением еды — необходимо для хорошего результата.
  • Моделирование: Идея “моделирования” может пугать некоторых людей — но моделирование может быть простым, как “создание определенного порога” для метрики true/false (например, если ваш проект связан с пониманием/определением оттока). Во время этой фазы к подготовленным данным применяются различные моделировочные техники, чтобы вы могли сравнить их между собой и понять, какие из них наиболее успешные.
  • Оценка: Теперь модели критически оцениваются, чтобы убедиться, что они соответствуют бизнес-целям и критериям успеха, установленным в фазе №1. Это часто приводит к новым идеям, которые можно использовать для повторного просмотра и корректировки вашего понимания бизнеса.
  • Внедрение: Финальная фаза предполагает применение модели к реальным данным и ситуациям, эффективное применение анализа и начало использования полученных знаний для улучшения работы команды.

Этот фреймворк увеличивает вероятность того, что ваш анализ будет более надежным, заставляя вас пройти через эти различные шаги — оставляя место для творчества.

Сделать вашу работу доступной

Усваиваемость не ограничивается упрощением сложной информации и упрощением понимания вашего презентационного материала. Это включает два важных аспекта: (1) поощрение глубокого понимания аудитории и (2) дать им возможность применять эти знания на практике, в конкретной и значимой манере. Этот процесс подобен тому, как организм расщепляет пищу и использует питательные вещества для поддержки различных функций.

Поощрение глубокого понимания аудиторией

Для достижения этого необходимо предоставить доступность данных и созвучность с аудиторией. Здесь важную роль играют эксперты в области. Вовлечение экспертов в области знания на ранних стадиях анализа позволяет их профессиональным знаниям направлять формирование и интерпретацию данных, обеспечивая согласованность анализа с реальными контекстами и представление его таким образом, чтобы это имело значение для предполагаемой аудитории.

Еще одна важная стратегия для повышения доступности – это внедрение процесса “stage-gate”, включающего регулярные проверки и обновления с заинтересованным лицом или получающей командой. Такой подход позволяет избежать перегружения их большим объемом сложной информации в конце исследования. Вместо этого, заинтересованные стороны сопровождаются на пути, позволяя им постепенно усваивать новые идеи. Это также открывает возможности для непрерывного обратного связи, гарантируя, что анализ остается соответствующим по мере изменения потребностей и ожиданий аудитории.

Представьте, что вы работаете в крупной организации, реализующей новую стратегию на основе данных. Если команда данных представит только финальный анализ без предварительного вовлечения, заинтересованные стороны могут испытывать трудности в понимании нюансов или видеть его релевантность для их конкретного контекста. Однако, вовлечение этих заинтересованных лиц на регулярной основе – через периодические презентации или мастер-классы, они становятся более знакомыми с данными и их последствиями. Они могут предложить ценные отзывы, направляя анализ в области, наиболее значимые для них, таким образом, обеспечивая не только понятность окончательного продукта, но и немедленную действенность и приспособленность к их потребностям.

Дать аудитории возможность применять знания

Реализация знаний связана с превращением этого глубокого понимания в реальные приложения или решения. Речь идет о том, чтобы аудитория могла эффективно использовать сведения для достижения конкретных результатов. Речь идет о том, чтобы серьезно задуматься о «окончательной стадии» между вашим анализом и влиянием на реальную жизнь и о том, как вы можете помочь устранить любые препятствия для применения ваших идей.

Например, если вы работаете над проектом, целью которого является определение оттока пользователей, то создание инструмента, позволяющего заинтересованным лицам понять, как выглядят ваши конкретные результаты, сделает ваше исследование более доступным.

Другие идеи включают проведение семинаров, разработку интерактивных визуализаций и т.д. – все, что поможет команде легче начать работу.

В заключение – понятность проекта по анализу данных существенно повышается благодаря вовлечению экспертов предметной области с самого начала и поддержанию постоянной коммуникации с заинтересованными лицами. Такой коллаборативный подход гарантирует, что исследование не только понятно, но и непосредственно важно и полезно для тех, кто должен от этого иметь выгоду.

В заключение

Успешный анализ данных – это сочетание технической грамотности, стратегической приспособляемости и практической применимости. Здесь не только следование определенному набору шагов, но и понимание и адаптация этих шагов для уникального контекста каждого проекта. Своевременность, правильное выполнение и учет реальных организационных потребностей являются основой, поддерживающей связь между анализом данных и успехом организации. Основная цель – превращение данных в действенные идеи, способствующие созданию ценности и информированию стратегического принятия решений.

Надеюсь, вам понравилась эта статья! У вас есть какие-либо советы, которыми вы хотели бы поделиться? Дайте всем знать в комментариях!

PS: Эта статья была также опубликована на ресурсе Analytics Explained, рассказывающем о моем опыте в различных аналитических ролях (от стартапов из Сингапура до крупнейших технологических компаний в Сан-Франциско), а также отвечающем на вопросы читателей о аналитике, развитии и карьере.