Мощь данных о грамотности

Power of literacy data

Является ли это ключом к успешному использованию данных и аналитики?

Фото от Markus Spiske на Unsplash

Данные являются решающим фактором для успеха бизнеса в современном мире. Однако многие компании продолжают бороться с полным раскрытием их потенциала. Есть несколько причин для этого, о которых я подробно рассказываю в одной из своих последних статей [1]. Возьмем, например, проблему “болота данных”. Это сценарий для инфраструктуры данных, которую организации идеально хотят избежать. Но если такое положение вещей нежелательно, почему тогда бесчисленные компании попадают туда?

Как можно понять, что у вас больше нет озера данных, а вы оказались в грязи? Есть три вопроса, которые вы можете задать:

1. Структура: Легко ли найти путь к нужным данным: Да / Нет

2. Интуитивность: Легко ли найти этот путь: Да / Нет

3. Согласованность: Пути выглядят одинаково для разных типов данных: Да / Нет [2].

Если ответы на все предыдущие вопросы ‘Нет’, то можно сказать:

Фото от Dmitrii Ko на Unsplash

Хорошо, мы выявили проблему с нашей архитектурой. Я посоветуюсь со своей командой по аналитике данных, чтобы ее решить.

Подождите, это не правильный подход!

Проблема не заключается только в нефункциональной архитектуре данных. Настоящая проблема заключается в неспособности извлечь ценность из ваших данных. Техническая сторона лишь следует за этим. Когда данные остаются неиспользованными, они фактически не имеют ценности. Точная оценка стоимости данных проявляется в обороте или прибыли, которые генерируются на основе данных [3].

Может ли проблема заключаться в отсутствии явной стратегии данных? Возможно. Однако, хотя надежная стратегия данных является важной, она не сработает, если корпоративная культура данных слабая. Сотрудники должны принять использование данных в своей повседневной работе. Они должны обладать навыками работы с данными, чтобы наилучшим образом использовать возможности, основанные на данных.

Что такое грамотность в области данных?

Грамотность в области данных включает в себя чтение, понимание, анализ и передачу данных. Развитие грамотности в области данных предлагает преимущества как для лиц, которые ее осваивают, так и для бизнесов, которые делают это своим приоритетом. С индивидуальной точки зрения, она оснащает нас увеличенной способностью критически взаимодействовать с данными и анализами. Она также (надеюсь) дает нам конкурентное преимущество на сегодняшнем рынке труда. Преимущества также очевидны для бизнесов, особенно при использовании данных, понимании клиентов, использовании возможностей и преодолении вызовов.

Аспекты грамотности в области данных. Источник: изображение автора.

Что означает быть грамотным в области данных?

Согласно Бренту Дайксу [4], грамотность в области данных имеет два отличных аспекта: анализ данных и интерпретация данных. Хотя их часто воспринимают как единый процесс, различие между ними крайне важно. Анализ данных является техническим и включает задачи от очистки данных и обнаружения аномалий до анализа трендов и определения корреляций. С другой стороны, интерпретация данных раскрывает значение этих результатов. Она задает вопросы вроде:

Что является причиной наблюдаемого тренда? Как наша организация может воспользоваться определенной корреляцией? Является ли обнаруженная аномалия редким случаем, невидимой возможностью или, возможно, в некоторых случаях, указывает ли наблюдаемая корреляция на причинно-следственную связь?

Кстати: получение положительного ответа на последний из вышеперечисленных вопросов часто считается священным Граалем бизнес-анализа.

Поиск священного Грааля. Источник

Недавно я посмотрел последнее “BARC Data Culture Survey”. В нем говорится, что в 2022 году только 32% участников принимали решения исключительно на основе данных. 18% использовали свой опыт или просто следовали интуиции. Остальные 51% использовали смесь обоих [5]. И это заставило меня задуматься: является ли этот последний показатель чем-то плохим?

С одной стороны, нет. Несмотря на прогресс в области науки о данных, включая использование LLM, все еще требуется “человеческий контакт”. Только люди могут понимать людей: их настроения, вкусы и эмоции. Независимо от того, насколько сложной является компьютерная программа, она все равно остается ниже нас в этой области. С другой стороны, чрезмерное использование человеческих элементов иногда может быть вредным. Все зависит от того, сколько из каждого ингредиента (т.е. данных или интуиции) используется и для какого рода решений. Я заметил, что чем важнее решение, тем больше людей полагаются на то, во что они верят или что уже видели. И, возможно, это не правильное направление в наше время.

Почему разделение анализа данных от их интерпретации имеет смысл?

Ну, это еще одна “человеческая вещь”. Одной из самых больших проблем является переключение между детальным и “вертолетным” видами (и наоборот). Не следует ожидать, что менеджер, который уже перегружен множеством обязанностей, будет играть с заданным набором данных несколько часов или дней. С другой стороны, у ученых-данных может не хватать необходимых знаний в области, таких как изменения в стратегии, понимание среды компании и принятые, но еще не объявленные, критические решения.

В связи с их многочисленными обязанностями менеджеры часто полагаются на специалистов по обработке данных для проведения подробного анализа. Эти специалисты после тщательного изучения данных предлагают ценные идеи. Тем не менее, руководители должны участвовать в интерпретации данных, а не просто принимать выводы пассивно.

Участие менеджеров гарантирует, что интерпретации данных соответствуют общему контексту организации.

Когда руководители основываются на фундаментальных идеях от специалистов по данным, коллективное мышление приводит к более всесторонним решениям.

Цель улучшения уровня грамотности в области данных в организации заключается не в том, чтобы превратить каждого сотрудника в ученого по данным, а в том, чтобы воспитывать людей, обладающих навыками работы с данными. Упор делается на оснащение большей части команды базовыми навыками работы с данными для их повседневных задач, а не на интенсивные роли, связанные с данными.

Быть грамотным в области данных означает иметь уверенность в управлении повседневными данными без продвинутой статистики или программирования.

Это основной навык, который раскрывает потенциал данных вашей организации. Чтобы определить, что является грамотностью в области данных для вашей команды, определите “Минимально достаточную грамотность” на разных уровнях иерархии данных, а не перечисляйте все возможные навыки. Брент Дайкс предлагает разделить необходимые навыки на матрицу 3×3, где по вертикали указываются уровни грамотности в области данных, а по горизонтали – необходимые (минимальные) навыки для каждого уровня [6].

Матрица грамотности в области данных. Таблица автора на основе [6].

В категории Чтение уровень Данных включает базовую числовую грамотность и понимание метрик, специфичных для отрасли. Уровень Информации добавляет способность понимать визуальные материалы (графики) и базовое статистическое понимание, в то время как стадия Коммуникации подчеркивает интерпретацию данных и критическую оценку.

Для категории Работа с уровень Данных приоритетно основные навыки работы с инструментами аналитики и манипулирования данными. Уровень Информации фокусируется на навыках описательного и диагностического анализа, а уровень Инсайтов акцентирует принятие решений на основе данных.

В сфере Общение навыки на уровне Данных включают выполнение запросов и обсуждение тем, связанных с данными. На уровне Информации основное внимание уделяется презентации данных и визуализации, а на стадии Понимания акцент делается на искусстве показательного повествования на основе данных [6].

Следуя принципу 80/20, я считаю, что уровень Понимания является ключевым для достижения грамотности в области данных. В то время как другие уровни полезны, они не являются критическими, особенно с точки зрения принимающих решения.

Сфера “Чтение”

Прежде всего, для всех сотрудников организации, особенно для менеджеров и руководителей, необходимо развивать основные понятия о инструментах и методиках науки о данных. Это не означает, что каждый должен проходить курсы статистики или изучать Python или R. Вместо этого, цель состоит в том, чтобы понять основные термины, понимать преимущества и недостатки конкретных инструментов, и быть готовым проводить элементарные анализы. Я понимаю, что корпоративные роли могут ограничивать время, но я обнаружил, что даже базовое понимание повышает качество моего взаимодействия с учеными по данным, устраняя необходимость в повторном изучении основных концепций и улучшая сотрудничество. Я проверил это на себе.

Сфера “Работа с”

Изменение нашего подхода к работе с данными может значительно изменить культуру нашей компании. Ключевым является сильное руководство. Если руководители не уверены в данных, они будут полагаться на свое интуитивное ощущение, а не на числа.

Я считаю, что мы можем использовать “чемпионов данных” в наших командах. Это люди, увлеченные данными и готовые помочь другим их понять. Они показывают, что данные и анализ не только о сложных таблицах, но и о захватывающих открытиях.

Нам также нужны простые в использовании инструменты, которые позволят каждому исследовать и понимать данные даже без технических навыков. Менеджеры должны использовать эффективные, хорошо спроектированные инструментальные панели для быстрого получения ясной картины [7].

Однако есть риски. В связи с излишним вниманием к ценным данным некоторые компании собирают слишком много информации, тратя время на ее анализ и замедляя принятие решений.

Кроме того, мы можем потерять энтузиазм, если не видим быстрых выгод от использования данных. Особенно если мы только начинаем использовать подход, основанный на данных, важно отмечать маленькие успехи.

Сфера “Коммуникация”

Здесь важную роль играет “повествование с помощью данных”. Почему это так важно? Повествование с помощью рассказов, через повествование и визуализацию, помогает осмыслить обширные данные. Убедительное повествование может привнести ясность в любую историю, какой бы сложной она ни была. Это так важно, что Forbes включает его в список основных требований к ученым по данным. Тем не менее, многие аналитики испытывают трудности в этом. Эффективные истории на основе данных:

  • Делают сложные темы понятными и доступными для обсуждения.
  • Вносят изменения в принятие решений больше, чем личный опыт.
  • Упрощают результаты сложных аналитических данных.

Убедительное повествование относится к высказыванию “вот почему” – основному сообщению. Многим аналитикам не хватает креативности в дизайне или они боятся упрощения. Однако неясные визуальные материалы могут затруднять принятие деловых решений [8].

Я планирую написать о своем подходе к повествованию с помощью данных: оставайтесь на связи!

Помните, что улучшение грамотности в области данных – это марафон, а не спринт.

И это противоположно быстрым трендам в области тренинга, которым многие придерживаются. Быстрый технологический прогресс, например, взлет LLM, подчеркивает необходимость непрерывного обучения. Приоритет следует отдавать постоянному, ежедневному самообразованию, например, чтению статьи в течение 15 минут, а не краткосрочным интенсивным курсам. Если возможно, сочетайте оба вида активности. Однако помните, что уверенность, особенно в таких областях, как повествование, требует практики и опыта, а не только формального обучения. Это о понимании того, что работает, резонирует и соответствует вашей аудитории, а возможно, и вашей зоне комфорта.

Выводы

В современной мире, основанном на данных, члены организации, особенно ее руководство, должны обладать основными знаниями о инструментах и методологиях науки о данных. Для этого не требуется запись на курсы статистики или освоение языков программирования. Вместо этого речь идет о вооружении себя основными терминами, понимании сильных и слабых сторон различных инструментов и способности осуществлять фундаментальный анализ данных. Ограничения времени в корпоративном мире понятны, но даже элементарные знания могут значительно улучшить и оптимизировать взаимодействие с профессионалами по данным. Укрепление нашей ориентации на принятие решений, основанных на данных, в повседневной деятельности, совместно с мощным применением повествования, находится на вершине этого процесса. Именно на этом этапе мы можем считать себя настоящими экспертами в области грамотности в области данных.

Вам понравилась эта статья? Рассмотрите возможность подписки на меня в VoAGI.

Ссылки:

[1] Szudejko, Michal, От цифр к действиям: как данные работают для компаний, 14 августа 2023 года

[2] Pilcher, Bryce, Является ли мой Data Lake на самом деле Data Swamp?, 23 марта 2023 года

[3] Mewald, Clemens, Почему данные *не* являются новой нефтью, и рынки данных не смогли нас удовлетворить, 13 июля 2023 года

[4] Dykes, Brent, 4 ключа к лучшим навыкам интерпретации данных для любого менеджера, 16 июня 2022 года

[5] BARC, Опрос Data Culture 23 от BARC — Как освободить доступ к данным, чтобы дать возможность пользователям работать с данными

[6] Dykes, Brent, Понимание данных и искусство повествования о данных: как они сочетаются?, 12 мая 2022 года

[7] Szudejko, Michal, Использование управленческих панелей для повествования: реальный путь?, 3 августа 2023 года

[8] Decoded, Визуализация нашего мира сегодня: повествование с помощью данных, 29 июля 2022 года