Как построить стратегию науки о данных для команд любого размера

Стратегия науки о данных для команд любого размера

Создание культуры и практики, которые были бы быстрыми и устойчивыми к изменениям

Фото: Maarten van den Heuvel на Unsplash

Создание культуры и практики, которые были бы быстрыми и устойчивыми к изменениям

Если вы являетесь руководителем в области науки о данных, которому было поручено “разработать нашу стратегию в области науки о данных” с большой свободой и малым руководством, этот пост поможет вам. Мы рассмотрим:

  • Что мы имеем в виду под стратегией: это просто план? Дорожная карта? Что-то большее или меньшее? В этом разделе мы будем конкретными и примем рабочее определение того, что мы создаем, когда разрабатываем стратегию.
  • Как это понятие применяется к команде по науке о данных в практическом организационном контексте? Здесь мы рассмотрим, как наше понятие стратегии применяется к науке о данных и точно определим, к чему применяется наша стратегия.
  • Как фактически разработать эту стратегию.

На протяжении всего поста мы будем активно использовать подходы к стратегии в области исследований и разработок (R&D), которые имеют общие проблемы с наукой о данных: миссия инноваций и увеличение неопределенности, связанной с поиском открытий. В результате вы получите четкое определение стратегии и полезный процесс разработки стратегии для организации любого размера.

Что такое стратегия?

Если, подобно мне, у вас нет престижного MBA и вы никогда не посещали семинары по стратегии бизнеса, вас может озадачить, что именно кто-то хочет, когда просит вас разработать “стратегию в области науки о данных”. И вы можете не найти полезных ответов при первичном поиске. Классические и мощные рамки, такие как модель “Три С” (клиенты, конкуренты, компания), имеют смысл на уровне корпорации, определяющей, где она должна конкурировать. Примените это к функции или команде, и вы почувствуете, что растягиваете концепции больше, чем они могут выдержать.

Если вы действительно похожи на меня, это отправит вас в довольно глубокую кроличью нору чтения книг, таких как “Властители стратегии” и “Способ Маккинси”. Первая – прекрасное произведение бизнес-истории, а вторая – полезная коллекция методик, извлеченных из опыта успешных консультантов престижной фирмы. Ни одна из них не дает быстрого ответа на этот вопрос. Очень полезным побочным эффектом чтения “Властителей стратегии” является осознание того, что ученые по данным здесь не одиноки: “[Я] легко смешивать стратегию с стратегическим планированием, но это также опасно. […] до сих пор больше компаний имеют план, чем стратегию. Просмотрите большинство планов, и вы найдете какую-то версию вроде “Мы собираемся продолжать делать то, что мы делали, но в следующем году мы собираемся делать больше и/или лучше”. Это путаница в определениях проявилась в моем опыте, когда несколько раз просьба о стратегии сводилась к вопросу “Каков ваш план на следующие несколько месяцев?”

Очень полезное определение стратегии, которое мы применим в этой статье, предложено в рабочей статье о стратегии исследований и разработок (R&D) Гари Писано: “Стратегия – это ничто иное, как обязательство к шаблону поведения, направленному на помощь в победе в конкуренции.” Преимущество этого определения заключается в том, что оно может применяться на любом уровне и для любых целей организации. Все команды, всех типов и размеров, вносят свой вклад в конкурентные усилия организации, и все команды могут определить и объявить шаблоны поведения, которые они используют для сосредоточения этих усилий.

Стратегия – это ничто иное, как обязательство к шаблону поведения, направленному на помощь в победе в конкуренции.

—Гари Писано

Писано предлагает три требования к хорошей стратегии: последовательность, согласованность и соответствие. Стратегия должна помогать нам принимать последовательные решения, которые вносят свой вклад, накопительно, к желаемой цели; должна помогать всем углам организации согласовывать свои удаленные тактические решения; и должна согласовывать местные действия с более общими усилиями коллектива.

И, наконец, все они основаны на основных гипотезах, предположениях о том, что принесет преимущество в конкуренции. Полезным примером Писано является Apple, стратегия которого “разработка простых в использовании и эстетически привлекательных продуктов, интегрирующихся плавно с более широкой системой устройств в цифровом мире потребителя” основана на основной гипотезе “о том, что клиенты будут готовы платить значительно более высокую цену за продукты с такими атрибутами”.

По сути, согласно этому определению, все стратегии являются ставками, которые объединяют логику принятия решений: они предоставляют всем сторонам средство определения, какие действия помогают коллективному усилию.

Мы примем это определение стратегии и постараемся определить нашу собственную основную стратегическую гипотезу о том, как наука о данных будет приносить ценность нашей организации и какие модели мы применим в этом стремлении к ценности. Кроме того, мы предположим, что у нашей родительской организации есть разработанная собственная стратегия, и эта информация будет критической при применении третьего теста на соответствие. Определив форму, которую должна принять наша конечная стратегия, мы теперь обратим внимание на ограничение ее области.

Что мы подразумеваем под наукой о данных и как это применимо к концепции стратегии?

Чтобы напомнить своим друзьям, насколько я интересен, я отправил нескольким одно и то же текстовое сообщение: “О чем вы думаете, когда слышите ‘стратегия науки о данных’?” Ответы варьировались от очень глубоких замечаний о данных инфраструктуры и MLOps до здорового возмущения неопределенностью вопроса (я чувствую себя понятым), а также красочных “бессмыслиц” и “моя идеальная работа”.

Небольшая выборка, но разнообразие ответов от этой группы – включая опытных менеджеров по продукту как в стартапах, так и в крупных компаниях, руководителя по науке о данных и консультанта – говорит о том, насколько запутанными могут быть определения этого термина. Еще хуже, ученые по данным страдают от второй проблемы путаницы: то, что называется “наукой о данных” на практике, часто следует из набора навыков, которые фирма хочет набрать, и приукрашивается заголовком, который сейчас моден.

Для устранения одной из этих степеней свободы в нашем анализе мы сначала примем общее определение науки о данных для остальной части этой статьи: функция, посвященная созданию ценности и конкурентного преимущества путем моделирования доступных данных организации. Это может принимать несколько типичных форм:

  • Создание моделей машинного обучения, которые оптимизируют решения, связанные с обслуживанием клиентов в производственной среде
  • Создание моделей, которые помогают сотрудникам на всех уровнях выполнять свою работу, возможно, в приложениях с участием человека, обслуживающего клиента
  • Создание интерпретируемых моделей для выводов, которые помогают принимать деловые решения

Обратите внимание, что мы исключаем бизнес-интеллект и аналитику, исключительно ради фокуса и не потому, что они менее ценны, чем модельная работа. Ваш отдел аналитики и ваш отдел науки о данных должны гладко сотрудничать. (Я писал об этом здесь.)

Некоторые, например, моя подруга и менеджер по продукту в Google Кэрол Скордас Уолпорт, предлагают включить в стратегию науки о данных “Как достичь такого состояния данных и инфраструктуры, чтобы быть в состоянии выполнять анализ или машинное обучение. Я бы сказал, что это – как обеспечить команду выполнением всей работы”. Мы намеренно исключаем эти аспекты широкой стратегии данных из рамок. (Извини, Кэрол.) Однако мы обсудим преодоление ограничений данных и инфраструктуры, а также то, как разработка вашей стратегии науки о данных может позитивно влиять на вашу широкую стратегию данных.

Теперь у нас есть рамки: мы создаем набор основных стратегических гипотез о том, как машинное обучение и/или искусственный интеллект могут приносить максимальную ценность организации, с собственной определенной стратегией или целями, а также набор шаблонов, к которым команда будет придерживаться в стремлении к этой ценности. Как мы начинаем?

Создание нашей стратегической основной гипотезы: Начните с победоносного мышления в области искусственного интеллекта

Опытные менеджеры по продукту, инженеры и ученые по данным в области машинного обучения часто замечают, что продукты машинного обучения отличаются от традиционного программного обеспечения. Организация должна учитывать риск ошибок модели, дрифта данных, мониторинга и переобучения модели – вот почему появился современный MLOps. И очень легко совершить грехи инженерии, которые приведут к техническому долгу в приложениях машинного обучения. (См. “Машинное обучение: кредитная карта с высокими процентными ставками технического долга” – отличное чтение по этой теме.) Так зачем же мы это делаем, учитывая все эти затраты?

В конечном счете, мы рассматриваем решения на основе искусственного интеллекта, потому что утонченные модели имеют доказанную историю способности обнаруживать ценные закономерности. Это могут быть любые вещи, от кластеров предпочтений клиентов, которые указывают на новые сегментации, до скрытых представлений, которые нейронная сеть находит для оптимизации предсказаний. Каждая построенная модель машинного обучения основана на предположении, что модель может обнаружить закономерности, которые могут улучшить процесс, выявить действенные результаты или улучшить ценные прогнозы.

При определении основной стратегической гипотезы для команды по науке о данных любого размера мы можем начать с этого примера описания компаний, использующих искусственный интеллект, от McKinsey. Из статьи “Побеждать с помощью искусственного интеллекта – это состояние разума”:

Если мы выберем правильные случаи использования и будем делать все правильно, мы узнаем все больше о наших клиентах и их потребностях и постоянно улучшим нашу службу для них.

Это чрезвычайно полезный объектив при попытке разработать стратегию науки о данных: он сфокусирован на максимальном обучении, и все, что нам нужно сделать, это определить “правильные” применения для нас. Но какие “правильные” применения подходят для нас?

Здесь Пизано снова полезен, определяя четыре элемента стратегии И исследований, которые прекрасно подходят для науки о данных:

  • Архитектура: организационная (централизованная, распределенная) и географическая структура нашей функции науки о данных.
  • Процессы: формальности и неформальности управления нашей работой.
  • Люди: все, от смеси навыков, которые мы стремимся привлечь, до нашего предложения ценности для нашего таланта.
  • Портфель: как мы распределяем ресурсы между типами проектов и “критерии, используемые для сортировки, приоритизации и выбора проектов”.

Мы начнем с последней концепции и сосредоточимся на определении идеального портфеля проектов для нашей организации, смеси, которую мы можем убедить себя, что принесет наибольшую ценность. Учитывая значительное разнообразие организаций, мы начнем с одного вызова, с которым сталкивается каждая организация: риск.

Определите целевой портфель: Определите уровни риска и управление в соответствии со своей стратегией

Моделирование работы имеет неопределенные результаты. “Машинное обучение может сделать лучше” – это аргумент, который мы часто используем на основе истории и интуиции, и он часто оказывается верным. Но мы никогда не знаем, насколько хорошо это будет работать начиная с самого начала, пока мы не докажем конструкцией, насколько хорошо МО может решить проблему. Получение ответа на этот вопрос для любого конкретного случая использования может потребовать разной степени усилий и, следовательно, разного уровня затрат. Неопределенность этого ответа также может варьироваться в зависимости от того, как широко применяются наши модели и насколько хорошо мы понимаем наши данные.

Друг мой и руководитель продукта в области здравоохранения, Джон Менард, определил риск как явную часть стратегии науки о данных: “Как вы поддерживаете поток малых и крупных ставок, сохраняя здоровые ожидания, что это все они? Какова ваша стратегия по уничтожению проекта, если данные не подтверждаются, или переориентации доставляемого продукта, если он не отвечает требованиям?”

Для организаций разумно иметь принципиальное и конкретное представление о том, какие ресурсы они могут позволить себе использовать и на какой срок. Вот несколько полезных вопросов, которые можно задать для любого отдельного модельного усилия:

  • Ожидаемая вероятность успеха: Каковы шансы, что этот модельный случай использования оправдает себя?
  • Ожидаемый диапазон доходов: Если успешно, будет ли этот проект обеспечивать незначительное улучшение в процессе, который может давать огромные отдачи на масштабе? Будет ли прорыв отличать вас от конкурентов?
  • Ожидаемое время до открытия неудачи: Как долго потребуется, чтобы узнать, возможно ли воплощение предполагаемой ценности проекта? Какой минимальный объем ресурсов вы можете потратить, прежде чем узнать, что этот проект не сработает?

Надеюсь, эти принципы очевидны, и все они являются согласованными положительными вещами. Идеальный проект, скорее всего, оправдается, принеся огромную отдачу от инвестиций, и если он потерпит неудачу, то потерпит рано. Этот небесный троицу никогда не существует. Искусство заключается в поиске компромиссов, которые соответствуют вашей организации.

Стартап на ранней стадии, сосредоточенный на нарушении определенной области с помощью ИИ, может иметь инвесторов, руководство и персонал, которые принимают компанию как единственную большую ставку на определенный подход. Или он может предпочесть небольшие проекты, которые быстро попадают в производство и позволяют быстрым переключениям. Напротив, если мы находимся в крупной, установленной компании и хорошо регулируемой отрасли с заинтересованными в МО стейкхолдерами, мы можем выбрать смещение нашего портфеля в пользу проектов с низким уровнем затрат, которые приносят приращение стоимости и быстро терпят неудачу. Это может помочь построить начальное доверие, настроить заинтересованных лиц на неопределенность, присущую проектам по науке о данных, и выровнять команды вокруг более амбициозных проектов. Успешные ранние небольшие проекты также могут укрепить аргументацию в пользу более крупных проектов в той же проблемной области.

Вот несколько примеров того, как определить целевой портфель в терминах объема проекта, продолжительности и ожидаемых доходов:

  • “Будучи на начальном этапе нашего совместного пути науки о данных, мы сосредоточены на небольших проектах с низким уровнем затрат и быстрым провалом, которые помогут нам обнаружить возможности, не рискуя значительным количеством рабочего времени персонала”.
  • “Мы определили портфель из трех больших ставок на машинное обучение, каждая из которых может открыть огромную ценность”.
  • “Мы стремимся к балансу между небольшими, VoAGI- и высокозатратными проектами, с соответствующим уровнем доходности. Это позволяет нам достигать частых побед, стремясь к потенциальному изменению игры”.

В качестве последнего принципа, который следует применять в нашем полном портфеле, стремитесь к коллекции проектов с некоррелированными успехами. То есть мы хотим видеть наш портфель и ощущать, что проекты будут успешными или неудачными независимо друг от друга. Если несколько проектов основаны на общем предположении, если мы чувствуем, что они настолько связаны, что они будут успешными или неудачными вместе, то мы должны пересмотреть выбор.

Мы заканчиваем этот этап, когда у нас есть:

  • Оцененные возможности в области науки о данных и машинного обучения
  • Отображение их по инвестициям, доходности и вероятности успеха
  • Выбор предварительного приоритетного списка, соответствующего нашим целям и уровню риска

Теперь, когда мы определились с нашим целевым портфелем, мы обратим внимание на то, чтобы наши процессы позволяли нам быстро выявлять, описывать и доставлять ценные проекты.

Сфокусируйте свой портфель на том, что ваша команда уникально способна решить

Вопрос о том, строить или покупать, является постоянным и часто включает в себя сложную организационную динамику. Не хватает поставщиков и стартапов, предлагающих решения в области искусственного интеллекта. Многие из них являются “змеиной маслом”; многие работают. Многие внутренние технические и DS-команды считают первых шуткой, последних конкурентами, а время, потраченное на разделение двух, – огромной потерей времени. У этого есть заслуги, поскольку время, потраченное на изучение поставщика, не продвигает навыки моделирования, и если организация не вознаграждает их усилия, это затраты, которые платит ученый-данных без карьерного вознаграждения. И это межличностная сложность усугубляет уже сложный деловой случай: никакие типичные проблемы программного обеспечения не исчезают. Вам все равно придется беспокоиться о таких вещах, как привязка поставщика и интеграция с облачными решениями. Тем не менее, мы все должны быть готовы покупать продукты поставщиков, обеспечивающие более высокую отдачу от инвестиций, и вы можете избежать отвлечений, если учтете уникальные преимущества вашей внутренней команды перед готовыми решениями.

В частности, ваша внутренняя команда может, в общем, иметь управляемый доступ к большей части (возможно, всей) собственной информации вашей организации. Это означает, что внутренняя команда, вероятно, может понять ее более глубоко и легче обогатить ее другими источниками, чем одноразовое решение поставщика. При наличии достаточного времени и вычислительных ресурсов способная внутренняя команда, вероятно, сможет превзойти одноразовое решение поставщика. (Здесь где-то есть шутка о PAC-теории.) Но стоит ли это того?

Здесь ключевым является стандартный анализ ROI и альтернатив, с акцентом на ваше время до внутреннего рынка. Предположим, что мы оптимизируем размещение рекламы на сайте электронной коммерции. Мы сократили список поставщиков до одного лидера, который использует многорукий бандит, общий метод среди ведущих поставщиков оптимизации маркетинга на момент написания этого документа. Мы оцениваем время интеграции поставщика в один месяц. Или мы можем создать свой собственный MAB и оцениваем, что это займет шесть месяцев. Ожидаем ли мы, что MAB, который мы создадим, превзойдет MAB, используемый поставщиком, и достаточно ли это оправдывает задержку?

Зависит. Использование Thompson sampling для MAB дает вам логарифмические границы ожидаемых потерь, что означает, что он исследует варианты, не оставляя много ценности на столе. Это утверждение остается доказуемым независимо от того, реализовано ли оно вашей внутренней командой или поставщиком. С другой стороны, ваша внутренняя команда ближе к вашим данным, и взятие такого случая использования внутринними силами означает, что вы найдете достаточно ценных сигналов в этих данных, чтобы превзойти продукт поставщика. И, возможно, ваша команда сможет внести доменные знания, которых нет в готовом решении, что даст вам ценное преимущество. Наконец, рассмотрите стоимость возможностей вашей внутренней команды: есть ли у них другой высоко ценный проект, над которым они могли бы работать? Если да, один из вариантов – протестировать поставщика, работать над другим проектом и переоценить результаты поставщика, когда они станут измеримыми.

Мы заканчиваем этот этап, когда у нас есть:

  • Проанализированные возможности из предыдущего шага и для каждой из них ответили на вопрос: “Можем ли мы купить это?”
  • Для каждого возможного решения ответили на вопрос, есть ли у нас уникальное известное или гипотетическое преимущество внутри
  • Для каждой области, в которой необходимо принимать реальные компромиссы, проведен анализ компромиссов

Определив стратегические конкурентные преимущества нашей внутренней команды, мы теперь учтем наши внутренние процессы, инструменты и возможности для работы с данными.

Постройте процессы вокруг фабрики знаний, инструментов и цепочки поставки данных

Я обсуждал вопрос времени на задачу с множеством опытных ученых-данных, и каждый из них ссылается на обнаружение, обработку, очистку и перемещение (в подходящую вычислительную среду) данных как основную часть времени, затраченного на работу. Как пишут другие авторы McKinsey о AutoML и стратегии набора AI-специалистов, “Многие организации обнаружили, что 60-80 процентов времени ученого-данных тратится на подготовку данных для моделирования. После построения первоначальной модели только малая доля времени – 4 процента, по некоторым анализам – тратится на тестирование и настройку кода”. Это не то, что привлекает большинство из нас. В наших умах это стоимость, которую мы платим за радость построения моделей с влиянием. Поэтому мы часто говорим о “основах”, которые требуются ученым-данных для успешной работы. По моему опыту, такое понимание может быстро помешать нам, и я предлагаю нам думать о себе как о фабрике моделей, подчиненной ограничениям инструментов и сложной, часто проблематичной, цепочке поставки данных.

Признание: Я никогда не верил этим «основам», когда речь идёт о платформах.

«Платформы данных и машинного обучения являются основой успешного машинного обучения», – гласит выделенное утверждение во множестве презентаций и белых книг. «И без крепкого фундамента», – заключает какой-нибудь консультант, отцовски, – «все рушится».

Однако вот загвоздка: очень мало чего «рушится» без машинного обучения. Построите дом на плохом фундаменте, и ваш гараж может обвалиться, и вы вместе с ним. Запустите проект машинного обучения без использования разработанных данных и платформ машинного обучения, и ваша модель будет … строиться дольше. И без этой новой замечательной модели машинного обучения, вероятно, ваш бизнес будет продолжаться так же, как и раньше, хотя и без некоторого конкурентного преимущества, которое машинное обучение стремится предоставить. Но продолжение существования в среднестатистической медиокритичности – это не конец света.

И вот где я теряюсь в этой клише. Оно пытается запугать руководителей, чтобы они финансировали усилия по созданию платформ – ценных, стоит подчеркнуть – будто мир закончится без них, но это не так. Мы кричим, что небо падает, а когда заинтересованный сторонник сталкивается с привычным дождем, мы теряем доверие.

Тем не менее, я думаю, что компании с сильными возможностями машинного обучения будут превосходить конкурентов, которые этого не делают – я прекрасно понимаю, что моя карьера в качестве ведущего моделирования именно такая ставка – и современные возможности по работе с данными и MLOps могут значительно сократить время выхода на рынок возможностей искусственного интеллекта. Рассмотрим этот отрывок из доклада McKinsey «Масштабирование искусственного интеллекта, как собственника технологии: роль генерального директора», с моим упором:

Мы часто слышим от руководителей, что перевод решений на базе искусственного интеллекта от идеи к реализации занимает девять месяцев и более, что затрудняет следить за изменяющейся динамикой рынка. Даже после многолетних инвестиций руководители часто говорят нам, что их организации не движутся быстрее. В отличие от этого, компании, применяющие MLOps, могут перейти от идеи к живому решению всего за две-двенадцать недель без увеличения штата или технического долга, сокращая время до получения ценности и освобождая команды для более быстрого масштабирования искусственного интеллекта.

Ваша стратегия науки о данных должна учитывать организационные и инструментальные ограничения, и принимать моделирование, которое порождает модели или единицы знаний, которые можно использовать в этих ограничениях. То есть, проекты моделирования всегда должны иметь:

  1. Ясную видимость минимально необходимых данных для моделирования. Ваша команда науки о данных должна знать, где находятся исходные данные и иметь примерное представление о том, как их следует преобразовывать.
  2. Простой и реалистичный путь к получению реальной ценности. Как вы получите живую модель с достаточной производительностью или иначе примените результаты модели?

Компании в начальной стадии или команды, полностью свободные в выборе архитектуры и инструментов, хорошо подготовлены для принятия современной практики MLOps, что облегчит быстрое создание прототипов, развертывание и мониторинг моделей для оценки их воздействия в реальном мире. Команды, работающие рядом или внутри долговечных технологий, могут обнаружить, что они не были разработаны с учётом интеграции машинного обучения и что развертывание требует значительных усилий. Компании в сильно регулируемых отраслях, вероятно, обнаружат, что многие приложения требуют высокого уровня объяснимости и контроля риска.

Ни одна из этих проблем не является непреодолимой. Мы просто должны быть принципиальными и искусными в отношении временных последствий и встраивать это в наше принятие решений.

Мы заканчиваем этот этап, когда:

  • Изучены наши планируемые варианты использования для определения пути к данным для каждого из них, чтобы начать
  • Определен путь каждого варианта использования к реализации ценности, если он преуспеет
  • Учтены эти факторы в нашем ожидаемом инвестировании и скорректированы с первого шага
  • Уточнено наше приоритетное положение с учетом всех изменений, которые мы обнаружили

Определив наши идеи о том, где следует применять науку о данных, мы рассмотрим рабочие модели для обеспечения согласованности.

Архитектура и организация: структурируйте свою организацию для устойчивого успеха

Писано определяет архитектуру как «набор решений о том, как организовано ИИС и структурировано организационно и географически». При проектировании здесь принимаются обдуманные решения о том, как интегрировать наших специалистов по науке о данных с бизнес-подразделением. Они полностью централизованы с официальной системой приема? Они подчиняются различным бизнес-подразделениям? Централизованы и встроены? Структуры отчетности и полномочий принятия решений могут не находиться под вашим контролем, особенно если вам поручено разработать стратегию для подразделения с определенными линиями отчетности. Но если эти вопросы обсуждаются, вот несколько вещей, которые следует учесть, чтобы максимизировать ценность результатов DS.

Будут ли ваши специалисты по науке о данных должным образом поддержаны и оценены? Рассмотрите поток молодых специалистов по науке о данных. Специалисты по науке о данных присоединяются к этой отрасли из различных количественных областей, обычно смешанными теоретическими и практическими навыками. Обычно выпускник магистратуры проводит эти формативные годы, развивая навыки и понимание и демонстрируя это понимание экспертам в своей области. Обычно это не включает обилие обучения по коммуникации технических результатов для неспециалистов.

Сравните это с опытом, который они получат в бизнес-среде, где у них, вероятно, будет меньше знаний в области и больше знаний в методах. Им будут предложены техники, которые мало кто вне их функции понимает. Их проекты будут неизбежно содержать больше неопределенности, чем стандартные программные разработки. Их успех будет зависеть от гораздо большего количества факторов, многие из которых вне контроля ученого-аналитика, и у них будет очень мало опыта формулирования требований для максимизации шансов на успех. Объедините все это вместе, и мы начинаем видеть появление ситуации, когда их бросают в глубокую воду.

Это может представлять вызовы для других функциональных лидеров во время их первого опыта в руководстве командами по анализу данных. Этот урок из статьи McKinsey “Стратегия исследований и разработок для современности” также относится и к нашей сфере:

Организации обычно предпочитают “безопасные” проекты с ближайшими краткосрочными результатами – такие, которые возникают на основе запросов клиентов – которые во многих случаях не делают ничего, кроме поддержания существующей доли рынка. К примеру, одна компания потребительских товаров разделила бюджет на исследования и разработки между своими бизнес-подразделениями, и их руководители использовали деньги для достижения своих краткосрочных целей, а не долгосрочных целей роста и дифференциации компании.

В нашей сфере это обычно проявляется в том, что начинающих ученых-аналитиков просят их непрофессиональные руководители написать любой SQL-запрос, который ответит на текущий вопрос(ы) дня. Это обычно полезно, но обычно не является тем значимым вкладом, которого предприятие хочет добиться, нанимая опытных моделировщиков.

Эта проблема намного легче решается, когда у вас есть лидеры, которые раньше управляли проектами по анализу данных или машинному обучению. Независимо от функции, успех зависит от наличия людей, которые могут выслушать проблему, определить аналитический и моделирующий подходы для ее решения, и управлять рисками и неопределенностью. Многие начинающие ученые-аналитики процветают в таких ситуациях. По моему опыту, они являются исключением с даром к общению и работе с неопределенностью. Мне посчастливилось случайно нанять нескольких таких – привет, Жию! Рассчитывайте на свою способность отбирать и конкурировать за такие таланты, на свой страх и риск.

Все это кажется аргументом в пользу централизации функции анализа данных. Это один из подходов, и это приводит нас к следующему важному вопросу.

Будут ли ваши ученые-аналитики достаточно близко связаны с бизнесом, чтобы сосредоточиться на правильных проблемах? Центральная группа по анализу данных, скорее всего, получит меньше информации о бизнес-проблемах, которые вы хотели бы решить, по сравнению с гиперлокальными командами, которые подчиняются непосредственно бизнес-команде. Большие, монолитные функциональные команды с формальными процедурами могут испытывать трудности в получении необходимого вклада от бизнеса, в основном потому, что многие заинтересованные стороны не совсем уверены, что спрашивать. Если вы слышали одну-две ужасные истории о том, как команды по анализу данных создают “научные проекты, о которых никто не просил”, то часто это является одной из причин. И снова, устойчивость к стереотипам не поможет: это редко связано с тем, что команда по анализу данных имеет слишком академическую направленность, и гораздо чаще из-за того, что две разные функции не знают, как общаться на общем языке.

Какие варианты остаются у нас? Это одна из причин, по которой в моем опыте хорошо работали внедренные модели. В этом подходе ваша команда по анализу данных получает доступ ко всем форумам, где обычно обсуждаются бизнес-проблемы. Они отвечают за использование этой возможности для понимания проблем, которые хочет решить бизнес-команда, и предлагают подходы, которые могут добавить ценности. Они подчиняются руководителям группы анализа данных, которые обеспечивают выполнение методологически верной работы, поддерживают их в получении необходимого для успешных проектов и менторят их рост.

Иногда проекты по анализу данных завершаются неудачей из-за некачественной методологии, а часто они проваливаются из-за недостаточной полезности предсказательных характеристик. Отличить одно от другого может быть очень сложно для человека, не связанного с количественной функцией.

Мы закончили этот шаг, когда у нас есть:

  • Определенные четкие способы коммуникации области деятельности ученых-аналитиков или команд
  • Определенные модели взаимодействия

Как и во всех практических решениях, здесь есть компромиссы везде и нету универсального решения. Полностью автономные местные команды максимизируют фокус на различных местных результатов. Централизованная функция минимизирует дублирование с повышенным риском отклонения от практичных и значимых результатов.

Отойдите, общайтесь и в целом итерируйте

Давайте рассмотрим, что мы уже сделали:

  1. Определили стратегическую гипотезу, большую ставку на то, как мы сможем добавить ценность с помощью анализа данных и машинного обучения.
  2. Определили целевой портфель, который соответствует нашей организационной аппетитности к риску, учитывает ваши процессуальные и технические ограничения и фокусирует нашу команду на проблемах, которые нельзя решить деньгами.
  3. Отфильтровали наши использования на основе доступа к данным и того, как они принесут ценность.
  4. Возможно, разработали процедуры репортинга и методы начального поиска проектов, которые поддерживают ваших ученых-аналитиков и фокусируют их таланты на их уникальных преимуществах.

Проще говоря, мы определили критерии для поиска наших правильных сценариев использования и отфильтровали возможности для использования сценариев, чтобы найти первый правильный набор.

Следующие шаги:

  1. Отойдите в сторону и взгляните на все вместе. Рассмотрено в целом, это имеет смысл?
  2. Сообщите эту стратегию и начальный план, вытекающий из нее.
  3. Сообщите, как заинтересованные стороны могут взаимодействовать с вашей функциональной командой.
  4. Итерируйте: Пересмотрите свою стратегию, когда изменяются предположения или обстоятельства, приведшие к ней, и обязуйтесь периодически просматривать, как изменились обстоятельства.

В заключение, этот процесс требует значительных усилий. Но он приносит большую награду. Эта стратегия обеспечит ясное формулирование рисков, которые вы хотите принять, как вы будете их управлять и как они будут поддерживать ваши целевые результаты, если они оправдают себя. Четкое соответствие цели и легкость поддержания деятельности, соответствующей этой цели, – это невероятно мощный инструмент для функциональной команды. Обеспечьте это, и результаты последуют.

Ссылки

  • Brenna et al, «Построение стратегии ИОТ для современности»
  • Corbo et al, «Масштабирование ИИ как технологического новатора: роль генерального директора»
  • Kiechel, Walter. “Повелители стратегии: Тайная интеллектуальная история нового корпоративного мира” (Партнерская ссылка.)
  • Meakin, et al, «Победа с помощью искусственного интеллекта – это состояние ума»
  • Pisano, Gary P. “Создание стратегии ИОТ”
  • Rasiel, Ethan. “Путь МакКинзи” (Партнерская ссылка.)
  • Scully et al, «Машинное обучение: кредитная карта высоких процентов технического долга»