7 причин, почему не стоит становиться дата-ученым

7 причин, почему не стоит становиться дата-ученым и что делать вместо этого

 

Вы мечтаете стать специалистом по обработке данных? Если да, то, скорее всего, вы видели или слышали о многих, кто успешно переквалифицировался в сферу науки о данных. И вы тоже надеетесь совершить такой переход в будущем.

В работе специалиста по обработке данных есть несколько увлекательных моментов. Вам позволяется:

  • Развивать навыки, которые применимы в различных областях
  • Рассказывать истории с помощью данных
  • Отвечать на бизнес-вопросы с помощью данных
  • Разрабатывать эффективные решения для бизнес-задач

И это далеко не все. Но несмотря на то, что все это звучит интересно, работа специалиста по обработке данных также является сложной, если не более. Но какие же вызовы она представляет?

Давайте разберемся.

 

1. Вам нравится работать в изоляции

 

Когда вы развиваете свои навыки программирования и технические навыки, вы, вероятно, привыкаете к работе в одиночку. Но как специалисту по обработке данных вы должны приоритетом ставить сотрудничество и коммуникацию. Потому что наука о данных не ограничивается только обработкой данных и анализом чисел в изоляции.

Вам необходимо сотрудничать с другими специалистами – не только из вашей команды, но и из других команд. Ваша способность сотрудничать с различными командами и заинтересованными лицами так же важна, как ваши технические навыки.

Кроме того, вам также нужно уметь объяснять свои выводы и идеи неспециалистам, включая бизнес-лидеров.

Ниша Арья Ахмед, специалист по обработке данных и технический писатель, рассказывает:

 

“В команде по обработке данных вы будете сотрудничать с другими специалистами в области обработки данных при выполнении каждой задачи, определять их ответственность и понимать, как все взаимосвязано. Это важно, поскольку вы не хотите проделывать работу, которая уже была выполнена ранее, и тратить больше времени и ресурсов. Кроме того, с коллегами по обработке данных вы не будете единственными людьми, с кем вам придется сотрудничать. Вы станете частью команды, включающей продуктовый менеджмент, маркетинг и других заинтересованных сторон.”

– Ниша Арья Ахмед, специалист по обработке данных и технический писатель

 

2. Вы хотите на самом деле “завершать” проекты

 

Если вы любите работать над проектами, завершать их и выводить их в производство, то работа специалиста по обработке данных может быть неудовлетворительной для вас.

Хотя вы начинаете проект с определенными целями, которые вы совершенствуете на протяжении всего процесса работы, вам часто придется изменять характер проекта в соответствии с изменениями бизнес-целей организации. Возможно, заинтересованные лица увидят новое перспективное направление.

Таким образом, вам придется эффективно изменять приоритеты и модифицировать характер проектов. В худшем случае, вам может потребоваться отказаться от вашего проекта.

Кроме того, на старте стартапа вам часто приходится быть многогранным. Так что ваша работа не заканчивается созданием модели машинного обучения. Даже если вы смогли развернуть модель машинного обучения в производстве, вам придется отслеживать ее производительность, следить за изменениями данных, возвращаться к анализу и переобучению модели при необходимости.

Абид Али Аван, писатель, редактор и специалист по обработке данных в VoAGI, рассказывает:

 

“Если вы работаете в компании, вам часто приходится переключаться между несколькими командами и работать над разными проектами одновременно. Однако большинство проектов, над которыми вы работаете, могут даже не попасть в производство. 

Потому что приоритеты компании могут измениться или воздействие проектов может быть недостаточно значимым. Постоянное переключение между командами и проектами может быть изнурительным, и вы можете чувствовать себя бесполезным в своем вкладе.”

– Абид Али Аван, писатель, редактор и специалист по обработке данных в VoAGI

 

Таким образом, работа над проектами в области науки о данных не является линейным процессом от начала до конца, где вы заканчиваете один проект и переходите к следующему. 

 

3. Вас раздражает неопределенность роли

 

Один день из жизни специалиста по обработке данных в двух разных организациях может быть совершенно разным. Роли специалиста по обработке данных, инженера машинного обучения и инженера MLOps часто имеют много общих функций.

Предположим, вы являетесь специалистом по обработке данных, который очень заинтересован в создании прогностических моделей, и вы получили роль специалиста по обработке данных в организации, которая вас интересует.

Тем не менее, не удивляйтесь, если вы проводите весь день, считая числа в электронных таблицах и составлять отчеты. Или извлекаете данные из баз данных с помощью SQL. Вы можете подумать, что преобразование данных с помощью SQL и поиск ответов на бизнес-вопросы лучше подойдет роли аналитика данных.

В то же время в некоторых случаях вам может быть поручено создание и развертывание моделей в производственной среде, отслеживание изменений и повторное обучение модели по мере необходимости. В этом случае вы являетесь специалистом по обработке данных, который также занимает должность инженера MLOps.

Узнаем, что Абид думает о гибкости роли в карьере, связанной с данными:

 

«Я всегда смущен, когда меня называют «специалистом по обработке данных». Что это вообще значит? Я являюсь аналитиком данных, инженером бизнес-интеллекта, инженером машинного обучения, инженером MLOps или все вышеперечисленное одновременно? Ваша роль внутри компании является гибкой, если вы работаете в небольшой компании или стартапе. Однако в крупных организациях могут быть более четкие различия между ролями. Но это не гарантирует, что роль полностью определена. Вы можете быть специалистом по обработке данных, но большая часть работы, которую вы будете делать, возможно, связана с составлением отчетов, соответствующих бизнес-целям».

– Абид Али Аван, писатель, редактор и специалист по обработке данных в VoAGI

 

4. Вам безразличны бизнес-цели

 

В качестве специалиста по обработке данных вы должны направлять свои усилия на проекты, которые имеют наибольшее влияние на бизнес, а не на технически интересные, но менее связанные с бизнесом проекты. Для этого понимание бизнес-целей является ключевым по следующим причинам:

  • Понимание бизнес-целей позволяет вам адаптироваться и изменять приоритеты своих проектов в соответствии с изменяющимися потребностями организации.
  • Успех проекта по обработке данных часто измеряется его влиянием на бизнес. Поэтому хорошее понимание бизнес-целей создает четкую рамку для оценки успеха проекта, связывая технические аспекты с конкретными бизнес-результатами.

Мэттью Майо, главный редактор и специалист по обработке данных в VoAGI, делится ценой безразличия к бизнес-результатам:

 

«В качестве специалиста по обработке данных, если вам безразличны бизнес-цели, то можете также преследовать точку лазером, как кошка – вы будете активны и бесцельны, вероятно, не достигая ничего ценного. Понимание бизнес-целей и умение переводить их с языка бизнеса на язык данных – это ключевые навыки, без которых вы можете потратить время на создание самых сложных, но незначительных моделей. Принятие решений, которое работает, превосходит современные неудачи каждый день!»

– Мэттью Майо, главный редактор и специалист по обработке данных в VoAGI

 

Вот что Ниша говорит об этом:

 

«Во всем, что вы делаете, вам нужна причина. Это ваша цель, которая идет перед вашим действием. Когда дело доходит до данных, понимание бизнеса и проблем является необходимым. Без этого вы будете просто запутываться в процессе. С каждым шагом в проекте по обработке данных вы захотите обратиться к целям, которые мотивируют проект».

– Ниша Арья Ахмед, специалист по обработке данных и технический писатель

 

Таким образом, наука о данных не сводится только к обработке чисел и созданию сложных моделей. Это скорее использование данных для достижения бизнес-успеха.

Без четкого понимания бизнес-целей ваши проекты могут отклоняться от решаемых ими бизнес-проблем, что уменьшит их ценность и влияние.

 

5. Вам не нравится “скучная” работа

 

Построение моделей увлекательно. Однако, дорога, ведущая к этому, может быть не столь интересной.

Вы можете ожидать, что большую часть своего времени вы будете тратить на:

  • Сбор данных
  • Определение наиболее актуального поднабора данных для использования
  • Очистка данных для подготовки их к анализу

Теперь это не суперинтересная работа. Часто вам даже не нужно создавать модели машинного обучения. После того, как вы получите данные в базе данных, вы можете использовать SQL для получения ответов на вопросы. В этом случае вам даже не нужно создавать модель машинного обучения.

Вот что Абид говорит о том, как важная работа часто бывает неинтересной:

 

«Иногда повторять одно и то же может быть утомительно. Часто вам может быть поручена задача по очистке данных, которая может быть довольно сложной, особенно при работе с разнообразными наборами данных. Кроме того, задачи, такие как проверка данных и написание модульных тестов, могут быть не такими увлекательными, но они необходимы.»

– Абид Али Аван, писатель, редактор и ученый в области данных в VoAGI

 

Так что чтобы иметь успешную карьеру в области науки о данных, вам нужно получать удовольствие от работы с данными — включая хорошие, плохие и ужасные, потому что наука о данных заключается в извлечении ценности из данных. Что часто не связано с созданием самых модных моделей.

 

6. Вы хотите прекратить обучение в какой-то момент

 

Как ученый в области данных, вы, вероятно, никогда не сможете достичь точки, где вы сможете сказать, что вы всё выучили. Что вам нужно учиться и насколько это зависит от того, над чем вы работаете.

Это может быть довольно простая задача, например, изучение и использование новой программной платформы. Или что-то более трудоемкое, например, миграция существующего кодовой базы на язык Rust для повышения безопасности и производительности. Кроме того, помимо технической подготовки, вам следует быть готовым быстро осваивать новые программные платформы, инструменты и языки программирования по мере необходимости.

Кроме того, вы должны быть готовы узнать больше о сфере деятельности и бизнесе, если это требуется. Очень маловероятно, что вы будете работать в одной сфере в течение всей своей карьеры в области науки о данных. Например, вы можете начать работать ученым в области здравоохранения, затем перейти в финансовую технологию, логистику и т.д.

Во время учебы в аспирантуре, мне выпала возможность работать над машинным обучением в здравоохранении — над проектом прогнозирования заболевания. Я никогда не изучала биологию после школы. Поэтому первые несколько недель ушли на изучение особенностей конкретных биомедицинских сигналов — их свойств, характеристик и многое другое. Это было совершенно важно, прежде чем я могу приступить к предварительной обработке записей.

Канвал Мехрин, технический писатель, делится своим опытом с нами:

 

“Вы знаете тот момент, когда вы, наконец, овладеваете новым навыком и думаете: “Ах, вот это, я мастер”? Что ж, в науке о данных этот момент никогда не наступает. Эта область постоянно эволюционирует, появляются новые технологии, инструменты и методологии. Поэтому, если вы предпочитаете дойти до определенной точки, где учение занимает второстепенное место, то карьера в области науки о данных может оказаться не самым лучшим выбором.

Более того, наука о данных — это прекрасное сочетание статистики, программирования, машинного обучения и знаний в определенной области. Если идея исследования разных сфер, от здравоохранения до финансов и маркетинга, не вдохновляет вас, вы можете потеряться в своей карьере.”

– Канвал Мехрин, технический писатель

 

Так что как ученый в области данных вы никогда не должны бояться постоянного обучения и повышения квалификации.

 

7. Вам не нравятся сложности

 

Мы уже описали несколько трудностей, с которыми сталкиваются ученые в области данных, включая:

  • Преодоление технических навыков кодирования и создания моделей
  • Понимание сферы деятельности и бизнес-целей
  • Непрерывное обучение и повышение квалификации для сохранения актуальности
  • Быть инициативным, не беспокоясь о завершении проектов в буквальном смысле
  • Готовность к изменениям, изменению приоритетов и внесению изменений
  • Выполнение работы, которая скучна, но необходима

Как и в любой другой технической роли, самое трудное не в получении работы ученого в области данных. Самое трудное — построить успешную карьеру в области науки о данных.

“`html

Mathew Mayo удачно подводит итоги того, как нужно принять эти вызовы как настоящий специалист по обработке данных:

“Ищете спокойную карьеру, где вы сможете прекратить обучение сразу после начала работы и больше не беспокоиться о последних инструментах, трюках и методиках? Забудьте о науке о данных! Ожидать спокойной карьеры в профессиональной области обработки данных – это то же самое, что ожидать спокойных прогулок под дождем, вооруженных только коктейльным зонтиком и оптимистичным настроем.

Эта область – это непрерывный американский горок технических головоломок и нетехнических загадок: один день вы погружаетесь в алгоритмы, а на следующий день вы пытаетесь объяснить свои выводы кому-то, кто считает регрессию отступлением в состояние детского поведения. Но в этих вызовах заключается волнение, и именно это делает наши с кофе зависимые мозги развлекательными.

Если вы аллергичны к вызовам, вам может быть уютнее с вязанием. Но если вы еще не отступаете перед конфликтом с данных потопом, наука о данных может быть тем самым чаем… кофе”.

– Мэтью Майо, главный редактор и специалист по обработке данных, VoAGI

Давайте послушаем мысли Канвал по этому поводу:

“Давайте столкнемся с фактом: наука о данных не всегда является гладким путешествием. Данные не всегда поступают в аккуратных и организованных пакетах. Ваши данные могут выглядеть так, будто они прошли через шторм, могут быть неполными, несогласованными, а даже неточными. Очистка и предварительная обработка этих данных, чтобы гарантировать их релевантность для анализа, может быть сложной задачей.

При работе в многопрофильной области вам может приходиться взаимодействовать с техническими неспециалистами. Объяснение им технических концепций и их соответствия с их целями может быть действительно сложным.

Таким образом, если вы предпочитаете четкую, прямую профессиональную траекторию, карьера в науке о данных может быть полна преград для вас”.

– Канвал Мехрин, технический писатель

Завершение

Итак, наука о данных – это не только математика и модели; это о том, как переходить от данных к решениям. И процессе вы всегда должны быть готовы к обучению и повышению навыков, понимать бизнес-цели и динамику рынка и многое другое.

Если вы ищете сложную карьеру, которую хотите пройти с упорством, наука о данных действительно является хорошим вариантом для вас. Счастливого исследования!

Я благодарю Мэтью, Абида, Нишу и Канвал за раздачу своих идей о различных аспектах карьеры в науке о данных. И за то, что они сделали эту статью намного более интересной и увлекательной для чтения!

[Bala Priya C](https://twitter.com/balawc27) – разработчик и технический писатель из Индии. Ей нравится работать на пересечении математики, программирования, науки о данных и создания контента. Ее интересы и экспертиза включают DevOps, науку о данных и обработку естественного языка. Она любит чтение, письмо, кодирование и кофе! В настоящее время она работает над обучением и делится своими знаниями сообществу разработчиков, создавая учебники, инструкции, мнения и многое другое.

“`