Архетипы роли специалиста по обработке данных

Архетипы роли специалиста по обработке данных' -> 'Архетипы специалиста по обработке данных

Роли в области науки о данных могут быть очень разными, и объявления о вакансиях не всегда ясны. Какую шапку вы хотите надеть?

Фото Clem Onojeghuo на Unsplash

После положительных отзывов о моей недавней статье в Towards Data Science о инженерах машинного обучения, я подумал, что напишу немного о том, какие категории ролей для практиков науки о данных существуют на рынке труда. В то время как я ранее говорил о кандидатах, например, о том, какие ожидания и реальности могут быть в их квалификации, сегодня я хочу поговорить о том, чем на самом деле занимается работник в этой области каждый день.

Это означает, что я хочу рассказать о том, чем на самом деле занимаются специалисты по науке о данных, вне зависимости от того, признают ли они это или нет. Я расскажу о том, чем на самом деле занимается эта работа, в отличие от того, что может быть указано в описании вакансии, и в какой области бизнеса (приблизительно) вы можете находиться.

Почему это важно?

Ученые-данные, ищущие работу, независимо от того, на какой стадии карьеры мы находимся, должны уметь читать между строк при просмотре объявлений и описаний вакансий. В описании работы будет много пустой болтовни и эвфемизмов, и сложно понять, какой на самом деле будет работа каждый день и какие навыки вам понадобятся для успеха.

Также важно знать, как будут выглядеть задачи, чтобы понять, хотите ли вы тратить на это свое время! Вероятно, вам нравится определенная область науки о данных больше, чем другие, и есть вещи, в которых вы хотите углубиться или узнать больше. Если вы окажетесь в неподходящей роли, ваша карьера может двигаться в неправильном направлении.

Я хочу, чтобы этот материал помог вам прочитать между строками объявлений о вакансиях и узнать, чем на самом деле будет заниматься работа, прежде чем тратить время на подачу заявки и прохождение собеседования. Также важно знать, читая между строками, будет ли роль, на которую рекламируется вакансия, действительно возможна для одного человека. Как я объясню позже, иногда компании пытаются нанять одного ученого-данных, чтобы он выполнял множество задач, и это неустойчиво и неприятно для человека, который получает эту роль.

Ученые-данные, ищущие работу, независимо от того, на какой стадии карьеры мы находимся, должны уметь читать между строк при просмотре объявлений и описаний вакансий. … Если вы окажетесь в неподходящей роли, ваша карьера может двигаться в неправильном направлении.

Предостережения

Прежде чем продолжить, у меня есть несколько предупреждений/замечаний для читателя.

  • Я провел большую часть своей карьеры в небольших технологических компаниях размером от VoAGI до очень маленьких, и у меня нет личного опыта работы в крупных технологических компаниях. Я проконсультировался со своими друзьями, у которых есть такой опыт, чтобы получить их отзывы на эту тему, поэтому я надеюсь, что мои обобщения более или менее применимы везде. Я, возможно, ошибаюсь.
  • Все это обобщения. Хотя я думаю, что эти идеи верны, здесь есть шутки. Пожалуйста, не воспринимайте все абсолютно всерьез, но поймите, что я немного подшучиваю над нашей странной областью.
  • Я еще раз упомяну это позже, но помните, что это архетипы, а не “точный текст описания работы”. Архетипы полезны для группировки вещей, но в реальной жизни могут быть исключения, смешения и другие крайние случаи.

Теперь давайте начнем и поговорим о типах ученых-данных!

Аналитический гуру

Я начинаю с самой недооцененной и недооцениваемой роли – аналитика. Ваша задача – помочь компании понять, достигает ли она своих целей и работает ли все так, как должно быть. Это невероятно важно и очень неопределенно и сложно на самом деле выполнить. Вашей ежедневной работой может быть множество вещей, таких как создание панелей управления, анализ таких вещей, как продажи и успех продукта, а также изучение внутренней производительности (например, текучести кадров и т.д.). Некоторые люди будут считать, что ваша работа заключается только в том, чтобы “сделать мне панель управления”, но даже если вы занимаетесь созданием панелей управления, вы будете проводить много времени, думая о том, что должно быть измерено на панели управления, стоит ли ее вообще создавать и как можно рассчитать метрики, которые действительно будут соответствовать целям.

В предыдущем десятилетии вас могли называть такими вещами, как аналитик операций или специалист по бизнес-аналитике (или иногда вас всё ещё так называют). Вам приходится обрабатывать много странных данных из странных источников, и вы также используете МНОГО SQL. Вы не будете делать много машинного обучения, если только это не связано с обработкой естественного языка (NLP) на основе отзывов. Если вы анализируете эффективность продукта, вам придется много проводить A/B-тестирование. Вы можете находиться в отделе маркетинга или в отдельном аналитическом отделе, но все сотрудники из разных частей компании, вероятно, будут требовать от вас “цифр” для разных вещей.

Строитель функций

С другой стороны, ваша задача – улучшать продукт, по возможности, с применением некой магии данных/машинного обучения. Ваши руководители, скорее всего, хотят иметь возможность сказать, что ваш продукт содержит искусственный интеллект, даже если у вас просто есть рекомендательный движок, предлагающий советы в продукте или сортирующий результаты поиска. Если вам повезет, вы можете создавать инновационные функции и добавлять интересные возможности в продукт, но если вы не справляетесь с началом с пустого листа и неясным заданием, это может не быть подходящим местом для вас.

Вам нужно узнать о клиентах и отрасли, чтобы создавать полезные вещи, а не только крутые. Вы должны слушать то, что говорят клиенты, и общаться с отделами, которые имеют дело с клиентами, но часто люди в этой роли этого не делают. (Это неправильный выбор.) Вы можете проводить своё собственное A/B-тестирование, или это может быть обязанностью “гуру аналитики”. Вам определенно нужен “гуру аналитики” (или частичное перекрытие с ними), когда дело доходит до оценки того, насколько хорошо работает то, что вы создали. Вы работаете на Python. Вы, вероятно, находитесь в отделе продукта, но много общаетесь с инженерами.

Строитель инфраструктуры

Отчасти связано с предыдущим пунктом, я думаю, что эту роль лучше называть инженером по машинному обучению – вам будет предложено создать системы, которые внедряют новую модель и внедряют её в продукт, чтобы результаты поиска были упорядочены по релевантности или новый виджет был предложен соответствующим людям и так далее. Иногда вам придется вмешиваться в саму модель, но не так часто (если она не сломается, и вам позвонят – вы наиболее вероятный тип данных ученых, который работает поочередно в дежурном режиме). Масштабирование и параллелизация будут важны для вас, и вам нужно развить глубокую страсть к задержкам и лагам, так что привыкайте к этому.

Ваш ежедневный набор инструментов включает Docker, язык, на котором написан продукт, и Python, потому что вы берете всё, что создает “строитель функций”, и встраиваете это в продукт. Какой-то инструмент для наблюдаемости также находится в вашем списке закладок. Вы, вероятно, находитесь в инженерном отделе или, возможно, в отделе разработки программного обеспечения.

Только для внутреннего использования

Это не так распространено, пока вы не попадете в крупные компании, но вы – человек, который создает инструменты машинного обучения для других внутренних отделов вашей компании. Это не так сильно отличается от роли “строителя функций”, за исключением того, что модели, которые вы создаете, используются только внутри вашей компании для улучшения работы. Ваши клиенты – это другие сотрудники вашей компании, а не внешние люди, которые платят вашей компании деньги за товары/услуги. В результате вам не нужно знать так много о внешних клиентах, но вы будете хорошо знать организационную структуру компании.

Чтобы преуспеть, вы должны выяснить, с какими раздражающими повторяющимися задачами сталкиваются ваши коллеги, и автоматизировать их или обучить модель делать это вместо них. Если вы сделаете это, вас полюбят. Иногда то, что вы создаете, может стать открытым исходным кодом и в конечном итоге может превратиться в продукты, такие как Airflow или H3. Вы, вероятно, находитесь в инженерном отделе.

Исследователь

Редкий вид, вас нанимают для чистого исследования. Возможно, вы будете писать научные статьи и повышать репутацию вашей компании, или что-то в этом роде, но от вас не ожидают, что эта роль будет оправдывать свои затраты. Эта роль, вероятно, входит в специальные проекты CEO или что-то в этом роде. Вам будут предлагаться идеи, которые кто-то прочитал в Интернете и которые кажутся интересными, и вас попросят выяснить, о чем это все и как ваша компания может сделать что-то в этой области. Вас упоминают во всех беседах в Slack о LLM. Это единственная роль из всех описанных, в которой, возможно, оправдан поиск человека с докторской степенью.

Инженер по решениям

Вместо того, чтобы создавать функции науки о данных для вашей компании, вы будете создавать их для ваших клиентов. Это включает консалтинговые работы по науке о данных, хотя компании, которые создают и продают программное обеспечение, связанное с наукой о данных, также являются местами, где часто встречается эта роль. Если вашим клиентам нужны специализированные специалисты DS/ML, чтобы максимально использовать ваш продукт, то, вероятно, в компании будут такие роли.

Ожидается, что вас привлекут к звонкам клиентов, когда они пытаются продать кому-то элементы вашего продукта или услуги, связанные с искусственным интеллектом, потому что продажи не могут комфортно отвечать на технические вопросы. У вас есть довольно разнообразные навыки в области технологического стека, потому что ваши клиенты могут предоставить вам самые разные странные вещи, с которыми вам придется работать или строить, что на самом деле может быть очень интересно. Вам нужно понимать отрасль, как The Feature Builder, и у вас должны быть умение быть профессиональным и терпеливым с клиентами. Поскольку вы проводите время взаимодействуя с клиентами, вы можете работать в отделе успеха клиента или отделе продаж.

И, наконец, мы подходим к…

The Everything to Everyone

Это роль, которая, кажется, объединяет разные элементы всех этих работ, часто в нерегулярной форме, и либо менеджер по найму не понимает, что это три или четыре работы, либо они надеются убедить кого-то сделать все это за одну зарплату. За то, что вам будет предложено делать, зарплата, вероятно, будет слишком низкой. Это типично для организаций, у которых нет существующей функции анализа данных искусственного интеллекта и которые нанимают своего первого специалиста по анализу данных. Это может быть возможностью многое узнать, но вероятно, в окружении не будет более технически подкованных людей, чтобы обучить вас, поэтому ваши навыки поиска в Google/StackOverflow/других ресурсах должны быть на высоком уровне. Если вам не нравится самостоятельное изучение нового материала, эта роль может быть сложной и изолированной. Как сказал мне один мой друг: “Вы будете лучшим в компании в том, что делаете, но это не означает, что вы хороши в этих вещах”. Из-за отсутствия наставничества/помощи от коллег сгорание на работе является реальным риском.

Но на самом деле…

Чтобы быть ясным, большинство вакансий по анализу данных/машинному обучению будут содержать элементы, возможно, двух из этих ролей или более. Помните, что я говорил вам выше, что это архетипы, а не “описания моей работы”. (Буквально, моя собственная работа не подходит только под одну из этих категорий.)

Чтобы быть ясным, большинство вакансий по анализу данных/машинному обучению будут содержать элементы, возможно, двух из этих ролей или более.

Примеры двойного разделения:

  • Ученый-аналитик продукта: Гуру анализа данных в сочетании с The Feature Builder. Создавайте функции, проводите собственный анализ, а также анализируйте другие функции/вещи, которые создаются другими.
  • Полностековый ученый-аналитик по машинному обучению: The Feature Builder и The Infra Builder. Вы создаете модель, а также инфраструктуру для предоставления этой модели миру.

Если вы объединяете три или более разных архетипа в одной роли, я бы сказал, что это слишком разбросанно. Один человек не может успешно быть Гуру аналитики данных, The Feature Builder и The Infra Builder, например, это просто слишком много задач для одного человека. Чем меньше компания, тем больше вероятность того, что вам придется надеть дополнительные шляпы, но поймите, что это разные функции, и вы можете разделяться слишком тонко.

Еще несколько замечаний перед тем, как мы закончим

Я думаю, что по мере роста вашей карьеры в области анализа данных/машинного обучения вы будете брать на себя больше ролей, и границы “что я делаю” становятся неясными и размытыми. Вы развиваете экспертизу и опыт, которые могут быть полезны во многих разных частях бизнеса, и люди будут обращаться к вам, чтобы получить ваше мнение по разным вопросам.

Кроме того, я не говорил о стратегии или планировании нигде в этом тексте, но с увеличением вашего старшинства вы будете более вовлечены во все эти вещи. Даже как исполнитель собственного дела, ваш опыт имеет ценность – вы, вероятно, уже видели что-то подобное тому, что сейчас рассматривает своей идеей или проблемой. Вы должны давать свое мнение о том, как решать это, даже если люди, находящиеся во власти, идут другим путем. Это просто часть работы на более высоких уровнях.

Я не говорил о стратегии или планировании нигде в этом тексте, но с увеличением вашего старшинства вы будете более вовлечены во все эти вещи.

Я надеюсь, что это поможет людям, находящимся на рынке труда или студентам, которые только начинают свою карьеру в этой области, иметь более четкое представление о том, во что они вовлекаются. Если вы найдете очень явный пример The Everything to Everyone на рынке труда, на сайте вакансий, отправьте его мне или разместите ссылку в комментарии здесь. Может быть, я смогу написать пост в будущем о худших примерах и проанализировать их для нашего всех развлечения!

Вы можете найти больше моих работ на www.stephaniekirmer.com.