Ориентирование в названиях должностей в области науки о данных аналитик данных против ученого данных против инженера данных

Осмысление профессиональных ролей в области аналитики данных аналитик против ученого против инженера

 

Навигация кажется правильным выбором слов. Наука о данных иногда может показаться диким морем, которое приносит новое название работы или специализацию каждые несколько минут. Большое спасибо, наука о данных. Мы ценим вашу динамичность и дикость, но что с этим делать?

Давайте сначала разберемся с основами. Когда я говорю о работах в области науки о данных, я имею в виду науку о данных в широком смысле, которая включает все работы с данными. Для меня все они являются названиями должностей в области науки о данных.

Во-вторых, аналитики данных, ученые по данных и инженеры данных уже давно не новые профессии. Но они все еще вызывают некоторую путаницу в том, кто что делает. Есть некоторое перекрытие между работами, что не помогает.

Многие компании делают это еще хуже, когда у них есть команда из одного человека. Да, стартапы, я говорю о вас!

Нет, аналитик данных, ученый по данным и инженер данных – это не одна и та же работа! Кто бы мог подумать?

Хотя эти работы имеют разные области специализации и фокуса, все они работают в рамках данных команды в компании с одной целью.

 

Почему важны роли данных?

 

Каждая компания видит ценность данных и использует команду данных для их извлечения. Обычно у большинства компаний есть пять общих целей, которые они пытаются достичь.

 

1. Принятие обоснованных решений

 

Данные позволили компаниям перестать тапкать в темноте и полагаться на бизнес-интуицию принимающих решения (читай: удачу). С технологическими достижениями увеличилось разнообразие данных и возможности их использования.

Наука о данных использует данные для предоставления идей, информирующих стратегии и исполнительные решения.

 

2. Улучшение клиентского опыта

 

Компании должны ориентироваться на клиентов, потому что именно от них поступает их деньги. Наука о данных позволяет компаниям анализировать поведение и отзывы клиентов. Это позволяет бизнесу настраивать свои продукты и услуги для клиентов и предсказывать их потребности.

 

3. Операционная эффективность

 

Хотя компании хотят заработать максимум от своих клиентов, они также хотят сделать это самым эффективным способом. Прочитайте: по самой низкой стоимости возможно. Наука о данных помогает в этом. Она может автоматизировать и ускорить задачи, оптимизировать их и обнаруживать узкие места. Короче говоря, заниматься стоимостной стороной бизнеса.

 

4. Инновации и конкурентоспособность

 

Наука о данных стимулирует инновации, определяя и предсказывая потребности клиентов, тренды в отрасли, изменения в экономике и т. Д. Инновация здесь может относиться к существующим или новым продуктам, маркетинговым и продажным стратегиям и процессам производства, но это не ограничено этим.

 

5. Управление рисками

 

Бизнес – это рисковый, э-э, бизнес. Наука о данных помогает выявлять, оценивать и управлять потенциальными рисками для компании.

 

Названия должностей в области науки о данных

 

Мы не можем проанализировать различия между названиями должностей, если у нас нет четких определений для каждой. Начнем с этого. Затем мы перейдем к их обязанностям, навыкам, используемым инструментам и карьерным путям.

 

Аналитик данных

 

Краткое резюме: Аналитики данных, очевидно, анализируют данные. Они делают это, чтобы выявить закономерности и предложить практические идеи. Эти закономерности и идеи представлены в отчетах и панелях инструментов, позволяя принимающим решения принимать обоснованные решения.

Аналитики данных в основном занимаются описывающим (Что произошло?) и диагностическим (Почему это произошло?) анализом данных.

Основные обязанности:

  • Очистка данных: Подготовка данных к анализу путем стандартизации, изменения их формата и работы с дубликатами, отсутствующими значениями и несогласованными данными.
  • Анализ данных: Использование статистических методов для изучения тенденций, закономерностей и идей в данных.
  • Визуализация данных и отчетность: Передача результатов анализа данных через отчеты, визуализацию данных и панели инструментов.

Ключевые навыки и инструменты: Основные навыки и инструменты могут быть выведены из описания роли.

Карьерный путь: Аналитики данных могут переходить на более старшие должности аналитиков. С большим опытом и дополнительным образованием они могут перейти в специализированные роли, такие как статистик, бизнес-аналитик или даже ученый-аналитик данных.

Ученый-аналитик данных

Описание роли: Ученые-аналитики данных также анализируют данные, но на более продвинутом уровне. Они используют статистические модели и алгоритмы машинного обучения, чтобы определить вероятность будущих событий. Это говорит о том, что они, в отличие от аналитиков данных, занимаются прогнозирующим (Что произойдет?) и предписывающим (Что следует сделать?) анализом данных.

Ключевые обязанности:

  • Продвинутая аналитика: Использование продвинутых статистических техник для извлечения информации из данных.
  • Машинное обучение: Реализация алгоритмов машинного обучения для изучения существующих данных.
  • Прогнозирующее моделирование: Создание и внедрение моделей для прогнозирования будущих событий на основе реальных и новых данных.

Эти ключевые обязанности основаны на работе, которую выполняют аналитики данных. Ученым-аналитикам данных также необходимы очистка данных и визуализация данных.

Ключевые навыки и инструменты: Вот навыки и инструменты, необходимые для работы ученым-аналитиком данных. Вы увидите некоторое пересечение с аналитиками данных.

Карьерный путь: Ученые-аналитики данных начинают с должности стажера-ученого-аналитика данных и могут перейти на должности старших ученых-аналитиков данных, главных ученых-аналитиков данных и директоров по науке о данных. Они также могут двигаться в других направлениях, таких как специалисты по искусственному интеллекту, инженеры машинного обучения или ученые по компьютерным и информационным исследованиям.

Инженер по данным

Описание роли: Инженеры по данным создают системы сбора, хранения и транспортировки данных. Они обеспечивают доступность, качество и возможность анализа данных для всех пользователей данных.

Ключевые обязанности:

  • Архитектура данных: Создание систем данных на основе задуманного дизайна архитекторами данных.
  • Пайплайн данных: Создание системы, позволяющей данным передвигаться из нескольких источников данных в базы данных, хранилища данных и озера данных, и быть готовыми к использованию другими пользователями данных.
  • Обеспечение качества данных: Выявление ошибок и несоответствий в данных, их удаление, а также улучшение точности и надежности данных.

Да, инженеры по данным сосредоточены на этих задачах. Но и они не могут обойтись без очистки данных и визуализации данных.

Ключевые навыки и инструменты: Вот навыки и инструменты, используемые инженерами по данным.

Карьерный путь: Карьера инженеров по данным может развиваться в сторону старших инженеров по данным или архитекторов данных. Они также могут специализироваться в таких областях, как большие данные, машинное обучение или бизнес-аналитика.

Venn-диаграммы аналитиков данных, ученых-аналитиков и инженеров по данным

Мы видели различия между тремя работами. В процессе мы также заметили некоторое пересечение между работами в терминах необходимых навыков.

Для быстрого понимания этих пересечений можно использовать Venn-диаграммы.

Вы можете видеть, что общими навыками для всех трех работ являются:

  1. Кодирование
  2. Манипуляция данными
  3. Облачные вычисления
  4. Визуализация данных

Дополнительные навыки, которыми обладают оба этих профессионала, выделены.

У аналитиков данных нет навыков, уникальных только для них; другие профессии также нуждаются в этих навыках в определенной степени.

Ученые по данным обладают следующими уникальными навыками:

  1. Построение, тестирование и развертывание моделей
  2. AI

У инженеров по данным есть свои специальные навыки:

  1. Интеграция данных, ETL / ELT и обработка
  2. Хранилище данных

Теперь давайте визуализируем инструменты, используемые в этих профессиях.

На изображении показано, что все три профессии используют следующие инструменты:

  1. SQL
  2. Python
  3. Реляционные базы данных
  4. Облачные базы данных
  5. Базы данных NoSQL
  6. BI и инструменты визуализации данных

Выделены дополнительные инструменты, которыми обладают оба этих профессионала.

Инструменты, используемые аналитиками данных, также используются по крайней мере одной другой профессией. В то время как профессии могут использовать одни и те же типы инструментов, инструменты могут использоваться в разной степени или же конкретные инструменты в рамках одной категории могут отличаться.

Инструменты, уникальные для ученых по данным, включают:

  1. R
  2. Инструменты для работы с наукой о данных и машинным обучением

Инструменты, уникальные для инженеров по данным, включают:

  1. Java
  2. Scala
  3. Go
  4. Инструменты для интеграции данных, ETL / ELT и обработки
  5. Инструменты для хранилища данных

Преодоление разрыва: сотрудничество – залог успеха

Мы видели, что каждая из этих должностей несет определенные обязанности и использует определенные инструменты. Кроме того, существуют некоторые общие черты между всеми тремя профессиями. Это показывает, что эти профессии не являются полностью отдельными областями, и сотрудничество между аналитиками данных, учеными по данным и инженерами по данным в команде данных является ключевым.

Как аналитики данных, так и ученые по данным полагаются на инфраструктуру и чистые, организованные данные высокого качества. С другой стороны, инженеры по данным должны сотрудничать с аналитиками и учеными по данным – так как они являются пользователями данных – при построении архитектуры данных и предоставлении данных.

Ученые по данным часто должны сотрудничать с аналитиками данных, чтобы лучше понять бизнес-контекст.

Вывод: выбор вашего пути

Теперь различия и сходства между аналитиками данных, учеными по данным и инженерами по данным должны быть намного яснее.

В заключение,

  • Если извлечение информации из данных и ее коммуникация – ваше, значит, путь аналитики данных для вас.
  • Если построение предиктивных моделей и использование алгоритмов машинного обучения – ваши хобби, то обратите внимание на ученых по данным.
  • Если создание архитектуры данных и обеспечение регулярного потока данных приносит вам счастье, то выбор инженера по данным может быть правильным.

Если вы хотите узнать больше, вот более подробная информация о различиях между инженерами по данным и учеными по данным и также между аналитиками данных и учеными по данным.

****[Нате Росиди](https://twitter.com/StrataScratch)**** – ученый по данным и стратег в области продуктов. Он также является преподавателем, преподающим аналитику, и основателем StrataScratch, платформы, помогающей ученым по данным готовиться к собеседованию с реальными вопросами от ведущих компаний. Свяжитесь с ним на Твиттере: StrataScratch или LinkedIn.