Освоение Вселенной данных ключевые шаги к успешной карьере в науке о данных

Ключевые шаги к успешной карьере в науке о данных освоение вселенной информации

 

Для развития успешной карьеры в области науки о данных необходимо укрепить то, что я считаю основными столпами этой области: технические навыки, создание портфолио, работа в сети, мягкие навыки и, наконец, развитие специализации в определенной области. После того, как вы обладаете всем этим, вам также нужно хорошо выступить на этапе собеседования.

Слишком много начинающих ученых в области данных думают, что все сводится к навыкам и они пренебрегают сетью. Или они полагаются на контакты в сети, чтобы получить собеседование, но не справляются с давлением и не раскрывают все свои навыки.

 

1. Образование и развитие навыков

 

Ни один из этих разделов не является по-настоящему опциональным, но этот, вероятно, самый важный из шести. Возможно, вы случайно попадете на работу, если не знаете нужных людей или ваше портфолио не идеально, но если у вас нет нужных навыков, вы не получите работу. Или еще хуже: вы можете получить работу, но потерпите неудачу и уволитесь.

Вот на что вам нужно сосредоточиться:

 

Изучение основ

 

Каждая работа в области науки о данных требует крепкой основы в математике, статистике и программировании. Знание языков программирования, таких как Python или R, является необходимым. Почти в каждом описании вакансии в области науки о данных упоминается один из этих двух языков.

Я также предлагаю рассмотреть изучение SQL как обязательное требование. Базы данных SQL являются неотъемлемой частью жизни ученых в области данных. И это сравнительно простой язык для изучения.

 

 

Машинное обучение и обработка данных

 

Не только из-за недавнего роста искусственного интеллекта; ученым в области данных всегда требовалось владение машинным обучением. Вам понадобится освоить алгоритмы машинного обучения, предобработку данных, создание признаков и оценку моделей.

 

Визуализация данных

 

Открытия ученого в области данных бесполезны, если она не может их передать другим. Это делается с помощью графиков, диаграмм и других типов визуализации данных. Вам нужно овладеть инструментами и техниками визуализации данных, чтобы эффективно передавать проницательность данных ключевым заинтересованным сторонам в вашей компании.

Я расскажу об этом немного больше, когда буду говорить о мягких навыках, – общение является важным навыком.

 

Технологии Big Data

 

Ушли те времена, когда ученые в области данных имели дело с маленькими данными, если они либо когда-либо существовали. Сегодня вам необходимо быть крайне знакомым с большими данными и необходимыми инструментами для их обработки. Даже если ваша компания не имеет дело с действительно “большими” данными, они стремятся к этому.

Ознакомьтесь с такими инструментами, как Hadoop, Spark и облачные платформы для работы с большими наборами данных.

 

2. Создание крепкого портфолио

 

Теперь перейдем ко второму столпу: вашему портфолио.

Как вы, наверное, знаете, недостаток квалифицированных ученых в области данных. Выпускники интенсивных программ подготовки заполнили эту проблему. Возникла новая проблема: недоверие. Компании знают, что диплом не является необходимым требованием для выполнения хорошей работы. Однако плохие программы обучения также привели к плохой репутации аспирантов-ученых в области данных, так как многие такие программы выпустили “выпускников”, которые не знают разницы между объединением и подзапросом. Поэтому ваше личное портфолио представляет собой возможность доказать, что вы знаете свое дело. (Также стоит отметить, что подготовительные программы обучения сейчас очень дорогие, особенно по сравнению с несколько менее оптимистичными перспективами на рынке труда в настоящее время.)

  

Вот что вам нужно:

 

Персональные проекты

Работайте над личными проектами, которые демонстрируют ваши навыки. Это могут быть соревнования на Kaggle, вклады в открытые исходные коды или собственные проекты по анализу данных. Вы можете поддерживать хорошо организованный репозиторий на GitHub, чтобы продемонстрировать свои проекты, примеры кода и вклады.

Блог или веб-сайт

Рассмотрите создание блога или личного веб-сайта, где вы сможете делиться идеями, учебниками и кейс-стади по данным науке. Возможно обмануть эту систему и нанять кого-то, кто сделает это за вас, но это так дорого и требует много времени, что вряд ли кто-то пытается подделать его. Блог является отличным портфолио ваших знаний.

Будьте готовы объяснять свои проекты, методологии и подходы к решению проблем. Приготовьтесь к общим вопросам на собеседовании по данным науке и задачам по кодированию.

3. Сетевые отношения

Помните золотое правило работы, независимо от области: до 70% объявлений о вакансиях никогда не публикуются. Это старая статистика, но даже если это 20-30 процентов, она доказывает, что важно, кого вы знаете. Это даже не считая того, что до трети объявленных вакансий на самом деле являются фиктивными и предназначены для создания иллюзии более успешной компании. Личная сеть может помочь вам избежать пустой траты времени.

Вот что вам следует сделать:

Присоединяйтесь к профессиональным сетям

Присоединяйтесь к сообществам по данным науке и посещайте встречи, конференции и вебинары, чтобы установить контакты с другими профессионалами в этой области. Этот более официальный подход к сети может помочь вам встретить нужных людей, произвести впечатление в своей индустрии и быть в курсе последних событий.

Социальные сети

Неформально вы также должны взаимодействовать на платформах, таких как LinkedIn, Twitter и соответствующих форумах, чтобы делиться своими работами и идеями и учиться у других.

4. Навыки мягких навыков

Помните, что твердые навыки – это только половина дела. Поэтому вам нужно обеспечить, чтобы ваши мягкие навыки не были пренебрежены. Я не говорю, что мягкие навыки важнее. Противопоставление “твердые навыки против мягких навыков” – это ложное противопоставление – и те и другие важны. Но люди не нанимают машин для анализа данных, они нанимают людей. Вот на что я рекомендую сосредоточиться:

Коммуникация

Запомните навык визуализации данных? Аналитики данных должны эффективно коммуницировать сложные технические результаты неграмотными людьми. Удивительно, насколько большая часть работы аналитика данных сводится к объяснению причин, по которым кто-то из маркетинга должен понять красивый график.

Решение проблем

Сейчас этот термин уже почти лишился смысла, поэтому убедитесь, что вы действительно понимаете, что такое “решение проблем”. В контексте анализа данных решение проблем – это не только отладка. Это также знание, когда целесообразно сотрудничать с различными отделами, когда следует пересматривать технические требования проекта, чтобы соответствовать новым спецификациям или возвращаться к модели, если она не проходит тестовый набор данных.

Критическое мышление

Еще один почти модный термин, который заслуживает глубокого рассмотрения. Критическое мышление означает способность анализировать данные с разных точек зрения, сомневаться в предположениях и творчески мыслить, чтобы получить осмысленные идеи.

Командная работа

Аналитики данных не работают в вакууме. Вы будете работать с веб-разработчиками, аналитиками данных, бизнес-аналитиками, маркетологами, продавцами и руководителями. Сотрудничайте с межфункциональными командами, чтобы понять потребности бизнеса и найти решения, основанные на данных.

5. Специализация в индустрии

Вы не слышали? Мы находимся посреди зимы для технологического найма. Деньги венчурного капитала не текут так, как раньше, и компании стягивают ремни. Не лучшее время быть универсалом. Вам нужно будет специализироваться, чтобы выжить.

выбрать нишу

Наука о данных охватывает различные отрасли, такие как здравоохранение, финансы, электронная коммерция и другие. Специализация в определенной области может сделать вас более привлекательным для работодателей в этой сфере. Ищите то, что вас естественно интересует или где у вас уже есть дополнительные знания.

Знание области

Получите отраслевые знания, важные для отрасли, в которой хотите работать. Это поможет вам понять тонкости данных и принимать более обоснованные решения. Например, если вы хотите работать в Google, вам нужно знать детали алгоритмов поиска и поведение пользователей.

6. Собеседование

Последнее, но определенно не менее важное: готовьтесь к собеседованиям. Вы можете успешно пройти первые пять столпов и все же споткнуться на финишной прямой. Вот как я рекомендую вам подготовиться:

Объяснения

Вы можете знать концепцию, но не всегда уметь объяснить ее другим. На собеседованиях вам придется быть готовым объяснить ваши проекты, методологии и подходы к решению проблем.

Найдите время, чтобы убедиться, что вы не только полностью понимаете, что вы делали, почему делали это и почему оно сработало для всех ваших проектов, но и чтобы вы могли объяснить это достаточно хорошо, чтобы профан понял. (это также отличный способ практиковать навык “коммуникации”.)

Подготовка к кодированию

Белая доска является известным атрибутом собеседований с кодированием, но столько людей впадает в панику, столкнувшись с пустой, белой поверхностью. Чем больше вы практикуете вопросы на собеседования заранее, тем лучше вы будете справляться с давлением в день собеседования.

Как развить успешную карьеру в области науки о данных

Это немного самонадеянно претендовать на существование единственного правильного ответа здесь, или что он может быть объяснен в статье. Надеюсь, что этот блог пост действует больше как дорожная карта, чем полное решение. Практикуйте эти шесть столпов работы в области науки о данных, и вы будете на пути к развитию карьеры в области науки о данных, которая продержится так долго, как вы хотите.

****[Нейт Росиди](https://twitter.com/StrataScratch)**** – это ученый-историк и стратег продукта. Он также преподает аналитику как преподаватель, и является основателем StrataScratch, платформы, помогающей ученым в области данных подготовиться к собеседованиям с реальными вопросами от ведущих компаний. Свяжитесь с ним на Twitter: StrataScratch или LinkedIn.