Освоение Вселенной данных ключевые шаги к успешной карьере в науке о данных
Ключевые шаги к успешной карьере в науке о данных освоение вселенной информации
Для развития успешной карьеры в области науки о данных необходимо укрепить то, что я считаю основными столпами этой области: технические навыки, создание портфолио, работа в сети, мягкие навыки и, наконец, развитие специализации в определенной области. После того, как вы обладаете всем этим, вам также нужно хорошо выступить на этапе собеседования.
Слишком много начинающих ученых в области данных думают, что все сводится к навыкам и они пренебрегают сетью. Или они полагаются на контакты в сети, чтобы получить собеседование, но не справляются с давлением и не раскрывают все свои навыки.
- LlamaIndex Добавьте уникальные данные в свои заявки на программу LLM легко
- Гипотезно-ориентированное моделирование как компас для навигации в неопределенном будущем
- Как оптимизировать доходы, используя динамическое ценообразование?
1. Образование и развитие навыков
Ни один из этих разделов не является по-настоящему опциональным, но этот, вероятно, самый важный из шести. Возможно, вы случайно попадете на работу, если не знаете нужных людей или ваше портфолио не идеально, но если у вас нет нужных навыков, вы не получите работу. Или еще хуже: вы можете получить работу, но потерпите неудачу и уволитесь.
Вот на что вам нужно сосредоточиться:
Изучение основ
Каждая работа в области науки о данных требует крепкой основы в математике, статистике и программировании. Знание языков программирования, таких как Python или R, является необходимым. Почти в каждом описании вакансии в области науки о данных упоминается один из этих двух языков.
Я также предлагаю рассмотреть изучение SQL как обязательное требование. Базы данных SQL являются неотъемлемой частью жизни ученых в области данных. И это сравнительно простой язык для изучения.
Машинное обучение и обработка данных
Не только из-за недавнего роста искусственного интеллекта; ученым в области данных всегда требовалось владение машинным обучением. Вам понадобится освоить алгоритмы машинного обучения, предобработку данных, создание признаков и оценку моделей.
Визуализация данных
Открытия ученого в области данных бесполезны, если она не может их передать другим. Это делается с помощью графиков, диаграмм и других типов визуализации данных. Вам нужно овладеть инструментами и техниками визуализации данных, чтобы эффективно передавать проницательность данных ключевым заинтересованным сторонам в вашей компании.
Я расскажу об этом немного больше, когда буду говорить о мягких навыках, – общение является важным навыком.
Технологии Big Data
Ушли те времена, когда ученые в области данных имели дело с маленькими данными, если они либо когда-либо существовали. Сегодня вам необходимо быть крайне знакомым с большими данными и необходимыми инструментами для их обработки. Даже если ваша компания не имеет дело с действительно “большими” данными, они стремятся к этому.
Ознакомьтесь с такими инструментами, как Hadoop, Spark и облачные платформы для работы с большими наборами данных.
2. Создание крепкого портфолио
Теперь перейдем ко второму столпу: вашему портфолио.
Как вы, наверное, знаете, недостаток квалифицированных ученых в области данных. Выпускники интенсивных программ подготовки заполнили эту проблему. Возникла новая проблема: недоверие. Компании знают, что диплом не является необходимым требованием для выполнения хорошей работы. Однако плохие программы обучения также привели к плохой репутации аспирантов-ученых в области данных, так как многие такие программы выпустили “выпускников”, которые не знают разницы между объединением и подзапросом. Поэтому ваше личное портфолио представляет собой возможность доказать, что вы знаете свое дело. (Также стоит отметить, что подготовительные программы обучения сейчас очень дорогие, особенно по сравнению с несколько менее оптимистичными перспективами на рынке труда в настоящее время.)
Вот что вам нужно:
Персональные проекты
Работайте над личными проектами, которые демонстрируют ваши навыки. Это могут быть соревнования на Kaggle, вклады в открытые исходные коды или собственные проекты по анализу данных. Вы можете поддерживать хорошо организованный репозиторий на GitHub, чтобы продемонстрировать свои проекты, примеры кода и вклады.
Блог или веб-сайт
Рассмотрите создание блога или личного веб-сайта, где вы сможете делиться идеями, учебниками и кейс-стади по данным науке. Возможно обмануть эту систему и нанять кого-то, кто сделает это за вас, но это так дорого и требует много времени, что вряд ли кто-то пытается подделать его. Блог является отличным портфолио ваших знаний.
Будьте готовы объяснять свои проекты, методологии и подходы к решению проблем. Приготовьтесь к общим вопросам на собеседовании по данным науке и задачам по кодированию.
3. Сетевые отношения
Помните золотое правило работы, независимо от области: до 70% объявлений о вакансиях никогда не публикуются. Это старая статистика, но даже если это 20-30 процентов, она доказывает, что важно, кого вы знаете. Это даже не считая того, что до трети объявленных вакансий на самом деле являются фиктивными и предназначены для создания иллюзии более успешной компании. Личная сеть может помочь вам избежать пустой траты времени.
Вот что вам следует сделать:
Присоединяйтесь к профессиональным сетям
Присоединяйтесь к сообществам по данным науке и посещайте встречи, конференции и вебинары, чтобы установить контакты с другими профессионалами в этой области. Этот более официальный подход к сети может помочь вам встретить нужных людей, произвести впечатление в своей индустрии и быть в курсе последних событий.
Социальные сети
Неформально вы также должны взаимодействовать на платформах, таких как LinkedIn, Twitter и соответствующих форумах, чтобы делиться своими работами и идеями и учиться у других.
4. Навыки мягких навыков
Помните, что твердые навыки – это только половина дела. Поэтому вам нужно обеспечить, чтобы ваши мягкие навыки не были пренебрежены. Я не говорю, что мягкие навыки важнее. Противопоставление “твердые навыки против мягких навыков” – это ложное противопоставление – и те и другие важны. Но люди не нанимают машин для анализа данных, они нанимают людей. Вот на что я рекомендую сосредоточиться:
Коммуникация
Запомните навык визуализации данных? Аналитики данных должны эффективно коммуницировать сложные технические результаты неграмотными людьми. Удивительно, насколько большая часть работы аналитика данных сводится к объяснению причин, по которым кто-то из маркетинга должен понять красивый график.
Решение проблем
Сейчас этот термин уже почти лишился смысла, поэтому убедитесь, что вы действительно понимаете, что такое “решение проблем”. В контексте анализа данных решение проблем – это не только отладка. Это также знание, когда целесообразно сотрудничать с различными отделами, когда следует пересматривать технические требования проекта, чтобы соответствовать новым спецификациям или возвращаться к модели, если она не проходит тестовый набор данных.
Критическое мышление
Еще один почти модный термин, который заслуживает глубокого рассмотрения. Критическое мышление означает способность анализировать данные с разных точек зрения, сомневаться в предположениях и творчески мыслить, чтобы получить осмысленные идеи.
Командная работа
Аналитики данных не работают в вакууме. Вы будете работать с веб-разработчиками, аналитиками данных, бизнес-аналитиками, маркетологами, продавцами и руководителями. Сотрудничайте с межфункциональными командами, чтобы понять потребности бизнеса и найти решения, основанные на данных.
5. Специализация в индустрии
Вы не слышали? Мы находимся посреди зимы для технологического найма. Деньги венчурного капитала не текут так, как раньше, и компании стягивают ремни. Не лучшее время быть универсалом. Вам нужно будет специализироваться, чтобы выжить.
выбрать нишу
Наука о данных охватывает различные отрасли, такие как здравоохранение, финансы, электронная коммерция и другие. Специализация в определенной области может сделать вас более привлекательным для работодателей в этой сфере. Ищите то, что вас естественно интересует или где у вас уже есть дополнительные знания.
Знание области
Получите отраслевые знания, важные для отрасли, в которой хотите работать. Это поможет вам понять тонкости данных и принимать более обоснованные решения. Например, если вы хотите работать в Google, вам нужно знать детали алгоритмов поиска и поведение пользователей.
6. Собеседование
Последнее, но определенно не менее важное: готовьтесь к собеседованиям. Вы можете успешно пройти первые пять столпов и все же споткнуться на финишной прямой. Вот как я рекомендую вам подготовиться:
Объяснения
Вы можете знать концепцию, но не всегда уметь объяснить ее другим. На собеседованиях вам придется быть готовым объяснить ваши проекты, методологии и подходы к решению проблем.
Найдите время, чтобы убедиться, что вы не только полностью понимаете, что вы делали, почему делали это и почему оно сработало для всех ваших проектов, но и чтобы вы могли объяснить это достаточно хорошо, чтобы профан понял. (это также отличный способ практиковать навык “коммуникации”.)
Подготовка к кодированию
Белая доска является известным атрибутом собеседований с кодированием, но столько людей впадает в панику, столкнувшись с пустой, белой поверхностью. Чем больше вы практикуете вопросы на собеседования заранее, тем лучше вы будете справляться с давлением в день собеседования.
Как развить успешную карьеру в области науки о данных
Это немного самонадеянно претендовать на существование единственного правильного ответа здесь, или что он может быть объяснен в статье. Надеюсь, что этот блог пост действует больше как дорожная карта, чем полное решение. Практикуйте эти шесть столпов работы в области науки о данных, и вы будете на пути к развитию карьеры в области науки о данных, которая продержится так долго, как вы хотите.
****[Нейт Росиди](https://twitter.com/StrataScratch)**** – это ученый-историк и стратег продукта. Он также преподает аналитику как преподаватель, и является основателем StrataScratch, платформы, помогающей ученым в области данных подготовиться к собеседованиям с реальными вопросами от ведущих компаний. Свяжитесь с ним на Twitter: StrataScratch или LinkedIn.