Советы для успешного прохождения собеседований на начальные должности в области науки о данных

Приманки успеха советы для успешного прохождения собеседований на начальные должности в области науки о данных

 

Наука о данных. Это захватывающе. Это доводит до нервного состояния.

Она междисциплинарна и постоянно развивается. Она раскрывает тайны в данных и требует инновационных решений. Вот что делает ее привлекательной. Не говоря уже о неплохой зарплате.

Наука о данных также может быть обескураживающей, иногда по тем же причинам. Дополнительно к высокой конкуренции и ожиданиям, постоянно меняющимся целям и этическим дилеммам.

Вглядываясь в нее, тебе хочется выдернуть волосы и, странно, это нравится. В некотором смысле, как следить за технологическими братьями в Twitter. Извини, Элон, X.

Это особенно верно для новичков, совершающих паломничество на собеседования о первых работах в области науки о данных.

Однако, с подходящей подготовкой и настройкой, ты можешь уверенно проходить эти интервью и оставлять долговременное впечатление. Вот несколько советов, которые помогут тебе успешно пройти собеседования о работе новичка в области науки о данных.

 

1. Тщательно понимай основы

 

Тебе необходимо крепко удерживать фундаментальные концепции, такие как статистика, линейная алгебра и программирование. Собеседователи часто проверяют эти основы до перехода к более сложным темам.

Эти навыки обычно включают:

  • Статистика
  • Программирование
  • Манипуляции с данными
  • Визуализация данных
  • Реляционные базы данных
  • Машинное обучение

 

 

Статистика

 

Основные знания статистики, которые ожидают собеседники, даже от начинающих, включают эти статистические концепции.

  • Описательная статистика: 
  • Меры центральной тенденции – среднее, медиана и мода

  • Меры разброса – диапазон, дисперсия, стандартное отклонение и интерквартильный размах

  • Меры формы – асимметрия и эксцесс

  • Вероятность:

  • Основные понятия вероятности

  • Условная вероятность и теорема Байеса

  • Вероятностное распределение – нормальное, биномиальное, пуассоновское и другие

  • Инференциальная статистика:

  • Выборка – совокупность, выборка, методы выборки

  • Проверка гипотез – нулевые и альтернативные гипотезы, ошибка первого и второго рода, p-значения и уровни значимости

  • Доверительные интервалы – оценка параметров генеральной совокупности на основе данных выборки.

  • Корреляция и ковариация:

  • Понимание взаимосвязи между двумя переменными и их взаимозависимость

  • Коэффициент корреляции Пирсона

  • Регрессионный анализ:

  • Простая линейная регрессия – отношение между двумя непрерывными переменными

  • Многофакторная регрессия – расширение до более чем одной независимой переменной

  • Распределения:

  • Нормальное распределение
  • Биномиальное распределение
  • Пуассоновское распределение
  • Экспоненциальное распределение

 

Программирование

 

Тебе необходимо владеть программными языками, обычно используемыми в области науки о данных. Три самых популярных языка:

  • SQL
  • Python 
  • R

Не обязательно быть гуру во всех трех языках. Обычно достаточно хорошо знать один и быть хотя бы знакомым с основами одного из остальных двух.

Все зависит от описания работы. Разные компании и должности требуют разных языков. В науке о данных обычно используется один из трех упомянутых.

Если ты спросишь меня, научиться какому языку, и только одному, я бы выбрал SQL. Он необходим каждому ученому о данных для работы с базами данных. SQL специально разработан для этого; ни один другой язык не делает это и не очищает данные так хорошо.

Он также легко интегрируется с другими языками. Таким образом, вы можете использовать другие языки для задач, для которых SQL не подходит, например, для создания моделей или визуализации данных.

Манипуляция данными

Это относится к вашей способности очищать и преобразовывать данные, что включает работу с пропущенными данными, выбросами и преобразованием переменных.

Это означает, что вам потребуется знать самые популярные библиотеки для манипуляции данными:

Визуализация данных

Вам необходимо понимать лучшие техники визуализации для различных типов данных и идей. И вы должны знать, как применить их с помощью инструментов для визуализации:

Реляционные базы данных

Как ученый по данным, вам необходимо иметь общее представление о реляционных базах данных и о том, как они работают. И если у вас есть хотя бы базовые знания запросов к ним с использованием SQL, то лучше.

Некоторые из самых популярных систем управления данными включают:

Машинное обучение

Вы должны быть знакомы с основами машинного обучения. Например, зная разницу между обучением с учителем и без учителя.

Вам также необходимо знать классификацию, кластеризацию и регрессию. Это включает знание некоторых базовых алгоритмов, таких как линейная регрессия, деревья решений, SVM, наивный Байес и k-средних.

2. Знайте свои инструменты

Перед собеседованием ознакомьтесь с популярными инструментами для науки о данных. В этом включены языки программирования, о которых мы уже упоминали, а также некоторые другие платформы.

Вам не нужно знать их все. Но было бы идеально, если у вас был опыт работы хотя бы с одним инструментом из каждой категории.

3. Подготовьтесь к вопросам по кодированию и техническим вопросам

Используйте такие платформы, как StrataScratch, LeetCode и другие, чтобы подготовиться к вопросам по кодированию и техническим вопросам.

Также используйте YouTube-каналы, блоги и другие ресурсы, чтобы освежить знания о других технических концепциях. Если вы сконцентрируетесь на тех, которые указаны в “Тщательно понимайте основы”, у вас все получится.

Модельные интервью могут быть чрезвычайно полезными. Используйте онлайн-платформы, предлагающие их. Или тренируйтесь с друзьями и наставниками.

Все эти техники подготовки помогут вам ощутить комфорт в формате интервью и улучшить ваши ответы.

 

4. Покажите Практический Опыт

 

Если вы работали над личными проектами или были на стажировке, использовать их в своих интересах. Обсудите их во время интервью, чтобы подчеркнуть преодолеваемые вами проблемы, реализуемые вами решения и достигнутые результаты.

 

5. Подготовьтесь к Поведенческим Вопросам

 

Технические навыки обычно составляют большую часть процесса найма. Однако компании обычно уделяют хотя бы некоторое время поведенческим вопросам.

Это ожидается, так как вы будете работать в команде. Интервьюеры заинтересуются тем, как вы общаетесь с коллегами, понимаете работу в команде, справляетесь с давлением и конфликтами, или подходите к решению проблем.

Подготовьте примеры из своего прошлого опыта, которые демонстрируют ваши навыки мягкого навыка и умения решать проблемы.

 

6. Будьте В Теме

 

Наука о данных быстро развивается. Поэтому вам необходимо быть в курсе последних тенденций, инструментов и техник. Читайте о них, присоединяйтесь к онлайн-форумам, посещайте вебинары и участвуйте в мастер-классах, чтобы быть в курсе событий.

Однако не навязывайте себе мысль о том, что вам нужно знать – ага, освоить – каждый новый “обязательный” и “обязательно знать” продукт.

 

7. Задавайте Вопросы

 

В зависимости от формата интервью, у вас может быть возможность задавать вопросы во время или в конце интервью.

Это ваш шанс показать интервьюеру свое энтузиазм по отношению к роли и компании. И также понимание того, чего они ищут.

Спросите о текущих проектах команды, инфраструктуре данных компании, планах и проблемах, с которыми они сталкиваются.

 

8. Не Забывайте о Мягких Навыках

 

Ваши технические навыки не принесут вам много пользы, если не сочетаются с отличными коммуникативными навыками. Ваша работа будет заключаться в общении и сотрудничестве с техническими и не техническими членами команды и заинтересованными сторонами.

Во время интервью выражайтесь четко и ясно в ваших ответах. Покажите свою способность объяснять сложные темы простыми словами. Это покажет интервьюерам, что вы можете эффективно сотрудничать с не техническими членами команды. Это навык, который вам понадобится очень часто, так как наука о данных не существует в вакууме, и ее результаты очень часто используются не техническими людьми.

 

9. Сохраняйте Спокойствие и Продолжайте

 

Быть нервным – это естественно. Просто не будьте нервными оттого, что вы волнуетесь! Всегда помните, что интервьюеры ищут лучшего кандидата, а не идеального. Лучшим, в данном случае, означает лучшую комбинацию всех пунктов, которые мы упомянули до сих пор.

Если вы ошиблись на каком-то этапе интервью, не теряйте дух – сохраняйте спокойствие и продолжайте! Кандидаты часто преувеличивают влияние своих собственных ошибок, хотя они могут почти не влиять на впечатление, которое создает интервьюер.

Помните, что интервью так же много о компании, как и о том, чтобы познакомиться с вами. Будьте спокойны, делайте глубокие вдохи и отвечайте на каждый вопрос с уверенностью.

Конечно, уверенности нельзя подделать. Ее лучше достичь благодаря хорошей подготовке, следуя первым восьми советам.

 

Заключение

 

Да, технические знания являются важными для роли в области науки о данных, даже на начальном уровне. Но мягкие навыки, практический опыт и искренняя страсть к этой области так же важны.

В первую очередь интервьюеры ищут целостный пакет. Девять советов помогут вам справиться с этой задачей.

Теперь вам нужно себе позволить время для тщательной подготовки. Если вы уверены в своей готовности, подходить к интервью с позитивным настроем будет легче. Таким образом, вы уже на пути к получению своей первой работы в области науки о данных.

Удачи!  Nate Rosidi – ученый-исследователь в области науки о данных и в области стратегии продукта. Он также преподает аналитику в качестве преподавателя и является основателем платформы StrataScratch, которая помогает ученым-исследователям подготовиться к интервью с использованием реальных вопросов от лучших компаний. Свяжитесь с ним по Twitter: StrataScratch или LinkedIn.