Советы для успешного прохождения собеседований на начальные должности в области науки о данных
Приманки успеха советы для успешного прохождения собеседований на начальные должности в области науки о данных
Наука о данных. Это захватывающе. Это доводит до нервного состояния.
Она междисциплинарна и постоянно развивается. Она раскрывает тайны в данных и требует инновационных решений. Вот что делает ее привлекательной. Не говоря уже о неплохой зарплате.
Наука о данных также может быть обескураживающей, иногда по тем же причинам. Дополнительно к высокой конкуренции и ожиданиям, постоянно меняющимся целям и этическим дилеммам.
- VoAGI News, 5 октября 5 бесплатных книг, чтобы научиться владеть Python • Топ-7 бесплатных облачных блокнотов для Data Science
- Топ-5 инструментов управления данными для ваших проектов
- 5 бесплатных платформ для создания крепкого портфолио в сфере науки о данных
Вглядываясь в нее, тебе хочется выдернуть волосы и, странно, это нравится. В некотором смысле, как следить за технологическими братьями в Twitter. Извини, Элон, X.
Это особенно верно для новичков, совершающих паломничество на собеседования о первых работах в области науки о данных.
Однако, с подходящей подготовкой и настройкой, ты можешь уверенно проходить эти интервью и оставлять долговременное впечатление. Вот несколько советов, которые помогут тебе успешно пройти собеседования о работе новичка в области науки о данных.
1. Тщательно понимай основы
Тебе необходимо крепко удерживать фундаментальные концепции, такие как статистика, линейная алгебра и программирование. Собеседователи часто проверяют эти основы до перехода к более сложным темам.
Эти навыки обычно включают:
- Статистика
- Программирование
- Манипуляции с данными
- Визуализация данных
- Реляционные базы данных
- Машинное обучение
Статистика
Основные знания статистики, которые ожидают собеседники, даже от начинающих, включают эти статистические концепции.
- Описательная статистика:
-
Меры центральной тенденции – среднее, медиана и мода
-
Меры разброса – диапазон, дисперсия, стандартное отклонение и интерквартильный размах
-
Меры формы – асимметрия и эксцесс
-
Вероятность:
-
Основные понятия вероятности
-
Условная вероятность и теорема Байеса
-
Вероятностное распределение – нормальное, биномиальное, пуассоновское и другие
-
Инференциальная статистика:
-
Выборка – совокупность, выборка, методы выборки
-
Проверка гипотез – нулевые и альтернативные гипотезы, ошибка первого и второго рода, p-значения и уровни значимости
-
Доверительные интервалы – оценка параметров генеральной совокупности на основе данных выборки.
-
Корреляция и ковариация:
-
Понимание взаимосвязи между двумя переменными и их взаимозависимость
-
Коэффициент корреляции Пирсона
-
Регрессионный анализ:
-
Простая линейная регрессия – отношение между двумя непрерывными переменными
-
Многофакторная регрессия – расширение до более чем одной независимой переменной
-
Распределения:
- Нормальное распределение
- Биномиальное распределение
- Пуассоновское распределение
- Экспоненциальное распределение
Программирование
Тебе необходимо владеть программными языками, обычно используемыми в области науки о данных. Три самых популярных языка:
- SQL
- Python
- R
Не обязательно быть гуру во всех трех языках. Обычно достаточно хорошо знать один и быть хотя бы знакомым с основами одного из остальных двух.
Все зависит от описания работы. Разные компании и должности требуют разных языков. В науке о данных обычно используется один из трех упомянутых.
Если ты спросишь меня, научиться какому языку, и только одному, я бы выбрал SQL. Он необходим каждому ученому о данных для работы с базами данных. SQL специально разработан для этого; ни один другой язык не делает это и не очищает данные так хорошо.
Он также легко интегрируется с другими языками. Таким образом, вы можете использовать другие языки для задач, для которых SQL не подходит, например, для создания моделей или визуализации данных.
Манипуляция данными
Это относится к вашей способности очищать и преобразовывать данные, что включает работу с пропущенными данными, выбросами и преобразованием переменных.
Это означает, что вам потребуется знать самые популярные библиотеки для манипуляции данными:
Визуализация данных
Вам необходимо понимать лучшие техники визуализации для различных типов данных и идей. И вы должны знать, как применить их с помощью инструментов для визуализации:
- matplotlib и seaborn – для Python
- ggplot2 – для R
Реляционные базы данных
Как ученый по данным, вам необходимо иметь общее представление о реляционных базах данных и о том, как они работают. И если у вас есть хотя бы базовые знания запросов к ним с использованием SQL, то лучше.
Некоторые из самых популярных систем управления данными включают:
Машинное обучение
Вы должны быть знакомы с основами машинного обучения. Например, зная разницу между обучением с учителем и без учителя.
Вам также необходимо знать классификацию, кластеризацию и регрессию. Это включает знание некоторых базовых алгоритмов, таких как линейная регрессия, деревья решений, SVM, наивный Байес и k-средних.
2. Знайте свои инструменты
Перед собеседованием ознакомьтесь с популярными инструментами для науки о данных. В этом включены языки программирования, о которых мы уже упоминали, а также некоторые другие платформы.
Вам не нужно знать их все. Но было бы идеально, если у вас был опыт работы хотя бы с одним инструментом из каждой категории.
3. Подготовьтесь к вопросам по кодированию и техническим вопросам
Используйте такие платформы, как StrataScratch, LeetCode и другие, чтобы подготовиться к вопросам по кодированию и техническим вопросам.
Также используйте YouTube-каналы, блоги и другие ресурсы, чтобы освежить знания о других технических концепциях. Если вы сконцентрируетесь на тех, которые указаны в “Тщательно понимайте основы”, у вас все получится.
Модельные интервью могут быть чрезвычайно полезными. Используйте онлайн-платформы, предлагающие их. Или тренируйтесь с друзьями и наставниками.
Все эти техники подготовки помогут вам ощутить комфорт в формате интервью и улучшить ваши ответы.
4. Покажите Практический Опыт
Если вы работали над личными проектами или были на стажировке, использовать их в своих интересах. Обсудите их во время интервью, чтобы подчеркнуть преодолеваемые вами проблемы, реализуемые вами решения и достигнутые результаты.
5. Подготовьтесь к Поведенческим Вопросам
Технические навыки обычно составляют большую часть процесса найма. Однако компании обычно уделяют хотя бы некоторое время поведенческим вопросам.
Это ожидается, так как вы будете работать в команде. Интервьюеры заинтересуются тем, как вы общаетесь с коллегами, понимаете работу в команде, справляетесь с давлением и конфликтами, или подходите к решению проблем.
Подготовьте примеры из своего прошлого опыта, которые демонстрируют ваши навыки мягкого навыка и умения решать проблемы.
6. Будьте В Теме
Наука о данных быстро развивается. Поэтому вам необходимо быть в курсе последних тенденций, инструментов и техник. Читайте о них, присоединяйтесь к онлайн-форумам, посещайте вебинары и участвуйте в мастер-классах, чтобы быть в курсе событий.
Однако не навязывайте себе мысль о том, что вам нужно знать – ага, освоить – каждый новый “обязательный” и “обязательно знать” продукт.
7. Задавайте Вопросы
В зависимости от формата интервью, у вас может быть возможность задавать вопросы во время или в конце интервью.
Это ваш шанс показать интервьюеру свое энтузиазм по отношению к роли и компании. И также понимание того, чего они ищут.
Спросите о текущих проектах команды, инфраструктуре данных компании, планах и проблемах, с которыми они сталкиваются.
8. Не Забывайте о Мягких Навыках
Ваши технические навыки не принесут вам много пользы, если не сочетаются с отличными коммуникативными навыками. Ваша работа будет заключаться в общении и сотрудничестве с техническими и не техническими членами команды и заинтересованными сторонами.
Во время интервью выражайтесь четко и ясно в ваших ответах. Покажите свою способность объяснять сложные темы простыми словами. Это покажет интервьюерам, что вы можете эффективно сотрудничать с не техническими членами команды. Это навык, который вам понадобится очень часто, так как наука о данных не существует в вакууме, и ее результаты очень часто используются не техническими людьми.
9. Сохраняйте Спокойствие и Продолжайте
Быть нервным – это естественно. Просто не будьте нервными оттого, что вы волнуетесь! Всегда помните, что интервьюеры ищут лучшего кандидата, а не идеального. Лучшим, в данном случае, означает лучшую комбинацию всех пунктов, которые мы упомянули до сих пор.
Если вы ошиблись на каком-то этапе интервью, не теряйте дух – сохраняйте спокойствие и продолжайте! Кандидаты часто преувеличивают влияние своих собственных ошибок, хотя они могут почти не влиять на впечатление, которое создает интервьюер.
Помните, что интервью так же много о компании, как и о том, чтобы познакомиться с вами. Будьте спокойны, делайте глубокие вдохи и отвечайте на каждый вопрос с уверенностью.
Конечно, уверенности нельзя подделать. Ее лучше достичь благодаря хорошей подготовке, следуя первым восьми советам.
Заключение
Да, технические знания являются важными для роли в области науки о данных, даже на начальном уровне. Но мягкие навыки, практический опыт и искренняя страсть к этой области так же важны.
В первую очередь интервьюеры ищут целостный пакет. Девять советов помогут вам справиться с этой задачей.
Теперь вам нужно себе позволить время для тщательной подготовки. Если вы уверены в своей готовности, подходить к интервью с позитивным настроем будет легче. Таким образом, вы уже на пути к получению своей первой работы в области науки о данных.
Удачи! Nate Rosidi – ученый-исследователь в области науки о данных и в области стратегии продукта. Он также преподает аналитику в качестве преподавателя и является основателем платформы StrataScratch, которая помогает ученым-исследователям подготовиться к интервью с использованием реальных вопросов от лучших компаний. Свяжитесь с ним по Twitter: StrataScratch или LinkedIn.