Книги по Data Engineering

Книги о Data Engineering

Читаемый Дайджест для Постепенного Освоения Data Engineering

Фото от Tamas Pap на Unsplash

В этой статье я хотел бы рассказать о книгах и ресурсах по Data Engineering, которые могут быть интересны тем, кто изучает Data Engineering (DE). Я понял, что на рынке не так много книг, объясняющих Data Engineering как концепцию целостно в целом. Некоторые из них отличаются тем, как использовать конкретные инструменты и архитектуры платформ данных, а некоторые из них являются моими любимыми книгами перед сном: поразительно легко заснуть при их чтении и великолепно скучно. Некоторые отлично подходят для стратегического принятия решений, а некоторые могут показаться немного устаревшими, но все же полезными. Надеюсь, вам будет интересно.

Отказ от ответственности: в этом посте могут содержаться партнерские ссылки, что означает, что я получаю комиссию, если вы решите совершить покупку через мои ссылки, без дополнительной платы для вас.

1. Data Engineering with Python

Работа с массовыми наборами данных для проектирования моделей данных и автоматизации потоков данных с использованием Python Пол Криккард, 2020

Это отличная книга для тех, кто хочет изучить инструменты Data Engineering на базе открытого исходного кода Apache. Она охватывает все основные темы Data Engineering, такие как моделирование данных, и предлагает множество примеров наиболее распространенных преобразований данных. Как указано в описании книги, она затрагивает Python и моделирование данных, так что читатели сосредоточатся на техниках ETL для извлечения, очистки и обогащения данных с использованием инструментов Python. В книге подробно объясняются Apache Kafka и Apache Spark, но также рассматриваются основы работы с форматами файлов, преобразования и очистки данных. Книга предлагает также очень интересные взгляды на развертывание потоков данных и работу с окружениями данных.

Одна из моих историй с продвинутыми техниками ETL для дополнения этой книги:

Python для Data Engineers

Продвинутые техники ETL для начинающих

towardsdatascience.com

2. Основы Data Engineering

Джо Рейс, Мэтт ХауслиВыпущено в июне 2022Издатель: O’Reilly Media, Inc.