Разгадайте тайну зубчатой диаграммы COVID

COVID cog diagram mystery

Уменьшение разрешения данных с помощью pandas

DreamShaper_v7_A_computer_monitor_displaying_a_chart_with_a_jagged_blue_line (by author & Leonardo AI)

В первый год пандемии COVID-19 смертельный толчок от болезни стал предметом большой контроверзии. Среди проблем были раннее недооценка из-за недостатка тестирования, незарегистрированные смерти вне больниц и различие между смертями от COVID-19 и смертями с COVID-19 [1][2].

Вдобавок ко всему, и к несчастью каждого, пандемия была быстро политизирована. Партийные обозреватели бросались на каждую частицу данных, искали способы их искажения в свою пользу. Подтверждающий эффект бродил везде. Если вы были в социальных сетях в то время, вероятно, видели посты, которые оспаривали достоверность официальных диаграмм и графиков.

В этом быстром проекте Data Science мы рассмотрим особую диаграмму, которая появилась у меня на Facebook в то время. Диаграмма отображает смертность от COVID-19 в США за первый год пандемии и имеет характерный зубчатый или “пильчатый” вид.

US COVID-19 mortalities for the first year of the pandemic (by author from “The COVID Tracking Project” at The Atlantic [3])

Криволинейные колебания имеют высокую частоту, и сомнительно, что болезнь прогрессировала таким образом. В то время как некоторые считали это доказательством того, что счетчики смертности от COVID явно неправильны и нельзя им доверять, те из нас, кто обладает навыками анализа данных, быстро разоблачили эту раздутую тайну.

Набор данных

Данные, которые мы будем использовать, были собраны в рамках проекта “The COVID Tracking Project” в The Atlantic [3]. Они включают статистику COVID-19 с 3 марта 2020 года по 7 марта 2021 года. Чтобы уменьшить размер набора данных, я загрузил данные только для штата Техас и сохранил их в виде CSV-файла в этом Gist.

Вы можете найти оригинальный набор данных здесь, а лицензию на данные здесь.

Установка библиотек

Кроме Python нам понадобится библиотека pandas. Вы можете установить ее с помощью:

conda install pandas

или

pip install pandas