Как создать тепловую карту высокого качества на Python

Создание высококачественной тепловой карты на Python.

Руководство по тепловым картам в Python

Введение

Тепловые карты могут использоваться как информативные графики для передачи количественных данных. Они могут использоваться для передачи данных в удобочитаемом формате, предоставляя краткое сводное описание данных.

Python имеет несколько инструментов, которые помогают создавать тепловые карты высокого качества для публикаций. Среди них библиотеки Seaborn и Matplotlib, а также библиотеки subplot2grid, которые предоставляют удобный способ организации данных в тепловой карте.

В этом руководстве я подробно опишу шаги, необходимые для создания тепловой карты, основанной на наличии/отсутствии ключевых элементов. Для этого я буду использовать файл CSV, содержащий фиктивные данные о выборке бактериальных изолятов. Эти бактериальные штаммы имеют несколько характеристик, включая гены резистентности к антибиотикам, гены вирулентности и определенные типы капсул. Тепловая карта позволит быстро осмотреть и сравнить различные штаммы.

Хотя пример, используемый в данном руководстве, фокусируется на бактериальных штаммах, применяемые техники можно шире использовать для других наборов данных, чтобы помочь вам визуализировать ваши данные с использованием тепловой карты. На протяжении данного руководства все изображения принадлежат автору.

Цель

Создать тепловую карту высокого качества, отображающую наличие/отсутствие ключевых генов у вымышленных бактериальных штаммов.

Для этого руководства будет использоваться следующий файл CSV, «Bacterial_strain_heatmap_tutorial_data.csv», доступный в репозитории Github.

Начало работы

Для начала необходимо выполнить несколько импортов для чтения данных и стилизации графика позже. Мы начнем с объединения всех инструкций импорта вместе.

import pandas as pd import numpy as npimport matplotlib.pyplot as plt from matplotlib.colors import ListedColormapimport seaborn as sns from matplotlib.patches import Patchfrom matplotlib.lines import Line2Dfrom matplotlib.patches import Rectangle

Затем мы считываем фрейм данных, устанавливаем индекс с использованием столбца «Strain» и просматриваем первые 5 строк.

df = pd.read_csv('Bacterial_strain_heatmap_tutorial_data.csv').set_index('Strain')…