Построение матрицы корреляции с p-значениями в Python

Корреляционная матрица с p-значениями в Python

Генерация выходных данных корреляции в Python, выходящих за рамки настроек по умолчанию

Обзор

Если вы, как и я, являетесь поклонником корреляционной матрицы, то этот статья для вас. Она предназначена особенно для тех, кто использует Python для генерации, отображения и анализа корреляционных матриц. Более того, эта статья для тех, кто, как и я, возможно, пришел из других инструментов статистического анализа и был разочарован в более обширном и информативном выводе, чем обычно предлагается в Python.

Ниже показано, как я себе представляю, когда я злой и разочарован тем, что инструменты по умолчанию в Python не обращают на меня должного внимания, в отличие от некоторых других инструментов статистического анализа, которыми я пользовался раньше в своей карьере!

Фото от Julien L на Unsplash

Например, ранее я писал о отсутствующем выводе, привычном пользователям Stata при объединении файлов данных. Если вы нашли эту статью и не совсем уверены, что такое корреляционная матрица, позвольте мне объяснить.

Корреляционные матрицы на практике

Корреляционная матрица – это таблица, отображающая коэффициенты корреляции между переменными. Каждая ячейка в таблице показывает корреляцию между двумя переменными, а диагональ представляет корреляцию переменной с самой собой, которая всегда равна 1. Значения в матрице находятся в диапазоне от -1 до 1. Корреляция 1 указывает на идеальную положительную связь, корреляция -1 указывает на идеальную отрицательную связь, а корреляция 0 указывает на отсутствие связи между двумя переменными. Корреляционные матрицы широко используются в статистических анализах для оценки линейных отношений между переменными и определения наиболее тесно связанных переменных.

Вот как часто выглядит корреляционная матрица.

Изображение: таблица автора из публикации автора.

Интерпретация корреляционных матриц

Для обсуждения я выделил четвертую строку в таблице выше красным прямоугольником. Внутри этого прямоугольника результаты показывают связь между возрастом и тремя показателями, включая…