Tag: pandas

Элементарно медиана множества матриц, пантонов python

У меня есть словарь матриц. Словарь называется dict. dict[location] возвращает квадратный фрейм корреляции nxn для этого местоположения. locations список всех местоположений. (Ключи в словаре). Я хочу по существу составить список каждого компонента i, j в кадре данных по ключевым словам и взять медиану всех этих. Вы можете думать об этом как о суммировании матриц друг […]

Добавление списка в начало вывода Pandas DataFrame

У меня есть следующий текстовый файл в качестве входного ( infile.txt ) A foo 3.0 A bar 3.1 B foo 3.0 B bar 3.1 И со следующим кодом import pandas as pd infile="infile.txt" df = pd.io.parsers.read_table(infile,header=None,sep=" ") df.columns = ['sample','celltype','score'] dfp = df.pivot(index='sample',columns='celltype',values='score') dfp_prc = dfp.applymap(lambda x: x * 100) dfp_prc.to_csv("out.txt",sep=" ", index=True) он создает […]

Shift оборванных строк Pandas DataFrame для очистки данных с помощью частичного поиска строк

После импорта данных из CSV-файла у меня есть некоторые данные, похожие на это (хотя и сотни столбцов и тысяч строк): 4 5 6 7 8 9 10 11 12 13 14 15 16 0 302255Z 09005KT 1 1/4SM BR CLR M00/M00 A3044 RMK AO2A SLP311 T10021002 $; 1 302232Z 08003KT 1 1/4 BR CLR M00/M00 […]

Эстетика барных прутьев и баров ошибок в морском дне

Я использую библиотеку seaborn для визуализации данных, и я хочу изменить некоторые аспекты выходных графиков для публикации. Я хочу, чтобы полосы ошибок были более узкими, с шапками, и я бы хотел, чтобы граница вокруг всех баров была черной. Я предполагаю, что есть какой-то способ изменить сюжет, используя pyplot (или, возможно, словарь rc в sns.set_context), но […]

Как импортировать библиотеки python с .pyx и .c файлами без установки на компьютер?

Я пишу код для ряда других людей, ни один из которых не особенно разбирается в компьютерах. Я установил python 2.7 для всех из них, но я действительно не хочу устанавливать что-либо еще. Чтобы обойти установку каждой библиотеки, которую я хотел использовать, я просто включил исходный код библиотеки в ту же папку, что и исходный код […]

Создание возрастающей серии целых чисел по группам в Pandas

Я пытаюсь создать восходящий список целых чисел по группам в pandas: Group Date A 2000-01-01 A 2000-01-12 A 2000-01-15 A 2000-10-01 B 2005-02-05 B 2006-04-10 B 2010-08-20 Стало бы так: Group Date obs_num A 2000-01-01 1 A 2000-01-12 2 A 2000-01-15 3 A 2000-10-01 4 B 2005-02-05 1 B 2006-04-10 2 B 2010-08-20 3

python, как преобразовать серию pandas в pandas DataFrame?

У меня есть серия pandas sf: email email1@email.com [1.0, 0.0, 0.0] email2@email.com [2.0, 0.0, 0.0] email3@email.com [1.0, 0.0, 0.0] email4@email.com [4.0, 0.0, 0.0] email5@email.com [1.0, 0.0, 3.0] email6@email.com [1.0, 5.0, 0.0] Как я могу преобразовать его в следующий pandas DataFrame: index | email ________________________ 0 | email1@email.com 1 | email2@email.com 2 | email3@email.com 3 | […]

Применение кумулятивной средней функции к сгруппированному объекту

У меня есть DataFrame df где каждая запись представляет собой футбольную игру. Команды появятся не один раз. Мне нужно вычислить какое-то скользящее среднее для каждой оценки команды (ну, а не точно скользящее среднее к букве). date home away score_h score_a 166 2013-09-01 Fulham Chelsea 0 0 167 2013-09-03 Arsenal Everton 0 2 164 2013-09-05 Arsenal […]

Обобщение строк в Pandas DataFrame

У меня есть следующие строки: ColumnID MenuID QuestionID ResponseCount RowID SourceColumnID SourceRowID SourceVariationID 22 -2 -2 319276487 28 3049400354 3049400356 3049400365 3049400365 23 -2 -2 319276487 31 3049400354 3049400356 3049400365 3049400365 24 -2 -2 319276487 37 3049400354 3049400356 3049400365 3049400365 25 -2 -2 319276487 28 3049400353 3049400357 3049400365 3049400365 26 -2 -2 319276487 45 3049400353 […]

Как вы очищаете и переадресовываете многократную 1-минутную временную серию с пандами?

У меня есть файл csv с 1-минутной информацией о запасах, охватывающей несколько дней. Каждый день проходит с 9:30 до 16:00. Некоторые из минут во временном ряду отсутствуют: (здесь отсутствуют 2013-09-16 09:32:00 и 2013-09-17 09:31:00) 2013-09-16 09:30:00,461.01,461.49,461,461,183507 2013-09-16 09:31:00,460.82,461.6099,460.39,461.07,212774 2013-09-16 09:33:00,460.0799,460.88,458.97,459.2401,207880 2013-09-16 09:34:00,458.97,460.08,458.8,460.04,148121 … 2013-09-16 15:59:00,449.72,450.0774,449.59,449.95,146399 2013-09-16 16:00:00,450.12,450.12,449.65,449.65,444594 2013-09-17 09:30:00,448,448,447.5,447.96,173624 2013-09-17 09:32:00,450.6177,450.9,449.05,449.2701,268715 2013-09-17 09:33:00,451.39,451.96,450.58,450.7061,197019 … … […]

Python - лучший язык программирования в мире.