Tag: pandas

Pandas min () выбранных строк и столбцов

Я пытаюсь создать столбец, который содержит только минимум одной строки и нескольких столбцов, например: A0 A1 A2 B0 B1 B2 C0 C1 0 0.84 0.47 0.55 0.46 0.76 0.42 0.24 0.75 1 0.43 0.47 0.93 0.39 0.58 0.83 0.35 0.39 2 0.12 0.17 0.35 0.00 0.19 0.22 0.93 0.73 3 0.95 0.56 0.84 0.74 0.52 […]

Самый быстрый способ вычисления подмножества корреляционной матрицы

Я неравнодушен к использованию pandas builtin corr method для dataframes. Тем не менее, я пытаюсь вычислить матрицу корреляции кадра данных с 45 000 столбцов. А затем повторите это 250 раз. Расчет раскалывает мой баран (16 ГБ, mac book pro). Я собираю статистику по столбцам результирующей корреляционной матрицы. Поэтому для расчета этих статистических данных мне нужна […]

python pandas сглаживает данные в список

У меня есть df: import pandas a=[['1/2/2014', 'a', '6', 'z1'], ['1/2/2014', 'a', '3', 'z1'], ['1/3/2014', 'c', '1', 'x3'], ] df = pandas.DataFrame.from_records(a[1:],columns=a[0]) Я хочу сгладить df, так что это один непрерывный список: ['1/2/2014', 'a', '6', 'z1', '1/2/2014', 'a', '3', 'z1','1/3/2014', 'c', '1', 'x3'] Я могу перебирать строки и extend на список, но гораздо проще это […]

Сохранение порядка столбцов в Python Pandas DataFrame

Есть ли способ сохранить порядок столбцов в файле csv при чтении и записи с Python Pandas? Например, в этом коде import pandas as pd data = pd.read_csv(filename) data.to_csv(filename) выходные файлы могут отличаться, потому что столбцы не сохраняются.

возвращает имена столбцов из инструкции pyodbc execute ()

from pandas import DataFrame import pyodbc cnxn = pyodbc.connect(databasez) cursor.execute("""SELECT ID, NAME AS Nickname, ADDRESS AS Residence FROM tablez""") DF = DataFrame(cursor.fetchall()) Это нормально для заполнения моего панда DataFrame. Но как мне получить DF.columns = ['ID', 'Nickname', 'Residence'] прямо из курсора ? Эта информация хранится в курсоре вообще?

Как обновить значения в определенной строке в Python DataFrame?

С хорошими методами индексирования в Pandas у меня нет проблем с извлечением данных по-разному. С другой стороны, я все еще смущен тем, как изменять данные в существующем DataFrame. В следующем коде у меня есть два DataFrames, и моя цель – обновить значения в определенной строке в первом df из значений второго df. Как я могу […]

Установка столбцов для пустого кадра данных pandas

Это то, о чем я смущен … import pandas as pd # this works fine df1 = pd.DataFrame(columns=['A','B']) # but let's say I have this df2 = pd.DataFrame([]) # this doesn't work! df2.columns = ['A','B'] # ValueError: Length mismatch: Expected axis has 0 elements, new values have 2 elements Почему это не работает? Что я […]

Логарифмическая доходность в рамке данных pandas

Python pandas имеет функцию pct_change, которую я использую для расчета доходности цен на акции в кадре данных: ndf['Return']= ndf['TypicalPrice'].pct_change() Я использую следующий код для получения логарифмических возвратов, но он дает те же самые значения, что и функция pct.change (): ndf['retlog']=np.log(ndf['TypicalPrice'].astype('float64')/ndf['TypicalPrice'].astype('float64').shift(1)) #np is for numpy

Барная диаграмма с несколькими ярлыками

Следующий код показывает только основные категории ['one', 'two', 'three', 'four', 'five', 'six'] в качестве меток оси x. Есть ли способ показать подкатегорию ['A', 'B', 'C', 'D'] как вторичные метки оси x? df = pd.DataFrame(np.random.rand(6, 4), index=['one', 'two', 'three', 'four', 'five', 'six'], columns=pd.Index(['A', 'B', 'C', 'D'], name='Genus')).round(2) df.plot(kind='bar',figsize=(10,4))

Python Pandas – Удаление нескольких рядов из фрейма данных одной командой

Короче … У меня есть кадр данных Python Pandas, который считывается из файла Excel с помощью «read_table». Я хотел бы сохранить горстку серии из данных и очистить остальные. Я знаю, что могу просто удалить то, что мне не нужно по отдельности, используя «del data ['SeriesName']», но я предпочел бы указать, что сохранить, а не указывать, […]

Python - лучший язык программирования в мире.