Tag: dataframe

Панды – присоединиться к временной близости

У меня есть 2 left_df , left_df и right_df , каждый из которых имеет столбец, соответствующий дате времени. Я хочу присоединиться к ним таким образом, что для каждой строки R в left_df я нахожу строку в right_df которая ближе всего к R из всех строк в right_df , и складывает их. Я не знаю, была […]

Как выбрать наблюдения df, используя атрибуты индекса даты и времени в Pandas?

Учитывая такой df, где у нас есть индекс DateTime: DateTime A 2007-08-07 18:00:00 1 2007-08-08 00:00:00 2 2007-08-08 06:00:00 3 2007-08-08 12:00:00 4 2007-08-08 18:00:00 5 2007-11-02 18:00:00 6 2007-11-03 00:00:00 7 2007-11-03 06:00:00 8 2007-11-03 12:00:00 9 2007-11-03 18:00:00 10 Я хотел бы подмножество наблюдений с использованием атрибутов индекса, например: Первый рабочий день месяца […]

Чтение CSV-файла в Pandas Dataframe с недопустимыми символами (акцентами)

Я пытаюсь прочитать файл csv в кадре данных pandas. Однако, csv содержит акценты. Я использую Python 2.7 Я столкнулся с UnicodeDecodeError потому что в первом столбце есть акцент. Я прочитал кучу сайтов, таких как этот вопрос о UTF-8 в файлах CSV , это сообщение в блоге о ошибках CSV, связанных с новостями , и это […]

Как отсортировать Dataframe с помощью ocurrences в столбце в Python (pandas)

Я пытаюсь создать dataframe из моих данных (оценки между химическими веществами и белками) с пандами в python. Я хочу, чтобы в моем фреймворке сначала отображались белки, у которых больше всего случаев, поэтому я ранее отсортировал свои данные. Но когда я делаю dataframe, он не получает ожидаемого результата. Вот пример моих данных: chemicals prots scores CID000000006 […]

Pandas – создание нескольких столбцов, похожих на pd.get_dummies

Скажем, мои данные выглядят так: df = pd.DataFrame({'color': ['red', 'blue', 'green', 'red', 'blue', 'blue'], 'line': ['sunday', 'sunday', 'monday', 'monday', 'monday', 'tuesday'], 'group': ['1', '1', '2', '1', '1', '1'], 'value': ['a', 'b', 'a', 'c', 'a', 'b']}) color group line value 0 red 1 sunday a 1 blue 1 sunday b 2 green 2 monday a 3 […]

python pandas новая строка, прикрепленная к последней в csv при использовании to_csv в режиме добавления

Я пытаюсь добавить новую строку к данным в файле csv. Пока данные добавляются, вместо того, чтобы вставляться в следующую строку, он добавляется в конец предыдущей строки. В настоящее время мой код проблемы выглядит так: qlist = list(data) entries = [response, 0,0,0,0] df = pd.DataFrame([entries], columns=qlist) df.to_csv('data.csv', index=False, header=False, mode='a') Когда это выполняется, переменная «response» заканчивается […]

Присоединение к данным Pandas Dataframes по общим индексам

У меня есть 3 DataFrames которые имеют разное количество разделяемых индексов. Например: >>> df0=pd.DataFrame(index=pd.MultiIndex.from_product([[1,2,3,4],[2011,2012],['A','B']], names=['Season','Year','Location'])) >>> df0['Value0']=np.random.randint(1,100,len(df0)) >>> >>> df1=pd.DataFrame(index=pd.MultiIndex.from_product([[2011,2012],['A','B']], names=['Year','Location'])) >>> df1['Value1']=np.random.randint(1,100,len(df1)) >>> >>> df2=pd.DataFrame(index=['A','B']) >>> df2.index.name='Location' >>> df2['Value2']=np.random.randint(1,100,len(df2)) >>> df0 Value0 Season Year Location 1 2011 A 18 B 63 2012 A 88 B 30 2 2011 A 35 B 60 2012 A […]

Pandas DataFrame медленно показывает форму или типы

Я очень новичок в python и pandas . Любые рекомендации, комментарии и предложения оценены! Вот моя проблема: для возврата результата требуется несколько минут, после вызова df.shape или df.dtypes . DataFrame имеет 1 610 658 строк и 5 столбцов. Три столбца хранятся как int64 , один – как float64 , а один – как datetime64 . […]

pandas value_counts () с несколькими значениями в форме списка?

Я пытаюсь сделать value_count для определенного столбца в моем фрейме данных Например: <Fruit> 0 'apple' 1 'apple, orange' 2 'orange' Как я могу его суммировать, чтобы он учитывал это, даже если он в списке? Таким образом, вышеизложенное должно дать мне: 'Apple' 2 'Orange' 2 Я попытался превратить строку в список, но не уверен, как value_count […]

Как скопировать строку из одного блока данных pandas в другой фрейм данных pandas?

У меня есть dataframe данных, которые я пытаюсь добавить в другой фрейм. Я пробовал различные способы с .append (), и не было успешного пути. Когда я печатаю данные из iterrows. Я предоставляю 2 возможных способа, чтобы попытаться решить проблему ниже, один создает ошибку, другой не заполняет dataframe чем-либо. Рабочий процесс, который я пытаюсь создать, – […]

Interesting Posts for Van-Lav
Python - лучший язык программирования в мире.