Tag: pandas

Как писать в существующий файл excel без нарушения формул с помощью openpyxl?

Когда вы пишете файл excel с Python следующим образом: import pandas from openpyxl import load_workbook book = load_workbook('Masterfile.xlsx') writer = pandas.ExcelWriter('Masterfile.xlsx') writer.book = book writer.sheets = dict((ws.title, ws) for ws in book.worksheets) data_filtered.to_excel(writer, "Main", cols=['Diff1', 'Diff2']) writer.save() Формулы и ссылки на диаграммы, которые находятся в существующих листах, будут сохранены как значения. Как переписать это поведение, […]

Как читать две строки из файла и создавать динамические клавиши в for-loop с помощью python?

В следующих данных я пытаюсь запустить простую марковскую модель. Скажем, у меня есть данные со следующей структурой: pos M1 M2 M3 M4 M5 M6 M7 M8 hybrid_block S1 S2 S3 S4 S5 S6 S7 S8 1 ATTAAGACA|CCGCTTAGA 2 TGCTGTTGT|AATATCAAT 3 CAACAGTCC|GGACGCGCG 4 GTGTATCTG|TCTTTATCT Блок M представляет данные из одного набора catergories, поэтому блокирует S. Данные […]

Заполнить NA Значения в пандах Серия с остановкой

Я анализирую временные ряды и, основываясь на определенных критериях, могу выделить строки, которые являются началом или концом событий. На этом этапе моя серия выглядит примерно так (я не учитывал некоторые повторяющиеся значения для краткости): Настройка import numpy as np import pandas from pandas import Timestamp datadict = {'event': { Timestamp('2010-01-01 00:20:00', tz=None): 'event start', Timestamp('2010-01-01 […]

Парельная матрица из кадра данных pandas

У меня есть фрейм данных pandas, который выглядит примерно так: Al01 BBR60 CA07 NL219 AAEAMEVAT MP NaN MP MP AAFEDLRLL NaN NaN NaN NaN АГААВКГВ НП НН НП НП ADRGLLRDI NaN NP NaN NaN AEIMKICST PB1 NaN NaN PB1 АФДЕРРАГК NaN NaN НП НП АФДЕРРАГК НП NaN NaN NaN Есть тысяча строк и полдюжины столбцов. […]

pandas читает csv с дополнительными запятыми в столбце

Я читаю базовый файл csv, где столбцы разделяются запятыми этими именами столбцов: userid, username, body Однако столбец тела представляет собой строку, которая может содержать запятые. Очевидно, это вызывает проблему, и pandas выдает ошибку: CParserError: Error tokenizing data. C error: Expected 3 fields in line 3, saw 8 Есть ли способ сказать пандам игнорировать запятые в […]

Добавление существующего листа excel с новым фреймворком данных с использованием python pandas

У меня есть этот код. Он работает отлично. Он перебирает файлы excel в папке, удаляет первые 2 строки, затем сохраняет их как отдельные файлы excel, а также сохраняет файлы в цикле в виде добавленного файла. В настоящее время добавленный файл перезаписывает существующий файл каждый раз, когда я запускаю код. Мне нужно добавить новые данные в […]

Сгладить столбец со значением списка типов при одновременном дублировании значения другого столбца в Pandas

Уважаемые власти эксперты Pandas: Я пытаюсь реализовать функцию, чтобы сгладить столбец DataFrame, который имеет элемент списка типов, я хочу для каждой строки данных, где столбец имеет элемент списка типов, все столбцы, но назначенный столбец, который будет сплющен, будет дублируется, тогда как указанный столбец будет иметь одно из значений в списке. Ниже приведены мои требования: input […]

SettingWithCopyWarning, даже при использовании loc (?)

Я получаю ошибки SettingWithCopyWarning в тех случаях, когда я их не ожидал: N.In <38>: # Column B does not exist yet N.In <39>: df['B'] = df['A']/25 N.In <40>: df['B'] = df['A']/50 /Users/josh/anaconda/envs/py27/lib/python2.7/site-packages/pandas/core/indexing.py:389: SettingWithCopyWarning: A value is trying to be set on a copy of a slice from a DataFrame. Try using .loc[row_index,col_indexer] = value instead […]

Pandas plot – изменить основные и второстепенные символы для дат

Я рисую две серии панд. Индекс – это дата (от 1-1 до 12-31) s1.plot() s2.plot() pd.plot () интерпретирует даты и присваивает их значениям оси как таковые: Я хотел бы изменить основные тики, чтобы быть 1-го числа каждого месяца, а второстепенные тики – промежутки между Это работает: %matplotlib notebook import matplotlib as mpl import matplotlib.dates as […]

Проверьте, находится ли строка в кадре данных pandas

Я хотел бы посмотреть, существует ли конкретная строка в определенном столбце в моем фреймворке данных. Я получаю ошибку ValueError: Значение истины серии неоднозначно. Используйте a.empty, a.bool (), a.item (), a.any () или a.all (). import pandas as pd BabyDataSet = [('Bob', 968), ('Jessica', 155), ('Mary', 77), ('John', 578), ('Mel', 973)] a = pd.DataFrame(data=BabyDataSet, columns=['Names', 'Births']) […]

Python - лучший язык программирования в мире.