Tag: pandas

как установить значения в строки столбца с логической фильтрацией данных

Я пытаюсь установить значения столбца «FreeSec» равным True для фильтрованных строк моего фрейма данных pandas. Вот код: data[data["Brand"].isin(group_clients)].FreeSec = True Однако, когда я проверяю значения, они все равно установлены на False . >>> data[data["Brand"].isin(group_clients)].FreeSec 12 False 163 False 164 False 165 False 166 False 167 False 168 False 169 False Что мне здесь не хватает?

pandas – pivot_table с нечисловыми значениями? (DataError: нет числовых типов для агрегирования)

Я пытаюсь сделать стержень таблицы, содержащей строки в качестве результатов. import pandas as pd df1 = pd.DataFrame({'index' : range(8), 'variable1' : ["A","A","B","B","A","B","B","A"], 'variable2' : ["a","b","a","b","a","b","a","b"], 'variable3' : ["x","x","x","y","y","y","x","y"], 'result': ["on","off","off","on","on","off","off","on"]}) df1.pivot_table(values='result',rows='index',cols=['variable1','variable2','variable3']) Но я получаю: DataError: No numeric types to aggregate . Это работает по назначению, когда я меняю значения результата на числа: df2 = pd.DataFrame({'index' […]

Pandas: вычесть строку из каждого элемента в строке

У меня есть dataframe со строками, индексированными по типу химического элемента и столбцам, представляющим разные образцы. Значения представляют собой float, представляющие степень присутствия элемента строки в каждом образце. Я хочу вычислить среднее значение для каждой строки и вычесть его из каждого значения в этой конкретной строке для нормализации данных и создать новый блок данных этого […]

Как получить доступ к столбцу, имя которого я не могу получить в цепочке

Я предваряю это, сказав, что это игрушечный пример. У меня есть мотивы для этого, поскольку он сидит в середине некоторых других цепных операций. У меня DataFrame что-то вроде df Out[234]: host1 host2 host3 dates 2014-02-02 1 3 4 2014-02-03 5 2 1 2014-02-04 2 5 6 2014-02-05 4 6 1 2014-02-06 3 2 1 Я […]

с питоном, выберите повторяющиеся элементы дольше, чем N

предположим, что у меня есть блок данных следующим образом: df = pd.DataFrame({'A':[1,1,2,3,3,3,3,3,4,4,4,4,4,4,4,5,5,5,5,6,6]}) df Out[1]: A 0 1 1 1 2 2 3 3 4 3 5 3 6 3 7 3 8 4 9 4 10 4 11 4 12 4 13 4 14 4 15 5 16 5 17 5 18 5 19 6 […]

который быстрее загружается: pickle или hdf5 в python

Данный список представляет собой 1,5-гигабайтный список данных для панд. Мне интересно, какой из них лучше подходит для загрузки этих данных: pickle (через cPickle), hdf5 или что-то еще в python? Во-первых, «демпинг» данных в порядке, чтобы занять много времени, я делаю это только один раз. Я также не занимаюсь размером файла на диске. Вопрос: Меня волнует […]

Pandas генерирует столбцы из одного столбца строк

У меня есть файл csv, который выглядит следующим образом: index,labels 1,created the tower 2,destroyed the tower 3,created the swimming pool 4,destroyed the swimming pool Теперь, если я передаю список столбцов, которые я хочу вместо столбца меток (не содержит всех слов в столбцах меток) ['created','tower','destroyed','swimming pool'] Я хочу получить dataframe как: index,created,destroyed,tower,swimming pool 1,1,0,1,0 2,0,1,1,0 3,1,0,0,1 […]

ImportError: невозможно импортировать имя 'PandasError'

Я очень новичок в Python 3x, работая на Mac. В настоящее время с помощью учебника sentdex для python с финансами, попробовал запустить следующий скрипт: import datetime as dt import matplotlib.pyplot as plt from matplotlib import style import pandas as pd import pandas_datareader.data as web style.use('ggplot') start = dt.datetime(2000,1,1) end = dt.datetime(2016,12,31) df = web.DataReader('TSLA', 'yahoo', […]

Объект 'module' не имеет атрибута 'DataFrame'

Для следующего кода: df = pd.DataFrame(np.random.rand(12,2), columns=['Apples', 'Oranges'] ) df['Categories'] = pd.Series(list('AAAABBBBCCCC')) pd.options.display.mpl_style = 'default' df.boxplot(by='Categories') Я получаю сообщение об ошибке: 'module' object has no attribute 'DataFrame'. Любые идеи о том, что происходит и как решить эту проблему?

pandas to_sql все столбцы как nvarchar

У меня есть кадр данных pandas, который динамически создается с именами столбцов, которые различаются. Я пытаюсь подтолкнуть их к sql, но не хочу, чтобы они переходили в mssqlserver как «тип текста» по умолчанию (может ли кто-нибудь объяснить, почему это значение по умолчанию? Не имеет смысла использовать более распространенный тип данных? ) Кто-нибудь знает, как я […]

 
Interesting Posts for Van-Lav

Возвращаемое значение при использовании cProfile

Создайте рамку данных pandas и получите несегментные столбцы в виде серии

Оптимальные методы импорта Python (и Django)

усредняя каждые пять минут данные как один набор данных в кадре данных панд

как заменить все вхождения определенных символов?

Распределенный TensorFlow – Не работает некоторые рабочие

: записывать даты по оси x

Django 1.9 не может найти newapp

Как разместить структуру данных, например, json для фляжки?

SymPy: Как вернуть выражение в терминах других выражений (выражений)?

Учебники по оптимизации нетривиальных приложений Python с расширениями C или Cython

Запоминание, когда аргументы могут быть очень большими

Как разбить текст без пробелов в список слов?

Как правильно печатать:

Элегантный способ удаления элементов в списке, которые не имеют подстрок, которые отображаются в другом списке

Python - лучший язык программирования в мире.