Tag: pandon

Почему выбор YYYY-MM-DD из индекса datetime pandas не ведет себя так, как ожидалось?

У меня есть dataframe, MWE выглядит следующим образом: import pandas as pd from pandas.io.data import get_data_yahoo aapl = get_data_yahoo('AAPL') Затем я могу выбрать год из индекса datetime следующим образом: In [28]: aapl['2010'] Out[28]: Open High Low Close Volume \ Date 2010-01-04 213.429998 214.499996 212.380001 214.009998 123432400 2010-01-05 214.599998 215.589994 213.249994 214.379993 150476200 2010-01-06 214.379993 215.230000 […]

pandas, как получить индекс после использования func pandas.Series.value_counts?

есть мой код .. code_c = data.code.value_counts() print code_c ss = code_c.loc[code_c.values == 15] print ss получить: >>>code_c 600644 16 600101 16 600652 15 600256 15 717 15 600282 15 543 15 709 15 .. 2352 5 2478 5 2379 5 >>>ss 600652 15 600256 15 807 15 600868 15 531 15 795 15 600188 […]

отношение между двумя столбцами Python

Я пытаюсь выяснить, как определить взаимосвязь между двумя столбцами в фреймворке данных. Отношение между элементами и Total. Я хочу выработать сумму Общая сумма для каждого значения «Пункты», где «Элементы» – количество элементов на корзину, а Total – общая сумма / стоимость каждой корзины. Столбцы: Date Time Basket Items Total Мой текущий код Python для получения […]

Ускорение Pandas to_sql ()?

У меня есть 1,000,000 x 50 Pandas DataFrame который я сейчас пишу в таблицу SQL, используя: df.to_sql('my_table', con, index=False) Это занимает невероятно долгое время. Я видел различные объяснения о том, как ускорить этот процесс в Интернете, но никто из них, похоже, не работает для MSSQL. Если я попробую метод в: Массовая вставка Pandas DataFrame с […]

Фильтрация кадра данных pandas с функцией табуляции

Я пытаюсь отфильтровать кадр данных pandas df, содержащий columns A и B с табличной функцией: я хочу сохранить все значения, где значение df.B превышает предел, который зависит от df.A , т.е. df.B>limit[i] где i вычисляется из df.A как i=floor(df.A) . К сожалению, я не настолько опытен в Python. Но мне ясно, что сравнение по элементам […]

Pandas: выберите строку с символами Unicode

Я пытаюсь выбрать строки, указав значение одного из столбцов. Это работает отлично, если выбранное значение является чистым ascii. Если, однако, он содержит символы не-ascii, я не могу заставить его работать независимо от того, как я кодирую значение. Упрощенный пример для иллюстрации проблемы: >>> from __future__ import (absolute_import, division, print_function, unicode_literals) >>> import pandas as pd […]

Объединяет и подводит итог нескольким сериям значений в Pandas

Обычно я использую value_counts() чтобы получить количество вхождений значения. Тем не менее, я имею дело теперь с большими таблицами базы данных (не могу полностью загрузить его в ОЗУ) и запросить данные в долях 1 месяц. Есть ли способ сохранить результат value_counts() и объединить его с / добавить его к следующим результатам? Я хочу подсчитать количество […]

Python: сохранить значение в переменной, чтобы вы могли распознать каждую повторную повторяемость

Если этот вопрос неясен, я очень открыт для конструктивной критики. У меня есть таблица excel с примерно 50 строками данных, причем первый столбец в каждой строке является датой. Мне нужно получить доступ ко всем данным только за одну дату, и эта дата появляется только примерно 1-5 раз. Это самая последняя дата, поэтому я уже организовал […]

Сдерживание струны в пандах

Я пытаюсь создать все строки, в которых company1 в df содержится в company2. Я делаю это следующим образом: df1=df[['company1','company2']][(df.apply(lambda x: x['company1'] in x['company2'], axis=1) == True)] Когда я запускаю вышеприведенную строку кода, он также показывает «Юг», соответствующий «Южному». Кроме того, «Юг» соответствует «Маршруту Юг». Я хочу избавиться от всех подобных случаев. Компания 1 должна содержаться […]

Добавить фрейм данных в цикл for

Если у меня есть фрейм данных pd с тремя столбцами: id , start_time , end_time , и я хотел бы преобразовать его в pd.df с двумя столбцами: id , time например, из [001, 1, 3][002, 3, 4] – [001, 1][001, 2][001, 3][002, 3][002, 4] В настоящее время я использую цикл for и добавляю dataframe на […]

Interesting Posts for Van-Lav
Python - лучший язык программирования в мире.