Tag: pandas

Преобразование datetime.datetime объекта в дни с эпохи в Python

У меня есть объект pandas.Series который может выглядеть так: import pandas as pd myVar = pd.Series(["VLADIVOSTOK 690090", "MAHE", NaN, NaN, "VLADIVOSTOK 690090", "2000-07-01 00:00:00"]) myVar[5] анализируется как объект datetime.datetime когда данные считываются в Python через pandas . Я предполагаю, что преобразование этого значения в число дней, прошедших с эпохи (36708), совсем не сложно. Я просто […]

Как изменить форму данных

Мне нужно изменить форму данных следующим образом: nam code date1 date2 0 a 1 1/1 1/2 1 b 3 3/4 4/5 но df.stack кажется бесполезным в этой ситуации. Желаемый результат: nam code date 0 a 1 1/1 1 a 1 1/2 2 b 3 3/4 3 b 3 4/5

Python Pandas – читать файл csv, содержащий несколько таблиц

У меня есть один .csv файл, содержащий несколько таблиц. Используя Pandas, какова была бы лучшая стратегия для получения двух данных DataFrame и HPBladeSystemRack из этого одного файла? Вход .csv выглядит следующим образом: Inventory System Name IP Address System Status dg-enc05 Normal dg-enc05_vc_domain Unknown dg-enc05-oa1 172.20.0.213 Normal HP BladeSystem Rack System Name Rack Name Enclosure Name […]

Обнаружение дубликатов в определенных столбцах в операциях DataFrame & Perform на этих

Следуя этому вопросу, вот вход / выход, который я хочу. У меня есть некоторые идеи, хотя и не совсем уверенные. Как я обнаруживаю дубликаты, а затем между ними перекрестно проверяет, имеют ли два столбца одинаковые значения? Поэтому у меня есть такой фрейм данных. No fname sname landline address time_of_move_in 1 Alphred Thomas 123 A 19/10/2016,00:01:00 […]

Как я нахожу медианное использование панд в наборе данных?

У меня есть данные данных данных, которые содержат 3 столбца – дату, сегмент и метрику. Я делаю следующее: data = pandas.read_csv("Filename.csv") ave = data.groupby('Segment').mean() #works ave = data.groupby('Segment').median() #gives error ave['median'] = data.groupby('Segment').median() Traceback (most recent call last): File "<input>", line 1, in <module> File "/usr/lib/pymodules/python2.7/pandas/core/frame.py", line 1453, in __setitem__ self._set_item(key, value) File "/usr/lib/pymodules/python2.7/pandas/core/frame.py", line […]

Добавление значений в pandas dataframe с функцией, основанной на другом столбце в dataframe

Это похоже на много вопросов SO, но я их на самом деле не нашел; если он здесь, пожалуйста, не стесняйтесь ссылаться, и я удалю. У меня есть два кадра данных. Первый выглядит так: owned category weight mechanics_split 28156 Environmental, Medical 2.8023 [Action Point Allowance System, Co-operative P… 9269 Card Game, Civilization, Economic 4.3073 [Action Point […]

Pandas: Каковы случаи, когда count, возвращаемый DataFrame, описывается как плавающая точка

При описании моего фрейма данных Pandas: я получаю следующий результат: Mains_1_Power Mains_2_Power count 17.000000 17.000000 mean 57.063528 200.428607 std 67.605151 69.364919 min 11.015203 135.492259 25% 31.850638 161.546607 50% 35.871114 183.986024 75% 56.419915 210.772911 max 312.787603 446.077603 Я не понимаю случаи, когда счетчик должен быть плавающим, у нас есть половина записей? Если count всегда является целым […]

Преобразование данных JSON из pandas в определенную схему / формат JSON в python

У меня есть некоторые данные JSON в python, которые выглядят так: >>> print name_frame … name name1 name2 name3 name4 Micro inc. NaN Jim D Susan A NaN NaN Vitacore Billy B NaN Sally Q Mark G NaN >>> payload = name_frame.apply(lambda x: [x.dropna()], axis=1).to_json(force_ascii=False) … >>> print payload … { "Micro inc.":[{"name1":"Jim D","name2":"Susan A"}], […]

Как применить tz_convert с различными часовыми поясами к различным строкам в pandas dataframe

Я пытаюсь установить различные временные интервалы для различных строк в кадре данных Pandas на основе критерия. Как MWE, вот что я пробовал: test = pd.DataFrame( data = pd.to_datetime(['2015-03-30 20:12:32','2015-03-12 00:11:11']) ,columns=['time'] ) test['new_col']=['new','old'] test.time=test.set_index('time').index.tz_localize('UTC') test.loc[test.new_col=='new','time']=test[test.new_col=='new'].set_index('time').index.tz_convert('US/Pacific') print test Результат этого: time new_col 0 1427746352000000000 new 1 2015-03-12 00:11:11+00:00 old Как вы можете видеть, строка с обновленным […]

Пользовательский формат времени Python Pandas в выводе Excel

Я использовал pandas.groupby для группировки pandas DataFrame на двух столбцах и вычисления среднего и среднего времени. Мой итоговый набор данных выглядит примерно так: Size Category Average Time Median Time 1 A 0.002056385 0.000310995 B 0.000310995 C 0.000310995 10 A 0.001852681 B 0.000310995 C 0.000310995 Я хотел бы экспортировать эту таблицу, чтобы Excel и форматировать столбцы […]

Interesting Posts

Совместное использование примитива синхронизации многопроцессорности через процессы

Почему вы должны вызывать .iteritems () при итерации по словарю в python?

Предотвращение запуска команд управления несколькими экземплярами одновременно

Действительный JSON, дающий JSONDecodeError: Ожидание, разделитель

Как используется возвращаемое значение __hash__?

TensorFlow для двоичной классификации

Повторно открыть файлы в Python?

Вывод netcdf4 для подмножества lat lon

Любой метод функционального программирования для перемещения вложенного словаря?

Как читать файл в обратном порядке в python3.2 без чтения всего файла в память?

BeautifulSoup: получить содержимое конкретной таблицы

Добавить метки времени в python

Как структурировать данные, чтобы легко создавать таблицы HTML в Flask

Чтение / разбор файлов Excel (xls) с помощью Python

Как вызвать себя в макет методе объекта в Python?

Python - лучший язык программирования в мире.