Tag: pandas

Как сохранить в * .xlsx длинный URL-адрес в ячейке с помощью Pandas

Например, я прочитал файл excel в DataFrame с двумя столбцами (id и URL). URL-адреса во входном файле похожи на текст (без гиперссылок): input_f = pd.read_excel("input.xlsx") Посмотрите, что внутри этого DataFrame – все было успешно прочитано, все URL-адреса в порядке input_f в input_f . После этого, когда я не сохраню этот файл to_excel input_f.to_excel("output.xlsx", index=False) Я […]

Объект DataFrame не имеет атрибута 'sort_values'

dataset = pd.read_csv("dataset.csv").fillna(" ")[:100] dataset['Id']=0 dataset['i']=0 dataset['j']=0 #… entries=dataset[dataset['Id']==0] print type(entries) # Prints <class 'pandas.core.frame.DataFrame'> entries=entries.sort_values(['i','j','ColumnA','ColumnB']) Какая может быть возможная причина следующего сообщения об ошибке в последней строке ?: AttributeError: 'DataFrame' object has no attribute 'sort_values'

AttributeError: объект модуля не имеет атрибута «Серии». Код работает в iPython

Субмодули неявно импортируются и должны быть явно объявлены, но я делаю явный вызов подмодуля pd.Series , не так ли? Независимо от этого, не следует import pandas as pd разрешает pd.Series ? Следующий код работает безупречно в iPython , но не выполняется при выполнении сценария. #!/usr/bin/env/python2.7 # -*- coding: utf-8 -*- import pandas as pd import […]

pandas Диаграмма данных DataFrame

Каков эффективный способ получить диагональ квадрата DataFrame . Я ожидаю, что результатом будет Series с MultiIndex с двумя уровнями, первая из которых является индексом DataFrame вторым уровнем которого являются столбцы DataFrame . Настроить import pandas as pd import numpy as np np.random.seed([3, 1415]) df = pd.DataFrame(np.random.rand(3, 3) * 5, columns = list('abc'), index = list('ABC'), […]

как объединить два столбца с if / else в python pandas?

Я очень новичок в Пандах (т. Е. Менее 2 дней). Однако я не могу представить правильный синтаксис для объединения двух столбцов с условием if / else. Фактически, я выяснил один способ сделать это, используя «zip». Это то, чего я хочу достичь, но, похоже, в пандах может быть более эффективный способ сделать это. Для полноты я […]

Как выполнить итерацию по двум столбцам панды

In [35]: test = pd.DataFrame({'a':range(4),'b':range(4,8)}) In [36]: test Out[36]: ab 0 0 4 1 1 5 2 2 6 3 3 7 In [37]: for i in test['a']: ….: print i ….: 0 1 2 3 In [38]: for i,j in test: ….: print i,j ….: ———————————————————— Traceback (most recent call last): File "<ipython console>", […]

поиск полос в рамке данных панд

У меня есть рамка данных pandas следующим образом: time winner loser stat 1 AB 0 2 CB 0 3 DB 1 4 EB 0 5 FA 0 6 GA 0 7 HA 0 8 IA 1 каждая строка является результатом сопоставления. первый столбец – время матча, второй и третий столбцы содержат победитель / проигравший, а […]

Более эффективный способ очистки столбца строк и добавления нового столбца

У меня есть dataframe df который имеет столбцы ['metric_type', 'metric_value'] . Для каждой строки я хочу убедиться, что у меня есть столбец с именем, равным 'metric_type' и значением для этого столбца, равным 'metric_value' . Одна из моих проблем заключается в том, что 'metric_type' имеет ложные пространства, от которых я хочу избавиться. Рассмотрим dataframe df : […]

Как преобразовать numpy datetime64 в datetime

Я в основном сталкиваюсь с той же проблемой, что и здесь: Преобразование между датами, Timestamp и datetime64 но я не мог найти удовлетворительного ответа от него, мой вопрос, как извлечь datetime из numpy.datetime64 типа: если я попробую: np.datetime64('2012-06-18T02:00:05.453000000-0400').astype(datetime.datetime) это дало мне: 1339999205453000000L мое текущее решение конвертирует datetime64 в строку, а затем снова возвращается к дате. […]

Pandas TimeGrouper и Pivot?

Это выглядит так: Timestamp CAT 0 2016-12-02 23:35:28 200 1 2016-12-02 23:37:43 200 2 2016-12-02 23:40:49 300 3 2016-12-02 23:58:53 400 4 2016-12-02 23:59:02 300 … Это то, что я пытаюсь сделать в Pandas (обратите внимание, что временные метки сгруппированы): Timestamp BINS 200 300 400 500 2016-12-02 23:30 2 0 0 0 2016-12-02 23:40 0 […]

Python - лучший язык программирования в мире.