Tag: pandas

pandas read_csv import дает смешанный тип для столбца

У меня есть файл csv, содержащий 130 000 строк. После чтения в файле с использованием функции read_csv pandas один из столбцов («CallGuid») имеет смешанные типы объектов. Я сделал: df = pd.read_csv("data.csv") Тогда у меня есть следующее: In [10]: df["CallGuid"][32767] Out[10]: 4129237051L In [11]: df["CallGuid"][32768] Out[11]: u'4129259051' Все строки <= 32767 имеют тип long и все […]

Нет имен столбцов в pandas python

Основной вопрос о кадре данных панд. У меня есть 1×1 dataframe с datapoint и нет заголовков столбцов (в настоящее время). df[0,0] не работает, потому что я думаю, что он ожидает имя столбца. Кроме того, df.0 не работает ни df[0,''] . df.ix[0,0] действительно работает. В общем, мне нужно иметь имя столбца? Лучше ли использовать имена столбцов […]

Ускорить подсчет близлежащих групп?

У меня есть кадр данных, который содержит идентификатор группы, две меры расстояния (измерение долготы / широты) и значение. Для данного набора расстояний я хочу найти количество других групп поблизости и средние значения этих других групп поблизости. Я написал следующий код, но он настолько неэффективен, что он просто не завершается в разумные сроки для очень больших […]

Прокачка панд применяется с отсутствующими данными

Я хочу сделать скользящее вычисление по отсутствующим данным. Пример кода: (Для простоты я приведу пример скользящей суммы, но я хочу сделать что-то более общее). foo = lambda z: z[pandas.notnull(z)].sum() x = np.arange(10, dtype="float") x[6] = np.NaN x2 = pandas.Series(x) pandas.rolling_apply(x2, 3, foo) который производит: 0 NaN 1 NaN 2 3 3 6 4 9 5 […]

Anti-Join Pandas

У меня есть две таблицы, и я хотел бы добавить их так, чтобы сохранялись только все данные в таблице A, а данные из таблицы B добавляются только в том случае, если ее ключ уникален (значения ключа уникальны в таблице A и B, однако в некоторых случаях Ключ будет встречаться как в таблицах А, так и […]

почему в DataFrame намного эффективнее, чем на базовом массиве numpy?

Я заметил, что использование len в DataFrame намного быстрее, чем использование len в базовом массиве numpy. Я не понимаю, почему. Доступ к одной и той же информации с помощью shape тоже не помогает. Это более актуально, поскольку я пытаюсь получить число столбцов и количество строк. Я всегда обсуждал, какой метод использовать. Я собрал следующий эксперимент, […]

Есть ли операция «ungroup by» напротив группы в пандах?

Предположим, что мы начинаем с этой простой таблицы, хранящейся в кадре данных pandas: name age family 0 john 1 1 1 jason 36 1 2 jane 32 1 3 jack 26 2 4 james 30 2 Тогда я group_df = df.groupby('family') group_df = group_df.aggregate({'name': name_join, 'age': pd.np.mean}) где name_join – простая агрегирующая функция для имен: […]

Slice pandas DataFrame на уровне MultiIndex или на уровне подуровня

Вдохновленный этим ответом и отсутствием легкого ответа на этот вопрос, я обнаружил, что написание небольшого синтаксического сахара облегчает фильтрацию на уровне MultiIndex. def _filter_series(x, level_name, filter_by): """ Filter a pd.Series or pd.DataFrame x by `filter_by` on the MultiIndex level `level_name` Uses `pd.Index.get_level_values()` in the background. `filter_by` is either a string or an iterable. """ if […]

Как читать текстовый файл формата ширины фиксированной ширины в пандах

Я просто получил свои руки на панды и выяснял, как я могу прочитать файл. Файл находится из базы данных WRDS и является списком составляющих SP500 вплоть до 1960-х годов. Я проверил файл и независимо от того, что я делаю, чтобы импортировать его с помощью «read_csv», я все еще не могу правильно отобразить данные. df = […]

Julia Dataframes vs Python pandas

В настоящее время я использую pandon pandas и хочу знать, есть ли способ вывода данных из pandas в julia Dataframes и наоборот. (Я думаю, что вы можете вызвать python от Julia с Pycall но я не уверен, работает ли он с dataframes). Есть ли способ вызвать Julia из python и взять его в panda ? […]

Python - лучший язык программирования в мире.