Tag: dataframe

Реструктуризация Dataframe в Python

Я собрал данные из предпоследнего рабочего листа в этом файле Excel вместе со всеми данными последнего листа с «лет созревания», начиная с 5.5. У меня есть код, который делает это. Тем не менее, теперь я ищу для реструктуризации DataFrame, так что он имеет следующие столбцы и я изо всех сил стараюсь сделать это: Мой код […]

вызывающая функция с данными dataframe дает ошибку (не может преобразовать серию в <class 'float'>)

У меня есть модель ценообразования опционов (очень простая Black Scholes), которая отлично работает с данными таким образом: In [18]: BS2(100.,100.,1.,.001,.3) Out[18]: 11.96762435837207 функция здесь: Black Sholes Function def BS2(S,X,T,r,v): d1 = (log(S/X)+(.001+v*v/2)*T)/(v*sqrt(T)) d2 = d1-v*sqrt(T) return (S*CND(d1)-X*exp(-.001*T)*CND(d2)) Я не думаю, что это важно для этого вопроса, но BS2 называет это: Cumulative normal distribution function def […]

Pandas DataFrame получает подстроки из столбца

Например, у меня есть столбец с именем «KL»: sem_0405M4209F2057_1.000 sem_A_0103M5836F4798_1.000 Теперь я хочу извлечь четыре цифры после «M» и четыре цифры после «F». Но с df["KL"].str.extract я не могу заставить его работать. Места расположения M и F меняются, поэтому просто использование среза [9:13] не будет работать для полного столбца.

Ошибка во время итерации в строках данных

Я пытаюсь определить местоположение, учитывая широту и долготу, которые у меня есть в dataframe: lat long 40.712784 -74.005941 55.755826 37.617300 41.902783 12.496366 Я использую геофизическую библиотеку, и я хотел бы сохранить места поиска в новом третьем столбце существующего фреймворка данных. иметь что-то вроде: lat long location 40.712784 -74.005941 New-York 55.755826 37.617300 Moscow 41.902783 12.496366 Rome […]

Pandas: применение кумулятивных функций

Рассмотрим простой пример dataframe с использованием pandas : df = pd.DataFrame({'x' : [10, 20, 30, 40]}, index = ['0','1','2', '3']) Это дает следующее: index x 0 10 1 20 2 30 3 40 Я пытаюсь принять значения x и для каждой строки выдает результат (через lambda ), который также использует расчет предыдущей строки. То есть, […]

Построить запрос URL из базы данных pandas

Возьмем рамку данных панды вида: fname lname age mark trumb 34 samb jones 26 Я хотел бы построить запрос url с помощью модуля запросов. Обычно я бы построил url так: payload = {'key1':'value1','key2':'value2'} headers = {'content-type': 'application'} base_url = 'https://website.com/' req = requests.post(base_url,headers=headers,params=payload) Как бы я лучше всего использовал это, чтобы столбцы dataframe стали ключами, […]

pandas – resample – upsampling перед понижающей дискретизацией

У меня есть кадр данных pandas с информацией о разных временных масштабах, то есть для некоторых периодов у меня есть 100 точек данных в секунду, а для других периодов у меня есть 1 точка данных каждую минуту. Моя цель состоит в том, чтобы повторно сменить этот фрейм данных с фиксированным временным окном (например: 1 секунду), […]

Фильтрация данных и перезаписи Pandas не изменяет размер кадра данных

Я пытаюсь выполнить те же операции (фильтрацию) на двух фреймах данных, но по какой-то причине эти данные не изменяются. Я подозреваю, что это связано с представлением и копией проблемы с файловой рамкой, но я не смог найти ответ, который работал для его исправления. Вот упрощенный код, воспроизводящий проблему: In [1]: import pandas as pd df1 […]

Как итерация столбца DataFrame символов запаса и добавить столбец с ценой акции?

У меня есть dataframe с столбцом индекса, являющимся символами запаса. Мой вопрос: как я прокручиваю список символов запаса и добавляю столбец в dataframe с ценой акций для каждого символа? Вот где мой разум пошел … import pandas as pd from pandas import DataFrame from matplotlib import pyplot as plt import pandas.io.data as web import datetime […]

Pandas: первое поле datetime автоматически преобразуется в тип метки времени

При создании объекта dataframe pandas (python 2.7.9, pandas 0.16.2) первое поле datetime автоматически преобразуется в метку времени pandas. Зачем? Можно ли предотвратить это, чтобы сохранить поле в исходном типе? См. Код ниже: import numpy as np import datetime import pandas создать dict: x = {'cusip': np.array(['10553M10', '67085120', '67085140'], dtype='|S8'), 'vstart':np.array([datetime.datetime(2001, 11, 16, 0, 0), datetime.datetime(2012, […]

Python - лучший язык программирования в мире.