У меня есть кадр данных с 4 столбцами. ABCD e 2 = <0.1 e 2 = <0.11 e 2 = 0.1 e 2 = 0.1 e 2 = 0.1 e 2 = <0.14 Столбец D имеет некоторые значения с плавающей запятой, начинающиеся с '<', а некоторые без <<. Для строк, которые имеют «<» спереди, я […]
У меня есть коэффициенты калибровки, которые необходимо применять после определенных дат и для определенных диапазонов показаний прибора, т.е. для более высокого показания потребуется другой калибровочный коэффициент. Я пытаюсь применить таблицу поиска, основанную на времени, а также необработанное чтение инструмента с использованием вложенного словаря python. Ниже приведен пример данных, с которыми я работаю: dates = pd.date_range('2013-05-06', […]
У меня есть dataframe, который выглядит следующим образом: <class 'pandas.core.frame.DataFrame'> Int64Index: 198300 entries, 0 to 198299 Data columns (total 3 columns): var 198300 non-null values period 198300 non-null values value 141492 non-null values dtypes: float64(1), object(2) Я хотел бы изменить i из трех столбцов (var, period, value), чтобы иметь все значения переменной периода в виде […]
Я пытаюсь изучить немного PANDAS, и поэтому я просматриваю некоторый R-код и пытаюсь воспроизвести вещи на Python. У меня есть следующий простой пример tempdat <- data.frame(unit=c('feet','feet','feet','feet','metres','metres','metres','metres'), feet=c(50,45,75,60,26,32,40,45)) t.test(feet~unit, alternative='two.sided', conf.level=.95, var.equal=F, data=tempdat) Я хочу сделать эквивалентную функцию в Python, и это то, что у меня есть до сих пор, но результаты разные. tempdat = pd.DataFrame({'unit':['feet','feet','feet','feet','metres','metres','metres','metres'], […]
Трудно узнать все трюки для панд или работать с файлами данных. Поэтому у меня есть df с определенным количеством недель. Я хотел создать таблицу метрик или фреймворк с дополнительными столбцами, добавленными с добавлением последовательных восходящих недель, только заполняя строку до максимального списка недель в столбце «Неделя», Week 0 201152 1 201201 2 201202 3 201203 […]
У меня есть ответы на вопросник, и я начинаю использовать панды для их обработки. Пока это выглядит так: In[1]: questionnaire = pd.DataFrame([{'age': 72, 'sex': 'M'}, {'age': 80, 'sex': 'F'}], index=[np.array(['patient1', 'patient2'])]) questionnaire Out[1]: age sex patient1 72 M patient2 80 F In[2]: questionnaire.groupby('sex').size() Out[2]: sex F 1 M 1 Моя проблема заключается в том, что […]
У меня есть файл, который постоянно растет как это HTTPS | webmail.mahindracomviva.com | заявка / vnd.ms-sync.wbxml | 158 | POST | 203.101.110.171 HTTPS | webmail.mahindracomviva.com || 0 | POST | 203.101.110.171 HTTPS | webmail.mahindracomviva.com || 0 | POST | 203.101.110.171 HTTPS | www.googleapis.com | применение / х-Protobuf | 246 | POST | 74.125.200.95 HTTPS | […]
Я новичок в Pandas и пытаюсь сделать некоторые основные преобразования данных. Один из методов, который я пытался использовать, – groupby , но я не понимаю результат, который я вижу. df = pd.DataFrame({'row': range(10), 'time': range(10), 'machine': ['M1', 'M2', 'M3', 'M1', 'M2', 'M3', 'M1', 'M2', 'M3', 'M1'], 'value1': range(10), 'value2': range(10)}) def func(g): print '—-', type(g) […]
У меня проблема, подобная следующей: создание многострочного графика с помощью Vincent , но я не нашел решение. Я хочу отобразить многострочный график, чтобы получить количество обсуждений, обрабатываемых пользователями, в чат-инструменте для каждого часа дня. Я получил DataFrame со следующим форматом ниже. В левом столбце указаны часы, а каждый столбец – количество обсуждений пользователем за каждый […]
Парсенс csv parser ( http://pandas.pydata.org/pandas-docs/stable/generated/pandas.io.parsers.read_csv.html ) поддерживает различные кодировки: import pandas data = pandas.read_csv(myfile, encoding='utf-8', quotechar='"', delimiter=',') Как реализовать ascii игнорировать случай кодирования для моего фрейма данных? encode('ascii', 'ignore')