Tag: pandas

pandas 3×3 рассеянная матрица отсутствует ярлыки

Я создаю матрицу рассеяния панды, используя следующий код: import numpy as np import pandas as pd a = np.random.normal(1, 3, 100) b = np.random.normal(3, 1, 100) c = np.random.normal(2, 2, 100) df = pd.DataFrame({'A':a,'B':b,'C':c}) pd.scatter_matrix(df, diagonal='kde') Это приводит к следующей матрице рассеяния: В первой строке нет ярких меток, 3-й столбец без ярлыков, 3-й элемент «C» […]

Загрузка данных из Yahoo! Финансы с пандами

Я работаю через книгу Wes McKinney Python для анализа данных и на стр. 139 в разделе «Корреляция и ковариация», я получаю сообщение об ошибке, когда пытаюсь запустить его код для получения данных из Yahoo! Финансы. Вот что я запускаю: #CORRELATION AND COVARIANCE import pandas.io.data as web all_data = {} for ticker in ['AAPL', 'IBM', 'MSFT', […]

Почему pandas '==' отличается от '.eq ()'

Рассмотрим ряд s s = pd.Series([(1, 2), (3, 4), (5, 6)]) Это так, как ожидалось s == (3, 4) 0 False 1 True 2 False dtype: bool Это не s.eq((3, 4)) ————————————————————————— ValueError Traceback (most recent call last) ValueError: Lengths must be equal Я был в предположении, что они были такими же. В чем разница […]

Pandas df.to_csv ("file.csv" encode = "utf-8") все еще дает символы мусора для знака минус

Я прочитал кое-что о ограничении Python 2 в отношении Pandas 'to_csv (… и т. Д.). Я ударил его? Я на Python 2.7.3 Это оказывается символами корзины для ≥ и – когда они появляются в строках. Помимо этого, экспорт совершенен. df.to_csv("file.csv", encoding="utf-8") Есть ли обходной путь? df.head (): demography Adults ≥49 yrs Adults 18−49 yrs at […]

Простая настройка диаграммы matplotlib / pandas (метки, тики и т. Д.)

Я новичок в matplotlib, и я пытаюсь использовать его в pandas для построения некоторых простых диаграмм. У меня есть DataFrame, который содержит две метки «score» и «person», полученные из другого DF. df1 = DataFrame(df, columns=['score','person']) Производя этот вывод: Я пытаюсь создать простую гистограмму, чтобы показать каждого человека разного цвета, и это то, что у меня […]

Неожиданные результаты методов min () и max () серии Pandas из объектов Timestamp

Я столкнулся с этим поведением при выполнении основных манипуляций с данными, как в этом примере: In [55]: import pandas as pd In [56]: import numpy as np In [57]: rng = pd.date_range('1/1/2000', periods=10, freq='4h') In [58]: lvls = ['A','A','A','B','B','B','C','C','C','C'] In [59]: df = pd.DataFrame({'TS': rng, 'V' : np.random.randn(len(rng)), 'L' : lvls}) In [60]: df Out[60]: […]

Настройка цвета фона в Seaborn

Я использую Seaborn для составления некоторых данных в Pandas. Я делаю очень большие сюжеты ( factorplot s). Чтобы увидеть их, я использую некоторые средства визуализации в своем университете. Я использую экран Compound, состоящий из 4-х мониторов с небольшим (но отличным от нуля) скосом – зазор между экранами. Этот пробел черный. Чтобы свести к минимуму разрыв […]

Использование str.contains в pandas dataframe

Этот код pandas python генерирует сообщение об ошибке, "TypeError: неправильный тип операнда для унарного ~: 'float'" Я не знаю, почему, потому что я пытаюсь манипулировать объектом str df_Anomalous_Vendor_Reasons[~df_Anomalous_Vendor_Reasons['V'].str.contains("File*|registry*")] #sorts, leaving only cases where reason is NOT File or Registry У кого-нибудь есть идеи?

Слияние Pandon Pandas, вызывающее переполнение памяти

Я новичок в Pandas и пытаюсь объединить несколько подмножеств данных. Я даю конкретный случай, когда это происходит, но вопрос общий: как / почему это происходит и как я могу обойти это? Данные, которые я загружаю, составляют около 85 мегабайт или около того, но я часто наблюдаю, как мой сеанс python приближается к 10 гигабайтам памяти, […]

Сумма нескольких столбцов из кадра данных pandas

Поэтому скажите, что у меня есть следующая таблица: In [2]: df = pd.DataFrame({'a': [1,2,3], 'b':[2,4,6], 'c':[1,1,1]}) In [3]: df Out[3]: abc 0 1 2 1 1 2 4 1 2 3 6 1 Я могу суммировать a и b следующим образом: In [4]: sum(df['a']) + sum(df['b']) Out[4]: 18 Однако это не очень удобно для более […]

Python - лучший язык программирования в мире.