удаление значений NA из DataFrame в Python 3.4

import pandas as pd import statistics df=print(pd.read_csv('001.csv',keep_default_na=False, na_values=[""])) print(df) 

Я использую этот код для создания фрейма данных, который не имеет значений NA. У меня есть пара CSV-файлов, и я хочу рассчитать среднее значение одного из столбцов – сульфат. В этом столбце есть много значений «NA», которые я пытаюсь исключить. Даже после использования вышеуказанного кода «NA» не исключаются из фрейма данных. Пожалуйста, предложите.

2 Solutions collect form web for “удаление значений NA из DataFrame в Python 3.4”

Способ 1:

  df[['A','C']].apply(lambda x: my_func(x) if(np.all(pd.notnull(x[1]))) else x, axis = 1) 

Использовать pandas notnull

Способ 2:

 df = df[np.isfinite(df['EPS'])] 

Метод 3: Использование dropna Здесь

 In [24]: df = pd.DataFrame(np.random.randn(10,3)) In [25]: df.ix[::2,0] = np.nan; df.ix[::4,1] = np.nan; df.ix[::3,2] = np.nan; In [26]: df Out[26]: 0 1 2 0 NaN NaN NaN 1 2.677677 -1.466923 -0.750366 2 NaN 0.798002 -0.906038 3 0.672201 0.964789 NaN 4 NaN NaN 0.050742 5 -1.250970 0.030561 -2.678622 6 NaN 1.036043 NaN 7 0.049896 -0.308003 0.823295 8 NaN NaN 0.637482 9 -0.310130 0.078891 NaN In [27]: df.dropna() #drop all rows that have any NaN values Out[27]: 0 1 2 1 2.677677 -1.466923 -0.750366 5 -1.250970 0.030561 -2.678622 7 0.049896 -0.308003 0.823295 

Это мой первый ответ на stackoverflow, поэтому, пожалуйста, проигнорируйте, если я ошибаюсь. Я думаю, что вы должны импортировать CSV-файл, как есть, а затем манипулировать фреймом данных. то вы можете использовать любой из приведенных ниже способов.

 foo[foo.notnull()] 

или

 foo.dropna() 

Надеюсь, я помог.

  • Ошибка импорта python "Нет модуля с именем appengine.ext"
  • Преобразование списков в «транспонированный» список
  • Python __subclasses __ () не перечисляет подклассы
  • list.append или list + =?
  • игра тетриса в питоне с использованием pygame
  • Python объединяет два для циклов
  • вставка символов в начале и конце строки
  • Является ли Python подходящим для алгоритмов, ориентированных на научные вычисления?
  • Python - лучший язык программирования в мире.