Как удалить стоп-слова с помощью nltk или python

Поэтому у меня есть набор данных, который я бы хотел удалить из слов остановки

stopwords.words('english') 

Я изо всех сил пытаюсь использовать это в своем коде, чтобы просто вынести эти слова. У меня уже есть список слов из этого набора данных, часть, с которой я борюсь, сравнивается с этим списком и удаляет стоп-слова. Любая помощь приветствуется.

  • Можно ли запускать python SimpleHTTPServer только на localhost?
  • Как определить и удалить деревья трассировки из nltk.trees?
  • Как мне перебирать список Python по двум?
  • Обнаруживать, пересекаются ли куб и конус друг с другом?
  • Автоматически воспроизводить звук в ноутбуке IPython
  • Расшифровать файлы cookie с расширением Chrome BLOB в Python
  • Многопроцессорность Python Pool.apply_async с общими переменными (значение)
  • Python с поддержкой нефатальных отказов
  • 5 Solutions collect form web for “Как удалить стоп-слова с помощью nltk или python”

     from nltk.corpus import stopwords # ... filtered_words = [word for word in word_list if word not in stopwords.words('english')] 

    Вы также можете выполнить набор diff, например:

     list(set(nltk.regexp_tokenize(sentence, pattern, gaps=True)) - set(nltk.corpus.stopwords.words('english'))) 

    Я полагаю, у вас есть список слов (word_list), из которых вы хотите удалить стоп-слова. Вы могли бы сделать что-то вроде этого:

     filtered_word_list = word_list[:] #make a copy of the word_list for word in word_list: # iterate over word_list if word in stopwords.words('english'): filtered_word_list.remove(word) # remove word from filtered_word_list if it is a stopword 

    вы можете использовать эту функцию, вы должны заметить, что вам нужно опустить все слова

     from nltk.corpus import stopwords def remove_stopwords(word_list): processed_word_list = [] for word in word_list: word = word.lower() # in case they arenet all lower cased if word not in stopwords.words("english"): processed_word_list.append(word) return processed_word_list 
      import sys print ("enter the string from which you want to remove list of stop words") userstring = input().split(" ") list =["a","an","the","in"] another_list = [] for x in userstring: if x not in list: # comparing from the list and removing it another_list.append(x) # it is also possible to use .remove for x in another_list: print(x,end=' ') # 2) if you want to use .remove more preferred code import sys print ("enter the string from which you want to remove list of stop words") userstring = input().split(" ") list =["a","an","the","in"] another_list = [] for x in userstring: if x in list: userstring.remove(x) for x in userstring: print(x,end = ' ') #the code will be like this 
    Python - лучший язык программирования в мире.