Удалить символы с подчеркнутыми символами – Python

Я получаю некоторые данные с веб-страницы и читаю их вот так в python

origional_doc = urllib2.urlopen(url).read() 

Иногда этот url имеет символы, такие как é and ä and ect. , как я мог удалить эти символы из строки, прямо сейчас это то, что я пытаюсь,

 import unicodedata origional_doc = ''.join((c for c in unicodedata.normalize('NFD', origional_doc) if unicodedata.category(c) != 'Mn')) 

Но я получаю сообщение об ошибке

 TypeError: must be unicode, not str 

  • Popen.communicate () выбрасывает UnicodeDecodeError
  • Общая поддержка Unicode / UTF-8 для файлов csv в Python 2.6
  • Приблизительно преобразование строки unicode в строку ascii в python
  • Отображение символов юникода с использованием python
  • Как заставить str.translate работать с строками Unicode?
  • Python - как конвертировать Unicode имя файла в CP437?
  • Поддерживает ли python юникод за пределами базовой многоязычной плоскости?
  • Python UnicodeDecodeError - Я неправильно понимаю кодировку?
  • 2 Solutions collect form web for “Удалить символы с подчеркнутыми символами – Python”

    Это должно сработать. Он уничтожит все символы, которые не являются ascii.

      original_doc = (original_doc.decode('unicode_escape').encode('ascii','ignore')) 

    используя re вы можете ввести все символы, которые находятся в определенном шестнадцатеричном диапазоне ascii.

     >>> re.sub('[\x80-\xFF]','','é and ä and ect') ' and and ect' 

    Вы также можете сделать обратное и суб-все, что НЕ в базовых 128 символах:

     >>> re.sub('[^\x00-\x7F]','','é and ä and ect') ' and and ect' 
    Interesting Posts

    Почему os.path.exists («C: \\ windows \\ system32 \\ inetsrv \\ metaback») возвращает False, даже если он существует?

    Какой хороший плагин для анализа данных User-Agent для django

    Python Использование Adblock с Selenium и Firefox Webdriver

    Как сделать пакет python, содержащий только шаблоны jinja

    Могу ли я создать общий многоадресный или список объектов списка в python для многопроцессорности?

    Где можно использовать пакет ANTLR Python для использования StringTemplate?

    Как интерпретировать JavaScript с помощью Python

    шаблон regex в python для анализа тегов заголовков HTML

    Внедрение стандартного вывода другой программы для небуферизации с использованием Python

    Получить html с помощью запросов Python?

    Как сохранить пустое значение как Integerfield

    Команда Tkinter назначить кнопку в цикле с лямбдой

    Как получить код выхода при использовании метода передачи подпроцессов Python?

    Изменения кода Django, не отражающие производственный сервер

    Как я могу программно использовать средство проверки правописания / грамматики Microsoft Word?

    Python - лучший язык программирования в мире.