Tag: unicode

Самый быстрый способ вычеркивания пунктуации из строки юникода в Python

Я пытаюсь эффективно стирать пунктуацию из строки юникода. С помощью регулярной строки использование mystring.translate(None, string.punctuation) , безусловно, является самым быстрым подходом . Однако этот код разбивается на строку юникода в Python 2.7. Как поясняют комментарии к этому ответу , метод перевода может быть реализован, но он должен быть реализован со словарем. Когда я использую эту […]

Python и Unicode: как все должно быть Unicode

Простите, если это длинный вопрос: Я программировал на Python около шести месяцев. Самоучитель, начиная с учебника Python, а затем SO, а затем просто используя Google для других. Вот грустная часть: Никто не сказал мне, что все строки должны быть Unicode. Нет, я не врежу и не делаю это, но где это учить? И большинство примеров […]

Текст в PNG для App Engine (Python)

Примечание. Я перекрестно размещаю это из группы App Engine, потому что у меня нет ответов. В рамках моего сайта о Японии у меня есть функция, в которой пользователь может получить большой PNG для использования в качестве фона рабочего стола, который показывает имя пользователя на японском языке. После полного переключения моего сайта на App Engine я […]

Быстрый способ фильтрации незаконных символов xml unicode в python?

Спецификация XML содержит список символов Unicode, которые либо незаконны, либо «обескуражены». Учитывая строку, как я могу удалить из нее все незаконные символы? Я придумал следующее регулярное выражение, но это немного глоток. illegal_xml_re = re.compile(u'[\x00-\x08\x0b-\x1f\x7f-\x84\x86-\x9f\ud800-\udfff\ufdd0-\ufddf\ufffe-\uffff]') clean = illegal_xml_re.sub('', dirty) (Python 2.5 не знает о символах Unicode выше 0xFFFF, поэтому нет необходимости их фильтровать).

Как исправить ошибку кодирования Unicode с помощью модуля hashlib?

После нескольких поисков я не смог определить, как избежать ошибки: «Unicode-объекты должны быть закодированы до хэширования» при использовании этого кода: pwdinput = input("Now enter a password:") pwd = hashlib.sha1() pwd.update(pwdinput) pwd = pwd.hexdigest() Как я могу пройти мимо этой ошибки? Как вы кодируете Unicode-объекты?

Как сделать Django slugify правильной работой с строками Unicode?

Что я могу сделать, чтобы предотвратить slugify фильтра slugify из алфавитно-цифровых символов, отличных от ASCII? (Я использую Django 1.0.2) В cnprog.com есть URL-адреса китайских символов, поэтому я просмотрел их код. Они не используют slugify в шаблонах, вместо этого они вызывают этот метод в модели Question чтобы получить permalinks def get_absolute_url(self): return '%s%s' % (reverse('question', args=[self.id]), […]

unicode () vs. str.decode () для закодированной байтовой строки utf8 (python 2.x)

Есть ли причина предпочесть unicode(somestring, 'utf8') в противоположность somestring.decode('utf8') ? Моя единственная мысль состоит в том, что .decode() является связанным методом, поэтому python может решить его более эффективно, но исправьте меня, если я ошибаюсь.

Несколько основных вопросов о кодировании, unicode и stdout

Скажем, я это делаю: >>> 'é' #1 '\xc3\xa9' >>> u'é' #2 u'\xe9' >>> print u'é' #3 é Это мое понимание: Когда я вставлял 'é' в мой сеанс Python, bytearray, содержащий 2 байта, каким-то образом попал в stdin , из которого Python читал. Те же байты отправляются в stdout и отображаются в шестнадцатеричной форме. На этот […]

Каков предпочтительный способ включения unicode в исходные файлы python?

При использовании строк юникода в исходном коде, кажется, существует много способов скинуть кошку. Документы и соответствующие PEP имеют много информации о том, что возможно, но скудны в отношении того, что является предпочтительным. Например, следующие кажутся одинаковыми: # coding: utf8 u1 = '\xe2\x82\xac'.decode('utf8') u2 = u'\u20ac' u3 = unichr(0x20ac) u4 = "€".decode('utf8') u5 = u"€" Если […]

Python Unicode, имеет номер юникода в обычной строке, хочет печатать unicode

Я использую IDLE на окнах 7. Когда я запускаю следующий код uni = u"\u4E0D" binary = uni.encode("utf-8") print binary Он правильно печатает символ Юникода с номером 4E0D. Но здесь я должен жестко кодировать номер юникода вручную. Допустим, у меня есть обычная переменная формата строки: s="4E0D" Как преобразовать это в символ Юникода? Т.е. я хочу сделать […]

 
Interesting Posts for Van-Lav

Почему Django ORM позволяет мне опускать параметры для полей NOT NULL при создании объекта?

как получить tbody из таблицы из красивого супа python?

Как продолжить в вложенных циклах в Python

Время простоя при перезагрузке модема mod_wsgi?

Каковы хорошие способы сделать первый код Python первым?

Проблема с администратором Django, регистрирующим встроенный профиль пользователя admin

Если оперативная память не вызывает беспокойства, то читается по очереди быстрее или читает все в ОЗУ и получает к ней доступ? – Python

Что такое «_csv» в Python?

Есть ли способ создания подклассов «на лету»?

Как сравнить два объекта JSON с одинаковыми элементами в другом порядке равными?

Преобразование списка строк в int (или удваивается) в Python

_csv.Error: поле больше предела поля (131072)

Как передать параметр только одной части объекта конвейера в scikit learn?

Как читать / dev / random в python

Приложение Python, которое считывает и записывает в текущий рабочий каталог как .app / exe

Python - лучший язык программирования в мире.