Tag: unicode

Как исправить ошибку кодирования Unicode с помощью модуля hashlib?

После нескольких поисков я не смог определить, как избежать ошибки: «Unicode-объекты должны быть закодированы до хэширования» при использовании этого кода: pwdinput = input("Now enter a password:") pwd = hashlib.sha1() pwd.update(pwdinput) pwd = pwd.hexdigest() Как я могу пройти мимо этой ошибки? Как вы кодируете Unicode-объекты?

Как сделать Django slugify правильной работой с строками Unicode?

Что я могу сделать, чтобы предотвратить slugify фильтра slugify из алфавитно-цифровых символов, отличных от ASCII? (Я использую Django 1.0.2) В cnprog.com есть URL-адреса китайских символов, поэтому я просмотрел их код. Они не используют slugify в шаблонах, вместо этого они вызывают этот метод в модели Question чтобы получить permalinks def get_absolute_url(self): return '%s%s' % (reverse('question', args=[self.id]), […]

unicode () vs. str.decode () для закодированной байтовой строки utf8 (python 2.x)

Есть ли причина предпочесть unicode(somestring, 'utf8') в противоположность somestring.decode('utf8') ? Моя единственная мысль состоит в том, что .decode() является связанным методом, поэтому python может решить его более эффективно, но исправьте меня, если я ошибаюсь.

Несколько основных вопросов о кодировании, unicode и stdout

Скажем, я это делаю: >>> 'é' #1 '\xc3\xa9' >>> u'é' #2 u'\xe9' >>> print u'é' #3 é Это мое понимание: Когда я вставлял 'é' в мой сеанс Python, bytearray, содержащий 2 байта, каким-то образом попал в stdin , из которого Python читал. Те же байты отправляются в stdout и отображаются в шестнадцатеричной форме. На этот […]

Каков предпочтительный способ включения unicode в исходные файлы python?

При использовании строк юникода в исходном коде, кажется, существует много способов скинуть кошку. Документы и соответствующие PEP имеют много информации о том, что возможно, но скудны в отношении того, что является предпочтительным. Например, следующие кажутся одинаковыми: # coding: utf8 u1 = '\xe2\x82\xac'.decode('utf8') u2 = u'\u20ac' u3 = unichr(0x20ac) u4 = "€".decode('utf8') u5 = u"€" Если […]

Python Unicode, имеет номер юникода в обычной строке, хочет печатать unicode

Я использую IDLE на окнах 7. Когда я запускаю следующий код uni = u"\u4E0D" binary = uni.encode("utf-8") print binary Он правильно печатает символ Юникода с номером 4E0D. Но здесь я должен жестко кодировать номер юникода вручную. Допустим, у меня есть обычная переменная формата строки: s="4E0D" Как преобразовать это в символ Юникода? Т.е. я хочу сделать […]

Почему я не могу ввести японские символы в приглашении в Python3?

Я обычно использую Python 2, но сегодня я работаю с библиотекой для обработки японского текста, который работает только с Python 3. В Python 2 в командной строке без проблем работают следующие вещи: $ python2.7 Python 2.7.8 (default, Nov 3 2014, 13:46:40) [GCC 4.2.1 Compatible Apple LLVM 4.2 (clang-425.0.28)] on darwin Type "help", "copyright", "credits" or […]

Программа Python работает в IDLE, но не в командной строке

Прежде чем кто-нибудь скажет, что это дублированный вопрос, я просто хочу сообщить вам, что ошибка, которую я получаю от запуска этой программы в командной строке, отличается от всех других связанных вопросов, которые я видел. Я пытаюсь запустить очень короткий скрипт в Python from bs4 import BeautifulSoup import urllib.request html = urllib.request.urlopen("http://dictionary.reference.com/browse/word?s=t").read().strip() dhtml = str(html, "utf-8").strip() […]

JSON как строка с unicode для действительного JSON

Я получаю строку, которая похожа на JSON, и я пытаюсь преобразовать ее в действительный JSON, используя python. Это похоже на этот пример, но реальные данные становятся очень длинными: {u'key':[{ u'key':u'object', u'something':u'd\xfcabc', u'more':u'\u2023more', u'boolean':True }] } Таким образом, существует также множество специальных символов, а также «неправильное» логическое значение, которое должно быть только строчными буквами. Я не […]

UnicodeDecodeError: недопустимый стартовый байт

У меня есть быстрый вопрос об UnicodeDecodeError: недопустимый стартовый байт. Я думаю, что где-то в моем тексте есть символ не-UTF-8, но местоположение сообщения об ошибке является отправной точкой для чтения файла, поэтому я не знаю, как его исправить. Если у вас есть какие-либо предложения, просто дайте мне знать Ниже приведено мое сообщение об ошибке, возвращаемое […]

Python - лучший язык программирования в мире.