Tag: unicode

Как обрабатывать строку ASCII как unicode и unescape экранированные символы в ней в python?

Например, если у меня есть строка в Юникоде , я могу кодировать ее как строку ASCII, например: >>> u'\u003cfoo/\u003e'.encode('ascii') '<foo/>' Однако у меня есть, например, эта строка ASCII : '\u003foo\u003e' … что я хочу превратить в ту же строку ASCII, что и в моем первом примере выше: '<foo/>'

Ошибка Unicode.

Нечетная ошибка с unicode для меня. Я имел дело с unicode в порядке, но когда я запустил это сегодня утром один пункт u '\ u201d' дал ошибку и дал мне UnicodeError: ASCII encoding error: ordinal not in range(128) Я искал код и, по-видимому, его utf-32, но когда я пытаюсь его декодировать в интерпретаторе: c = […]

Как преобразовать строку в utf-8 в Python

У меня есть браузер, который отправляет символы utf-8 на мой сервер Python, но когда я извлекаю его из строки запроса, кодировка, возвращаемая Python, является ASCII. Как преобразовать обычную строку в utf-8? ПРИМЕЧАНИЕ. Строка, переданная из Интернета, уже закодирована в кодировке UTF-8, я просто хочу, чтобы Python рассматривал ее как UTF-8, а не ASCII.

Что означает «u» в списке?

Это первый раз, когда я столкнулся с этим. Просто напечатайте список, и каждый элемент, кажется, имеет u перед ним, т.е. [u'hello', u'hi', u'hey'] Что это значит и почему список должен иметь это перед каждым элементом? Поскольку я не знаю, насколько это распространено, если вы хотите увидеть, как я натолкнулся на это, я с удовольствием отредактирую […]

Кодек UCS-2 не может кодировать символы в позиции 1050-1050

Когда я запускаю свой код Python, я получаю следующие ошибки: File "E:\python343\crawler.py", line 31, in <module> print (x1) File "E:\python343\lib\idlelib\PyShell.py", line 1347, in write return self.shell.write(s, self.tags) UnicodeEncodeError: 'UCS-2' codec can't encode characters in position 1050-1050: Non-BMP character not supported in Tk Вот мой код: x = g.request('search', {'q' : 'TaylorSwift', 'type' : 'page', 'limit' […]

латинский-1 до ascii

У меня строка unicode с акцентированными латинскими символами, например n=unicode('Wikipédia, le projet d'encyclopédie','utf-8') Я хочу преобразовать его в простой ascii, т. Е. «Википедия, le projet dencyclopedie», поэтому все острые / акцент, cedilla и т. Д. Должны быть удалены Каков самый быстрый способ сделать это, поскольку это необходимо для сопоставления выпадающего списка длинной автозаполнения Заключение. Как […]

Python не сортирует unicode правильно. Strcoll не помогает

У меня проблема с сортировкой списков, используя сортировку юникодов в Python 2.5.1 и 2.6.5 на OSX, а также на Linux. import locale locale.setlocale(locale.LC_ALL, 'pl_PL.UTF-8') print [i for i in sorted([u'a', u'z', u'ą'], cmp=locale.strcoll)] Который должен печатать: [u'a', u'ą', u'z'] Но вместо этого распечатывается: [u'a', u'z', u'ą'] Подводя итог – похоже, что strcoll был сломан. Пробовал […]

«TypeError: объекты Unicode должны быть закодированы перед хэшированием»

У меня есть эта ошибка Traceback (most recent call last): File "python_md5_cracker.py", line 27, in <module> m.update(line) TypeError: Unicode-objects must be encoded before hashing когда я пытаюсь выполнить этот код в Python 3.2.2 : import hashlib, sys m = hashlib.md5() hash = "" hash_file = input("What is the file name in which the hash resides? […]

Как сделать строку unicode с python3

Я использовал это: u = unicode(text, 'utf-8') Но ошибка с Python 3 (или … может быть, я просто забыл включить что-то): NameError: global name 'unicode' is not defined Спасибо.

Запись строк unicode через sys.stdout в Python

Предположим на мгновение, что нельзя использовать print (и, таким образом, пользоваться функцией автоматического обнаружения кодирования). Так что это оставляет нас с sys.stdout . Однако sys.stdout настолько тупой, что не делает никакого разумного кодирования . Теперь читаем страницу Wiki на Python PrintFails и отправляем попробовать следующий код: $ python -c 'import sys, codecs, locale; print str(sys.stdout.encoding); […]

Python - лучший язык программирования в мире.