Tag: unicode

Почему python 2.7 на Windows требует пробела перед символом Unicode при печати?

Я использую cmd Windows, chcp 65001, это мой код: print u'\u0110 \u0110' + '\n' Результат: (a character cmd can't display) (character what i want) Traceback (most recent call last): File "b.py", line 26, in <module> print u'\u0110 \u0110' IOError: [Errno 2] No such file or directory Но, когда я использую этот код: print u' \u0110 […]

Является ли это лучшим способом обеспечения кодирования «string» юникода python в utf-8?

Учитывая, что в произвольной «строке» из библиотеки у меня нет контроля, я хочу убедиться, что «строка» является типом Unicode и закодирована в utf-8. Я хотел бы знать, если это лучший способ сделать это: import types input = <some value from a lib I dont have control over> if isinstance(input, types.StringType): input = input.decode("utf-8") elif isinstance(input, […]

Почему вывод print в python2 и python3 отличается от той же строки?

В python2: $ python2 -c 'print "\x08\x04\x87\x18"' | hexdump -C 00000000 08 04 87 18 0a |…..| 00000005 В python3: $ python3 -c 'print("\x08\x04\x87\x18")' | hexdump -C 00000000 08 04 c2 87 18 0a |……| 00000006 Почему у этого байта "\xc2" здесь? Изменить : Я думаю, что когда строка имеет символ не-ascii, python3 добавит байту […]

Есть ли веская причина не использовать unicode, а не строку?

Многие проблемы, с которыми я столкнулся в Python, связаны с тем, что у вас нет чего-то в Unicode. Есть ли веская причина не использовать Unicode по умолчанию? Я понимаю, что нужно что-то переводить в ASCII, но, похоже, это исключение, а не правило. Я знаю, что Python 3 использует Unicode для всех строк. Должно ли это […]

python: lower () немецкий умляут

У меня проблема с преобразованием заглавных букв с умляутами в нижние регистры. print("ÄÖÜAOU".lower()) A, O и U преобразуются правильно, но Ä, Ö и Ü остаются в верхнем регистре. Есть идеи? Первая проблема исправлена ​​с помощью .decode ('utf-8'), но у меня все еще есть вторая: # -*- coding: utf-8 -*- original_message="ÄÜ".decode('utf-8') original_message=original_message.lower() original_message=original_message.replace("ä", "x") print(original_message) Traceback […]

Метод кодирования строки Python

В Python существует метод encode в строках unicode для кодирования из строки Unicode в байтовый. Существует метод decode в строке, чтобы сделать обратное. Но я смущен тем, для чего используется метод encode в строке?

Как удалить u '(unicode) из словаря в Python?

У меня есть словарь {u'value1': {u'Capacity1': 0, u'E1': 'None', u'status': u'ONLINE', u'name': u'value1', u'perf': 'None', u'Id': u'2005', u'id1': u'3000', u'Capacity2': 4}} Как удалить u 'из ключа и значения (который сам по себе является другим словарем?)) Благодаря!

Заголовки фляг не конвертируются в Юникод?

Я разрабатываю небольшую веб-службу в python, используя: Колба (v. 0,8) шторм ОРМ (версия 0.19) Apache с mod_wsgi У меня есть собственный HTTP-заголовок Unison-UUID который я использую в какой-то момент для получения информации в моей базе данных. вот фрагмент (слегка переписанный для простоты), с которым у меня возникают проблемы: uuid = flask.request.headers['Unison-UUID'] store = storm.locals.Store(my_database) user […]

Как сохранить unicode с помощью SQLAlchemy?

Я столкнулся с такой ошибкой: File "/vagrant/env/local/lib/python2.7/site-packages/sqlalchemy/engine/default.py", line 435, in do_execute cursor.execute(statement, parameters) exceptions.UnicodeEncodeError: 'ascii' codec can't encode character u'\u2013' in position 8410: ordinal not in range(128) Это происходит, когда Im пытается сохранить объект ORM с назначенной строкой unicode Python. И в результате parameters dict имеют строку unicode в качестве одного из ее значений и […]

python UnicodeEncodeError> Как я могу просто удалить тревожные символы Unicode?

Вот что я сделал. >>> soup = BeautifulSoup (html) >>> soup Traceback (most recent call last): File "<stdin>", line 1, in <module> UnicodeEncodeError: 'ascii' codec can't encode character u'\xae' in position 96953: ordinal not in range(128) >>> >>> soup.find('div') Traceback (most recent call last): File "<stdin>", line 1, in <module> UnicodeEncodeError: 'ascii' codec can't encode […]

Python - лучший язык программирования в мире.