Tag: unicode

Python 2.7 UnicodeDecodeError: кодек 'ascii' не может декодировать байт

Я разбирал некоторые файлы docx (кодированный в формате UTF-8) со специальными символами (чешский алфавит). Когда я пытаюсь вывести на stdout, все идет гладко, но я не могу выводить данные в файл, Traceback (последний последний вызов): Файл «./test.py», строка 360, в ofile.write (и '\ т \ т \ т \ т \ т \ п') UnicodeEncodeError: […]

Python 2.7, Appengine Data Store и Unicode

Поэтому я сегодня немного читал об Unicoding, потому что думал о переключении на Jinja2, что требует использования Unicode везде в приложении. Я думаю, у меня есть хорошая идея, как с этим бороться, но я хотел услышать, если это разумно, прежде чем я начал кодировать свое приложение: Работа с внешними текстовыми вводами (через формы html) a) […]

рисование в python

Платформа: WinXP SP2, python 2.5.4.3. (активировать распределение) Кто-нибудь преуспел в написании символов рисования полей в python? Когда я пытаюсь запустить это: print u'\u2500' print u'\u2501' print u'\u2502' print u'\u2503' print u'\u2504' Все советы оценены. Что я делаю не так ? Поддерживает ли python полный юникод? Возможно ли вообще, чтобы эти символы печатались. Связанный Кодировка по […]

json.loads () дает исключение, что он ожидает значение, похоже, что значение есть

Код: loaded_json = json.loads(json_set) json_set – это строка, полученная с веб-страницы, которая является форматированными данными JSON. Полная строка (предупреждение: LONG) находится здесь: http://pastebin.com/wykwNEeg Там появляется ошибка (если я json.loads строку в своем собственном файле и readlines + json.loads эта строка в IDLE): Traceback (most recent call last): File "<stdin>", line 1, in <module> File "/usr/lib/python3.4/json/__init__.py", […]

Кодировка Юникода Python

Я использую argparse для чтения в аргументах для моего кода на Python. Одним из этих входов является заголовок файла [ title ], который может содержать символы Unicode. Я использовал 22少女時代22 в качестве тестовой строки. Мне нужно записать значение входного title в файл, но когда я пытаюсь преобразовать строку в UTF-8 она всегда выдает ошибку: UnicodeDecodeError: […]

Как преобразовать символы xxY в UTF-8 в Python?

У меня есть текст, который содержит символы, такие как «\ xaf», «\ xbe», которые, как я понимаю из этого вопроса , являются символами ASCII. Я хочу преобразовать их в Python в их эквиваленты UTF-8. Обычный string.encode("utf-8") выдает UnicodeDecodeError . Есть ли лучший способ, например, с стандартной библиотекой codecs ? Пример 200 символов здесь .

UnicodeEncodeError при использовании функции компиляции

Используя python 3.2 в Windows 7, я получаю следующее в IDLE: >>compile('pass', r'c:\temp\工具\module1.py', 'exec') UnicodeEncodeError: 'mbcs' codec can't encode characters in position 0–1: invalid character Может ли кто-нибудь объяснить, почему оператор компиляции пытается преобразовать имя файла в unicode с помощью mbcs? Я знаю, что sys.getfilesystemencoding возвращает «mbcs» в Windows, но я думал, что это не […]

Как получить только арабские тексты из строки, используя регулярное выражение?

У меня есть строка, которая имеет как арабские, так и английские предложения. Я хочу только извлечь арабские предложения. my_string=""" What is the reason ذَلِكَ الْكِتَابُ لَا رَيْبَ فِيهِ هُدًى لِلْمُتَّقِينَ behind this? ذَلِكَ الْكِتَابُ لَا رَيْبَ فِيهِ هُدًى لِلْمُتَّقِينَ """ Эта ссылка показывает, что диапазон Unicode для арабских букв – 0600-06FF . Итак, очень простая […]

CSV, Python: правильно использовать DictWriter (ValueError: dict содержит поля не в именах полей)

У меня возникают трудности с пониманием DictWriter в модуле csv (Python 2.7). У меня это (о, и я использую библиотеку unicodecsv, потому что я читал, что есть проблемы): f = object_instance.return_a_dictionary.keys() with open('eggs.csv', 'wb') as csvfile: spamwriter = unicodecsv.DictWriter(csvfile, fieldnames=f) spamwriter.writerows(object_instance.return_a_dictionary) Поэтому я передаю экземпляр объекта. f: [u'n6s2f0e1', u'n1s0f0e0', u'n2s0f0e1', u'n3s1f0e0', u'n5s2f0e0', u'n4s1f0e1'] object_instance.return_a_dictionary: {u'n6s2f0e1': […]

Как удалить акцент в Python 3.5 и получить строку с unicodedata или другими решениями?

Я пытаюсь получить строку для использования в геокодировании google. Я проверил много потоков, но у меня все еще проблема, и я не понимаю, как ее решить. Мне нужно, чтобы addresse1 был строкой без каких-либо специальных символов. Addresse1 – это, например, «32 rue d'Athènes Paris France». addresse1= collect.replace(' ','+').replace('\n','') addresse1=unicodedata.normalize('NFKD', addresse1).encode('utf-8','ignore') здесь я получил строку без […]

Python - лучший язык программирования в мире.