Tag: unicode

time.strptime () – аргумент 0 должен быть str, а не байтами

Очевидно, я уже знаю, что strftime и strptime не любят строки байтов в качестве параметров, однако я здесь в рассоле, потому что мне нужно читать содержимое файла, в котором хранятся различные кодировки символов, и мне нужно обрабатывать их всех, и отправить часть времени каждой строки в этом текстовом файле в strptime() . Быстрое исправление заключалось […]

UnicodeEncodeError в Python на консоли Windows

У меня возникает следующая ошибка при рекурсии файлов в каталоге и имена файлов в консоли: Traceback (most recent call last): File "C:\Program Files\Python33\lib\encodings\cp437.py", line 19, in encode return codecs.charmap_encode(input,self.errors,encoding_map)[0] UnicodeEncodeError: 'charmap' codec can't encode character '\u2013' in position 53: character maps to <undefined> Согласно ошибке, одним из символов в строке имени файла является \u2013 который […]

обрабатывать строку без ascii кода в python

Это действительно запутанно обрабатывать char-код не-ascii в python. Может ли кто-нибудь объяснить? Я пытаюсь прочитать простой текстовый файл и заменить все неалфавитные символы пробелами. У меня есть список символов: ignorelist = ('!', '-', '_', '(', ')', ',', '.', ':', ';', '"', '\'', '?', '#', '@', '$', '^', '&', '*', '+', '=', '{', '}', '[', ']', […]

UnicodeEncodeError в urllib2

Я встретил UnicodeEncodeError во время сканирования файла jump файла Wikipedia. Вот мой фрагмент кода и сообщение об ошибке. Кажется, что характер «é» вызывает эту проблему. Однако я не знаю, как решить эту проблему. import urllib2 import json # List of philosopher's name: mergel list # print mergel i = 0 for name in mergel: # […]

Уникод Python записывает в файлы сбой в командной строке, но не в IDE

У меня проблема, когда мой код Python 2.7.3rc2 отлично работает через IDE (Aptana Studio 3 с PyDev), но сбой, когда я либо дважды щелкаю файл .py или пытаюсь запустить его из командной строки Windows. Проблема заключается в том, где я пытаюсь написать строку, содержащую символы Unicode, в файл. У IDE нет проблем с этим и […]

Python 3.4 вызывает UnicodeEncodeError на сервере Apache2 (Mac), но отлично работает в командной строке

Я пытаюсь получить скрипт Cgi Python 3.4 и Apache для вывода символа «ü» в браузере (такая же проблема возникает для любого другого символа Юникода, если на то пошло). Сценарий python 3.4 cgi вызывает UnicodeEncodeError в Apache, тогда как аналогичный код python 2.7 отлично работает на одном сервере. Оба сценария 3.4 и 2.7 отлично работают из […]

python unicode: Как я могу судить, нужно ли декодировать строку в utf-8?

У меня есть функция, принимающая запросы из сети. В большинстве случаев строка, переданная в формате, не является unicode, но иногда она и есть. У меня есть код для преобразования всего в Юникод, но он сообщает об этой ошибке: message.create(username, unicode(body, "utf-8"), self.get_room_name(),\ TypeError: decoding Unicode is not supported Я думаю, что причина в том, что […]

простая функция json dumps с unicode

Вот пример запуска простого json с использованием версии python2.4 >>> >>> orig='{"key1":"Val", "key2":"val2"}' >>> origDict = simplejson.loads(orig) >>> origDict {'key2': 'val2', 'key1': 'Val'} >>> origDict['key2'] = '\xe4\xbd\xa0\xe5\xa5\xbd' >>> simplejson.dumps(origDict) '{"key2": "\\u4f60\\u597d", "key1": "Val"}' Функции дампов заменяют байтовую строку на unicode-версию. Есть ли способ сделать это не так и просто вернуть '{"key2": "\ xe4 \ xbd […]

Скрипт для преобразования символов Unicode в формате <U9999> в их эквиваленты ASCII

Я делаю некоторые изменения в файлах локали Linux /usr/share/i18n/locales (например, pt_BR), чтобы изменить формат дат, времени, чисел и т. Д. По умолчанию. Но поскольку символы Unicode представлены в виде строк в формате <U9999> текст очень трудно читать. Вот его фрагмент: LC_TIME abday "<U0044><U006F><U006D>";"<U0053><U0065><U0067>";/ "<U0054><U0065><U0072>";"<U0051><U0075><U0061>";/ "<U0051><U0075><U0069>";"<U0053><U0065><U0078>";/ "<U0053><U00E1><U0062>" Итак, как сделать простой скрипт (может быть bash, python, […]

очистить текст, принадлежащий разным языкам в python

У меня есть сборник текста, который имеет предложения полностью на английском или хинди или марати с идентификаторами, прикрепленными к каждому из этих предложений, как 0,1,2, соответственно представляющим язык текста. Текст, независимо от языка, может иметь html-теги, пунктуацию и т. Д. Я мог бы очистить английские предложения, используя мой код ниже: import HTMLParser import re from […]

Interesting Posts

Как импортировать данные из разных типов из массива в массив Python Numpy?

Как выполнить экспоненциальную и логарифмическую подгонку кривой в Python? Я нашел только полиномиальную подгонку

множественный импорт python для общего модуля

Захват смайликов с использованием регулярного выражения в python

Pandas группирует и суммирует два столбца

Вставка строки в заданное положение текстового файла

Как я могу включить cmake-файл при создании с помощью python distutils?

Сохранять существующие пространства имен при перезаписывании XML-файла с помощью ElementTree и Python

tail -f в python без time.sleep

Могу ли я использовать многопроцессорную очередь в функции, называемой пулом Pool.imap?

Почему python не использует __iadd__ для суммарных и цепочечных операторов?

Parse_dates в Пандах

cx_Oracle: ImportError: Ошибка загрузки DLL: это приложение не выполнено

Максимальное значение Python Pandas для выбранных столбцов

Django: как переопределить сообщение об ошибке unique_together?

Python - лучший язык программирования в мире.