Tag: unicode

django: gettext и принуждение к unicode

У меня есть код в моем приложении django. class Status(object): def __init__(self, id, desc): self.id = id self.desc = desc def __unicode__(self): return self.desc STATUS = Status(0, _(u"Some text")) Когда я пытаюсь отобразить некоторый статус (или даже принуждать его к unicode), я получаю: TypeError: coercing to Unicode: need string or buffer, __proxy__ found Может ли […]

кодек 'ascii' не может кодировать символ в позиции * ord не в диапазоне (128)

Есть несколько потоков в stackoverflow, но я не смог найти правильное решение проблемы в целом. Я собрал огромные суммы текстовых данных из функции чтения urllib и сохранил их в файлах pickle. Теперь я хочу записать эти данные в файл. Во время написания я получаю ошибки, похожие на – 'ascii' codec can't encode character u'\u2019' in […]

Python Unicode object и C API (получение char * из объектов pyunicode)

В настоящее время я привязываю все свои классы ядра C ++ к python для создания сценариев игры. Последняя проблема заключается в том, что, когда вы говорите, что вы делаете переменную в скрипте, такую ​​строку, как string = 'hello world' это становится объектом PyUnicodeObject. Далее мы хотим вызвать функцию на этом объекте в скрипте из связанной […]

python unicode обрабатывает различия между print и sys.stdout.write

Начну с того, что я уже видел это сообщение: странное поведение печати python с помощью unicode , но предлагаемое там решение (используя PYTHONIOENCODING) не сработало для меня. Вот моя проблема: Python 2.6.5 (r265:79063, Apr 9 2010, 11:16:46) [GCC 4.1.2 20080704 (Red Hat 4.1.2-44)] on linux2 >>> a = u'\xa6' >>> print a ¦ работает просто […]

Почему декодер python заменяет более чем недопустимые байты из кодированной строки?

Попытка декодирования некорректной кодированной страницы utf-8 html дает разные результаты в python, firefox и chrome. Недопустимый кодированный фрагмент с тестовой страницы выглядит так: 'PREFIX\xe3\xabSUFFIX' >>> fragment = 'PREFIX\xe3\xabSUFFIX' >>> fragment.decode('utf-8', 'strict') … UnicodeDecodeError: 'utf8' codec can't decode bytes in position 6-8: invalid data UPDATE : этот вопрос заключен в отчете об ошибке для компонента юникода […]

как читать файл, который может быть сохранен как ansi или unicode в python?

Я должен написать сценарий, который поддерживает чтение файла, который может быть сохранен как Unicode или Ansi (используя блокнот MS). У меня нет никаких указаний на формат кодировки в файле, как я могу поддерживать оба формата кодирования? (вид общего способа чтения файлов без знания формата в расширенном режиме).

Разница между unicode.isdigit () и unicode.isnumeric ()

В чем разница между методами unicode.isdigit () и unicode.isnumeric ()?

Python не открывает японские имена файлов

Я работаю над скриптом python, чтобы открыть файл с именем юникода (в основном японский) и сохранить в произвольно сгенерированном (не-Unicode) имя файла в 64-разрядной версии Windows Vista, и у меня возникли проблемы … Он просто не работает, он отлично работает с именами файлов, отличными от юникода (даже если он имеет юникод-контент), но во втором случае […]

Должен ли я использовать строку Unicode по умолчанию?

Является ли хорошей практикой выбирать строку Unicode над обычной строкой при кодировании в Python? Я в основном работаю на платформе Windows, где большинство типов строк являются Unicode в эти дни (т. Е. .NET String, «_UNICODE» включен по умолчанию в новом проекте c ++ и т. Д.). Поэтому я склонен думать, что случай, когда используются нестандартные […]

Удаление символов не-ascii из любого заданного типа string в Python

>>> teststring = 'aõ' >>> type(teststring) <type 'str'> >>> teststring 'a\xf5' >>> print teststring aõ >>> teststring.decode("ascii", "ignore") u'a' >>> teststring.decode("ascii", "ignore").encode("ascii") 'a' это то, что я действительно хотел, чтобы он хранил внутренне, поскольку я удаляю символы, отличные от ascii. Почему декодирование («ascii выдают строку в Юникоде? >>> teststringUni = u'aõ' >>> type(teststringUni) <type 'unicode'> […]

Python - лучший язык программирования в мире.