Tag: unicode

Django UnicodeEncodeError в форме рендеринга ('utf-8')

Я получил UnicodeEncodeError при рендеринге страницы с использованием форм. UnicodeEncodeError at /individual/acc/ 'ascii' codec can't encode character u'\u0142' in position 2: ordinal not in range(128) Вот фрагмент HTML (стандартное использование форм): <table> {{user_form.as_table}} {{individual_form.as_table}} </table> Я создаю их так: user_form = UserCreationForm(request.POST) individual_form = IndividualForm(request.POST) и отправляется на страницу context = {'gd': generalData(request), 'head': "images/header_individual.png", […]

Должно ли мое веб-приложение python использовать unicode для всех строк?

Я вижу некоторые структуры, такие как Django, использующие unicode повсюду, поэтому кажется, что это может быть хорошей идеей. С другой стороны, кажется, большая боль, чтобы все эти дополнительные «плавающие» повсюду. Что будет проблемой, если я этого не сделаю? Есть ли какие-либо проблемы, которые возникнут, если я это сделаю? Я использую Pylons прямо сейчас как свою […]

Как передать Unicode ключевые слова в ** kwargs

Я был исключением для работы. def foo(**kwargs): print kwargs foo(**{'a':'b'}) foo(**{u'a':'b'}) Traceback (последний последний вызов): Файл «", строка 1, в TypeError: m () ключевые слова должны быть строками Я что-то делаю неправильно, или я должен это исправить?

Проблема с python: unicode

Я пытаюсь декодировать строку, взятую из файла: file = open ("./Downloads/lamp-post.csv", 'r') data = file.readlines() data[0] «\ XFF \ xfeK \ x00e \ x00y \ x00w \ x00o \ x00r \ x00d \ x00 \ т \ x00C \ x00o \ x00m \ x00p \ x00e \ x00t \ x00i \ x00t \ x00i \ […]

Избегание Python UnicodeDecodeError в фильтре nl2br от Jinja

Я использую фильтр nl2br от Jinja2, который выглядит так: import re from jinja2 import environmentfilter, Markup, escape _paragraph_re = re.compile(r'(?:\r\n|\r|\n){2,}') @evalcontextfilter def nl2br(eval_ctx, value): result = u'\n\n'.join(u'<p>%s</p>' % p.replace('\n', '<br>\n') for p in _paragraph_re.split(escape(value))) if eval_ctx.autoescape: result = Markup(result) return result Проблема в том, что если «значение» имеет ничего, кроме символов ascii (например: «/ mɒntænə […]

установка libicu-dev на mac

как установить libicu-dev на mac. Это инструкция, рекомендованная в документации sudo apt-get install python-numpy libicu-dev http://polyglot.readthedocs.org/en/latest/Installation.html Я использую анаконду, но, похоже, всегда In file included from _icu.cpp:27: ./common.h:86:10: fatal error: 'unicode/utypes.h' file not found #include <unicode/utypes.h> ошибка

Выходные сигналы для отбора проб для международных символов Юникода (например, японские символы)

Я новичок в python и scrapy, и я слежу за учебником dmoz. В качестве второстепенного варианта предлагаемого начального URL учебника я выбрал японскую категорию с сайта образца dmoz и заметил, что экспорт фидов, который я в конечном итоге получаю, показывает числовые значения в unicode вместо фактических японских символов. Похоже, мне нужно каким- то образом использовать […]

Как сопоставить ударные символы с регулярным выражением в Python?

Мне нужны решения для этого вопроса , кроме Python! Я попытался установить библиотеку регулярных выражений для Python, по-видимому, что позволяет использовать выражения POSIX в регулярных выражениях Python, но, тем не менее, я предполагаю, что он не включает символы Unicode в классе [:alpha:] . Например: >>> re.search(r'[[:alpha:] ]+','Please work blåbær and NOW stop 123').group(0) 'Please work […]

Как преобразовать int, представляющий символ UTF-8, в кодовую точку Unicode?

Давайте используем символ Latin Capital Letter a с Ogonek (U + 0104) в качестве примера. У меня есть int, который представляет собой кодированную форму UTF-8: my_int = 0xC484 # Decimal: `50308` # Binary: `0b1100010010000100` Если использовать функцию unichr я получаю: \uC484 или 쒄 (U + C484) Но мне это нужно для вывода: Ą Как преобразовать […]

Я смущен этим кодом

Ниже приведен исходный код django ( Django-1.41/django/utils/encoding.py ); try: s = unicode(str(s), encoding, errors) except UnicodeEncodeError: if not isinstance(s, Exception): raise # If we get to here, the caller has passed in an Exception # subclass populated with non-ASCII data without special # handling to display as a string. We need to handle this # […]

Python - лучший язык программирования в мире.