Tag: unicode

Регулярное выражение python, которое соответствует региональному классу символов индикатора

Флаги в emoji обозначены парой региональных символов индикатора . Я хотел бы написать python regex, чтобы вставить пробелы между строкой флагов emoji. Например, эта строка состоит из двух бразильских флагов: u"\U0001F1E7\U0001F1F7\U0001F1E7\U0001F1F7" Что будет выглядеть так: 🇧🇷🇧🇷 Я хотел бы вставить пробелы между любыми парами региональных символов индикаторов. Что-то вроде этого: re.sub(re.compile(u"([\U0001F1E6-\U0001F1FF][\U0001F1E6-\U0001F1FF])"), r"\1 ", u"\U0001F1E7\U0001F1F7\U0001F1E7\U0001F1F7") Это […]

Объект 'unicode' не имеет атрибута 'get'

Я пишу приложение django и застреваю с ошибкой 'unicode' object has no attribute 'get' Я видел здесь много вопросов, но никто не соглашался с моей проблемой. Проблема заключается в моем методе в views.py, который должен возвращать JSON: def get_pattern(request, product_id): """ Get JSON for needed pattern """ data = Patterns.objects.get(related_module=product_id) product_data = serializers.serialize("json", [data, ]) […]

Строковые литералы в стиле юникода Python :: в чем разница между '\ u0391' и u '\ u0391'

Я использую Python 2.7.3. Может ли кто-нибудь объяснить разницу между литералами: '\u0391' а также: u'\u0391' и по-разному они отражены в REPL ниже (особенно дополнительный слэш, добавленный к a1): >>> a1='\u0391' >>> a1 '\\u0391' >>> type(a1) <type 'str'> >>> >>> a2=u'\u0391' >>> a2 u'\u0391' >>> type(a2) <type 'unicode'> >>>

ascii codec can not decode byte 0xe9

Я сделал некоторые исследования и увидел решения, но никто не работал для меня. Python – кодек ascii не может декодировать байт Это не сработало для меня. И я знаю, что 0xe9 является символом é. Но я все еще не могу понять, как это сделать, вот мой код output_lines = ['<menu>', '<day name="monday">', '<meal name="BREAKFAST">', '<counter […]

Создание XML-кода Unicode с нуля с помощью Python 3.2

Поэтому в основном я хочу сгенерировать XML с элементами, генерируемыми из данных в словаре python, где то, что станет тегами, – это словарные ключи, а текст – значения словаря. Мне не нужно давать атрибуты элементам, и мой желаемый результат будет выглядеть примерно так: <AllItems> <Item> <some_tag> Hello World </some_tag> … <another_tag /> </Item> <Item> … […]

Преобразование u "string" в "string" в Python без изменения кодировки

У меня есть следующее: u'\x96' Я хочу преобразовать его в следующее: '\x96' Есть какой-либо способ сделать это? str() не работает, и при использовании .encode(…) он изменяет кодировку. Моя главная цель – получить следующий результат, поэтому любой ярлык, чтобы попасть туда, также будет принят: >>> '\x96'.decode("cp1252") u'\u2013' Другими словами, у меня есть u'\x96' и я хочу […]

Как я могу успешно использовать символы UNICODE в моих .py-файлах без каких-либо проблем?

Я пишу тест для базы данных, в которой есть шведские символы. В тесте я напрямую использую символы с умляутами и другими подобными шведскими лигатурами, и он отлично работает, читая имена файлов из базы данных и делая строку успешно сравнивая. Однако при импорте этого файла для генерации pydoc я получаю слишком знакомое исключение: SyntaxError: символ не […]

Python: конвертировать simplejson dumped unicode datetime обратно в объект datetime

У меня есть… entity = simplejson.dumps({"a":unicode(datetime.datetime.utcnow())}) Как снова преобразовать дату-время (преобразованное в unicode) обратно в дату-время? Чтобы я мог сделать что-то вроде … entity2 = simplejson.loads(entity) #your answer here.. add5 = entity2["a"] + datetime.timedelta(minutes=5) Благодаря!

В этом случае модуль MySQLdb в python возвращает кодировку utf8 или unicode?

Использование MySQLdb Я подключаюсь к базе данных, где все хранится в кодировке utf8. Если я сделаю cursor.execute("SET NAMES utf8") и получить некоторые данные из базы данных другим заявлением. Означает ли это, что строки в cursor.execute("SELECT …") cursor.fetchall() будет в Юникоде? Или я должен сначала повернуть их mystr.decode("utf8") в unicode?

Предкомпоновать последовательности символов Unicode в Python

Как я могу преобразовать разложенные последовательности символов Юникода, такие как «ЛАТИНСКАЯ МАЛЕНЬКАЯ ПИСЬМА Е» + «КОМБИНИРОВАТЬ ОСТРОЕННЫЙ АКЦЕНТ» (или U + 0075 + U + 0301), чтобы они стали предкомпозицией: «ЛАТИНСКАЯ МАЛЕНЬКАЯ ПИСЬМА E С ОСТРОМ» (или U + 00E9), используя собственные функции Python 2.5+? Если это имеет значение, я нахожусь в Mac OS X […]

Python - лучший язык программирования в мире.