Tag: unicode

Как вернуть наиболее похожий символ Юникода в раздел изображения?

Я сделал простой конвертер в Python для преобразования изображений в ASCII. Сейчас он использует различные оттенки темных персонажей, поэтому он работает, но его трудно разобрать при низких разрешениях: например, логотип Google выдается как: .. .;. .@ a; .. .; . .. a. @ …;. aa .a.▒. ▒.;. ;.;; a. ▒ @a .;.. .; ….. . […]

UnicodeEncodeError при выборе URL-адреса

У меня есть эта проблема, пытаясь получить все текстовые узлы в документе HTML с помощью lxml, но я получаю UnicodeEncodeError: 'ascii' codec can't encode character u'\xe9' in position 8995: ordinal not in range(128) . Однако, когда я пытаюсь выяснить тип кодирования этой страницы ( encoding = chardet.detect(response)['encoding'] ), он говорит, что это utf-8 . Кажется […]

строка namedtuple и unicode

У меня возникли проблемы с назначением строк unicode в качестве имен для namedtuple. Это работает: a = collections.namedtuple("test", "value") и это не означает: b = collections.namedtuple("βαδιζόντων", "value") Я получаю ошибку Traceback (most recent call last): File "<stdin>", line 1, in <module> File "/usr/lib64/python3.4/collections/__init__.py", line 370, in namedtuple result = namespace[typename] KeyError: 'βαδιζόντων' Почему это так? […]

Разница между isdecimal и isdigit

Документация Python 3 для isdigit говорит Возвращает true, если все символы в строке являются цифрами и есть хотя бы один символ, иначе false. Цифры включают десятичные символы и цифры, которые требуют специальной обработки, например цифры надстрочного знака совместимости. Формально цифра является символом, который имеет значение свойства Numeric_Type = Digit или Numeric_Type = Decimal. Так звучит, […]

Как получить ширину отображения комбинированных символов Unicode в Python 3?

В Python 3 строки Unicode должны любезно предоставить вам количество символов Unicode, но я не могу понять, как получить окончательную ширину отображения строки, учитывая, что некоторые символы объединяются. Бытие 1: 1 – בְּרֵאשִׁית, בָּרָא אֱלֹהִים, אֵת הַשָּׁמַיִם, וְאֵת הָאָרֶץ >>> len('בְּרֵאשִׁית, בָּרָא אֱלֹהִים, אֵת הַשָּׁמַיִם, וְאֵת הָאָרֶץ') 60 Но строка имеет всего лишь 37 символов. […]

Как получить «видимую» длину объединения строки Unicode в Python?

Если у меня есть строка Юникода Python, которая содержит комбинированные символы, len сообщает значение, которое не соответствует количеству символов, которые «видели». Например, если у меня есть строка с объединением надстроек и подчеркиваний, таких как u'A\u0332\u0305BC' , len(u'A\u0332\u0305BC') сообщает 5; но отображаемая строка имеет длину всего 3 символа. Как получить «видимый», то есть количество различных позиций, […]

Как загрузить файл pickle, содержащий словарь с символами Unicode?

У меня есть словарь: mydict={'öö':1,'ää':2} Я написал его в файл pickle: a=codecs.open(r'mydict.pkl', 'wb', 'utf-8') pickle.dump(mydict, a) Если я попытаюсь загрузить его: m=codecs.open(r'mydict.pkl', 'rb', 'utf-8') mydict = pickle.load(m) Я получаю сообщение об ошибке: KeyError: u"S'\\xe4\\xe4'\np1\nI2\nsS'\\xf6\\xf6'\np2\nI1\ns." Есть идеи, как это решить? Помощь очень полезна.

Python: создание строки Unicode

У меня проблема с Python с Unicode. Мне нужно построить график с аннотациями Unicode. Согласно учебнику, я должен просто создать свою строку в Unicode. Я делаю это так: annotation = u"%s has %s rev"%(art.title, len(art.revisions)) Это art.title котором есть символы Unicode. Иногда этот код работает, иногда он дает мне ошибку ниже: UnicodeDecodeError: 'ascii' codec can't […]

Коробка JSON с сериализуемой ошибкой из-за фляжки babel

Я использую https://pythonhosted.org/Flask-Babel/ расширение для локализации. базовый класс формы #!/usr/bin/env python # -*- coding: utf-8 -*- from app import app from flask.ext.wtf import Form class BaseForm(Form): @property def error_list(self): _errors = [] for fieldName, errorMessages in self.errors.iteritems(): for err in errorMessages: _errors.append(err) return _errors мой класс формы #!/usr/bin/env python # -*- coding: utf-8 -*- from […]

Как отправить символы Unicode с помощью httplib?

Я пытаюсь опубликовать данные в unicode с httplib.request функции httplib.request : s = u"עברית" data = """ <spellrequest textalreadyclipped="0" ignoredups="1" ignoredigits="1" ignoreallcaps="0"> <text>%s</text> </spellrequest> """ % s con = httplib.HTTPSConnection("www.google.com") con.request("POST", "/tbproxy/spell?lang=he", data) response = con.getresponse().read() Однако это моя ошибка: Traceback (most recent call last): File "C:\Scripts\iQuality\test.py", line 47, in <module> print spellFix(u"╫á╫נ╫¿╫ץ╫ר╫ץ") File "C:\Scripts\iQuality\test.py", […]

Python - лучший язык программирования в мире.