Tag: unicode

Python String Cleanup + Manipulation (Акцентированные символы)

У меня есть база данных, полная имен: John Smith Scott J. Holmes Dr. Kaplan Ray's Dog Levi's Adrian O'Brien Perry Sean Smyre Carie Burchfield-Thompson Björn Árnason Есть несколько иностранных имен с акцентами в них, которые необходимо преобразовать в строки с не-акцентированными символами. Я бы хотел преобразовать полные имена (после удаления символов, таких как «'», «-») […]

Python + PostgreSQL + странная ошибка ascii = UTF8

У меня есть строки ascii, которые содержат символ "\x80" для обозначения символа евро: >>> print "\x80" € При вводе строковых данных, содержащих этот символ в мою базу данных, я получаю: psycopg2.DataError: invalid byte sequence for encoding "UTF8": 0x80 HINT: This error can also happen if the byte sequence does not match the encodi ng expected […]

UnicodeEncodeError: кодек ascii не может кодировать символы

У меня есть диктовка, в которой есть ссылка на URL-адрес. Подобно: >>> d { 0: {'data': u'<p>found "\u62c9\u67cf \u591a\u516c \u56ed"</p>'} 1: {'data': u'<p>some other data</p>'} … } При использовании функции xml.etree.ElementTree для этих значений данных ( d[0]['data'] ) я получаю самое известное сообщение об ошибке: UnicodeEncodeError: 'ascii' codec can't encode characters… Что я должен сделать […]

Почему я не могу отобразить символ Юникода в Python Interpreter в Mac OS X Terminal.app?

Если я попытаюсь вставить символ Юникода, например, среднюю точку: · в моем интерпретаторе python он ничего не делает. Я использую Terminal.app в Mac OS X, и когда я просто в bash, у меня нет проблем: :~$ · Но в интерпретаторе: :~$ python Python 2.6.1 (r261:67515, Feb 11 2010, 00:51:29) [GCC 4.2.1 (Apple Inc. build 5646)] […]

Отслеживание неявных преобразований Unicode в Python 2

У меня большой проект, где в разных местах были задействованы проблематичные неявные конверсии Unicode (coerions) в виде, например: someDynamicStr = "bar" # could come from various sources # works u"foo" + someDynamicStr u"foo{}".format(someDynamicStr) someDynamicStr = "\xff" # uh-oh # raises UnicodeDecodeError u"foo" + someDynamicStr u"foo{}".format(someDynamicStr) (Возможно, и другие формы). Теперь я хотел бы отслеживать эти […]

Python: UnicodeEncodeError: кодек «latin-1» не может кодировать символ

Я нахожусь в сценарии, где я вызываю api и на основе результатов api я вызываю базу данных для каждой записи, которую я в api. Мои строки api call возвращают и когда я делаю вызов базы данных для возвращаемых элементов api, для некоторых элементов я получаю следующую ошибку. Traceback (most recent call last): File "TopLevelCategories.py", line […]

Python, len и slices для строк Unicode

Я обрабатываю ситуацию, когда мне нужно сделать строку в нужном промежутке на экране, так как я использую unicode len () и slices [] работают, по-видимому, на байтах, и я заканчиваю слишком короткое сокращение строк юникода, потому что € занимает только одно место на экране, но 2 для len () или срезов []. У меня правильно […]

Имена файлов Python os.stat и unicode

В моем приложении Django пользователь загрузил файл с символом юникода в имени. Когда я загружаю файлы, я звоню: os.path.exists(media) чтобы проверить, что файл есть. Это, в свою очередь, кажется, вызывает st = os.stat(path) Которая затем взрывается с ошибкой: UnicodeEncodeError: кодек 'ascii' не может кодировать символ u '\ xcf' в позиции 92: порядковый номер не в […]

Распечатайте знак / знак одобрения (✓) U + 2713 в Python

Как напечатать знак «✓» в Python? Это знак одобрения, а не квадратный корень.

Установить кодировку в сценариях Python 3 CGI

При написании сценария CGI Python 3.1 я сталкиваюсь с ужасными UnicodeDecodeErrors. Однако при запуске скрипта в командной строке все работает. Кажется, что open() и print() используют возвращаемое значение locale.getpreferredencoding() чтобы узнать, какую кодировку использовать по умолчанию. При запуске в командной строке это значение равно «UTF-8», как и должно быть. Но при запуске скрипта через браузер, […]

Python - лучший язык программирования в мире.