Tag: unicode

Отображение UTF8 stings в терминале Ubuntu с помощью скрипта Python

В моем скрипте Python, запущенном в командной строке на Ubuntu, он выбирает кодированный UTF8 контент из базы данных MySQL. Затем я хочу напечатать строку на консоли. Отображаемые строки имеют проблему с кодировкой, так как они не отображают символы с акцентом правильно. Как это исправить? Предпочтительно сценарий будет принимать решение, а не устанавливать системную среду, для […]

Есть ли у python re (regex) альтернатива escape-последовательностям Unicode?

Python рассматривает \ uxxxx как символ символа unicode внутри строкового литерала (например, u "\ u2014" интерпретируется как символ Unicode U + 2014). Но я только что обнаружил (Python 2.7), что стандартный модуль регулярных выражений не рассматривает \ uxxxx как символ Юникода. Пример: codepoint = 2014 # Say I got this dynamically from somewhere test = […]

UnicodeEncodeError при использовании метода pandas to_sql на фрейме данных с именами столбцов Unicode

Это мое первое сообщение о переполнении стека, так что несите меня. Я прочесываю интернет целый день, и я не смог решить эту проблему. В принципе, у меня есть Pandas DataFrame с символами unicode в именах столбцов, и я получаю UnicodeEncodeError, когда пытаюсь использовать to_sql для хранения данных в базе данных. Я могу воспроизвести ошибку с […]

Почему Python2 и Python3 относятся к одинаковой директории Windows по-разному?

Мой язык Windows – китайский. Чтобы проиллюстрировать мою точку зрения, я использую pathlib пакета. from pathlib import * rootdir=Path(r'D:\新建文件夹') print(rootdir.exists()) Python2.7 Я получаю False Python3 Я получаю True Любые идеи? Спасибо за любой совет. Для Python2.7 вы можете установить pathlib с помощью " pip install pathlib "

Python Unicode UnicodeEncodeError

У меня возникают проблемы с попыткой конвертировать строку UTF-8 в unicode. Я получаю ошибку. UnicodeEncodeError: 'ascii' codec can't encode characters in position 73-75: ordinal not in range(128) Я попробовал обернуть это в блок try / except но затем Google дал мне ошибку системного администратора, которая была одной строкой. Может кто-нибудь предложить, как поймать эту ошибку […]

Отправить HTML-почту с помощью Unicode

Я изменил пример из документов python, чтобы проверить unicode в модуле электронной почты. #!/usr/bin/env python # -*- coding: utf-8 -*- from __future__ import absolute_import, division, unicode_literals, print_function import smtplib from email.mime.multipart import MIMEMultipart from email.mime.text import MIMEText # me == my email address # you == recipient's email address me = "my@email.com" you = "your@email.com" […]

Кодирование UTF-8 в Python

У меня есть символ UTF-8, закодированный с `_ 'между ними, например,' _ea_b4_80 '. Я пытаюсь преобразовать его в символ UTF-8, используя метод replace, но я не могу получить правильную кодировку. Это пример кода: import sys reload(sys) sys.setdefaultencoding('utf8') r = '_ea_b4_80' r2 = '\xea\xb4\x80' r = r.replace('_', '\\x') print r print r.encode("utf-8") print r2 В этом […]

Python удаляет лишние символы Unicode

Я работаю с некоторым текстом в python, он уже находится в формате unicode внутри, но я хотел бы избавиться от некоторых специальных символов и заменить их более стандартными версиями. У меня в настоящее время есть строка, которая выглядит так, но она становится все более сложной, и я вижу, что это в конечном итоге принесет больше […]

Unsuppress UnicodeEncodeError исключения при запуске из Aptana Studio PyDev

Ниже приведен оператор, который должен вызвать исключение UnicodeEncodeError : print 'str+{}'.format(u'unicode:\u2019') В оболочке Python исключение создается как ожидалось: >>> print 'str+{}'.format(u'unicode:\u2019') Traceback (most recent call last): File "<pyshell#10>", line 1, in <module> print 'str+{}'.format(u'unicode:\u2019') UnicodeEncodeError: 'ascii' codec can't encode character u'\u2019' in position 8: ordinal not in range(128) Однако, если я поместил эту строку в […]

UnicodeDecodeError при использовании результата socket.gethostname ()

Некоторые из моих пользователей сообщают, что следующий код может поднять UnicodeDecodeError, когда имя хоста содержит символы, отличные от ascii (однако я не смог реплицировать это на моей машине с Windows Vista): self.path = path self.lock_file = os.path.abspath(path) + ".lock" self.hostname = socket.gethostname() self.pid = os.getpid() dirname = os.path.dirname(self.lock_file) self.unique_name = os.path.join(dirname, "%s.%s" % (self.hostname, self.pid)) […]

Python - лучший язык программирования в мире.