Tag: unicode

python pandas read_excel возвращает UnicodeDecodeError для описания ()

Я люблю панды, но у меня возникают настоящие проблемы с ошибками Unicode. read_excel () возвращает ужасную ошибку Unicode: import pandas as pd df=pd.read_excel('tmp.xlsx',encoding='utf-8') df.describe() ————————————————————————— UnicodeDecodeError Traceback (most recent call last) … UnicodeDecodeError: 'ascii' codec can't decode byte 0xc2 in position 259: ordinal not in range(128) Я понял, что исходный Excel имел (неразрывное пространство) в […]

Настройте IDLE для использования Unicode

Как заставить IDLE использовать UTF-8 в качестве кодировки по умолчанию для моих файлов Python? В настройках IDLE нет опции «Кодировка».

Ширина отображения строк юникода в Python

Как определить ширину отображения строки Unicode в Python 3.x, и есть ли способ использовать эту информацию для выравнивания этих строк с помощью str.format() ? Пример мотивации: печать таблицы строк на консоли. Некоторые строки содержат символы, отличные от ASCII. >>> for title in d.keys(): >>> print("{:<20} | {}".format(title, d[title])) zootehni- | zooteh. zootekni- | zootek. zoothèque […]

Вывести файл ascii из Unicode Web Scrape в Python

Я новичок в программировании на Python. Я использую следующий код в моем файле Python: import gethtml import articletext url = "http://www.thehindu.com/news/national/india-calls-for-resultoriented-steps-at-asem/article5339414.ece" result = articletext.getArticle(url) text_file = open("Output.txt", "w") text_file.write(result) text_file.close() файл articletext.py содержит следующий код: from bs4 import BeautifulSoup import gethtml def getArticleText(webtext): articletext = "" soup = BeautifulSoup(webtext) for tag in soup.findAll('p'): articletext += […]

Идентификатор имени ISO 8859-1 не декодируется

Я извлекаю файлы из MIME-сообщений в python milter и запускаю проблемы с файлами, названными как таковые: =? ISO-8859-1? Q? Certificado = 5FZonificaci = F3N = 5F2010 = 2Epdf? = Я не могу расшифровать это имя в UTF. Чтобы решить предыдущую проблему ISO-8859-1, я начал передавать все имена файлов для этой функции: def unicodeConvert(self, fname): normalized […]

проблема с открытием текстового документа – ошибка Unicode

У меня, наверное, довольно простой вопрос. однако, я только начинаю использовать python, и это просто сводит меня с ума. Я следую инструкциям книги и хотел бы открыть простой текстовый файл. код, который я использую: import sys try: d = open("p0901aus.txt" , "W") except: print("Unsucessfull") sys.exit(0) я либо получаю новости, что я был не понятен при […]

Преобразование символа в его четырехзначное представление unicode escape и наоборот

1) Как преобразовать символ в его четырехзначное представление Unicode escape в python 2.7, например, от "¥" до "\u00a5" ? 2) Как преобразовать представление Unicode в обозначение символа на платформе Windows 7/8, например, "\u00a5" до "¥" ?

Unicode re.sub () не работает с \ g <0> (группа 0)

Почему \g<0> работает с регулярным выражением unicode? Когда я пытался использовать \g<0> для вставки пробела до и после группы с обычным регулярным выражением, он работает: >>> punct = """,.:;!@#$%^&*(){}{}|\/?><"'""" >>> rx = re.compile('[%s]' % re.escape(punct)) >>> text = '''"anständig"''' >>> rx.sub(r" \g<0> ",text) ' " anst\xc3\xa4ndig " ' >>> print rx.sub(r" \g<0> ",text) " anständig […]

noob-запросы по методам unicode и str в Python

Я хочу найти некоторые разъяснения по методам Unicode и str в Python. После прочтения некоторых объяснений в Unicode, есть еще несколько сомнений, на которые я надеюсь, что люди могут мне помочь: Могу ли я сказать, что при объявлении строки юникода, например word=u'foo' , python использует кодировку терминала и декодирует foo например, UTF-8 , и присваивая […]

Преобразование объекта unicode в латинскую строку с объектами

У меня есть объект unicode, например x = u"a & 日本語: enči hallöle" и хотите преобразовать его в строку latin-1 с html-объектами, такими как "a &amp; 日本語: enči hallöle" причина в том, что я хочу, чтобы мои пользователи могли вводить данные в Юникоде, но моя устаревшая база данных, в которой мне нужно сохранять мои данные, […]

Python - лучший язык программирования в мире.