Tag: unicode

Стандартная идиома Python для установки буфера sys.stdout в ноль не работает с Unicode

Когда я пишу скрипты sysadmin в Python, буфер на sys.stdout, который влияет на каждый вызов print (), раздражает, потому что я не хочу ждать, когда буфера будет сброшено, а затем получить большой кусок строк в один раз на экране, вместо этого я хочу получать отдельные строки вывода, как только новый вывод генерируется скриптом. Я даже […]

Юникод, регулярные выражения и PyPy

Я написал программу для добавления (ограниченного) поддержки юникода к регулярным выражениям Python, и пока он отлично работает на CPython 2.5.2, он не работает на PyPy ( 1.5.0-alpha0 1.8.0, реализуя Python 2.7.1 2.7.2), оба работают в Windows XP ( Edit: как видно из комментариев, @dbaupp может отлично работать в Linux). Я понятия не имею, почему, но […]

Python zlib output, как восстановить из таблицы mysql utf-8?

В python я сжал строку, используя zlib, а затем вставил ее в столбец mysql, который имеет тип blob, используя кодировку utf-8. Строка возвращается как utf-8, но неясно, как вернуть ее в формат, где я могу его распаковать. Вот несколько pseduo-output: valueInserted = zlib.compress ('a') = 'x \ x9cK \ x04 \ x00 \ x00b \ […]

sys.argv как байты в Python 3k

Поскольку Python 3k вводит строгое различие между строками и байтами, аргументы командной строки в массиве sys.argv представлены как строки. Иногда необходимо рассматривать аргументы как байты, например, при передаче пути, который не должен быть в какой-либо конкретной кодировке символов в Unix. Давайте посмотрим пример. Ниже приведена краткая программа Python 3k argv.py : import sys print(sys.argv[1]) print(b'bytes') […]

Является ли u'string 'таким же, как' string'.decode ('XXX')

Хотя название – вопрос, короткий ответ, по-видимому, нет. Я пробовал в оболочке. Вопрос в том, почему? ps: строка – это некоторые символы, отличные от ascii, такие как Chinese, а XXX – текущая кодировка строки >>> u'中文' == '中文'.decode('gbk') False //The first one is u'\xd6\xd0\xce\xc4' while the second one u'\u4e2d\u6587' Пример выше. Я использую windows chinese […]

Проверка python, если строка utf-8 в верхнем регистре

У меня возникают проблемы с .isupper (), когда у меня есть строка с кодировкой utf-8. У меня много текстовых файлов, которые я конвертирую в xml. Хотя текст очень переменный, формат является статическим. слова во всех шапках должны быть обернуты тегами <title> и все остальное <p> . Это значительно сложнее, чем это, но это должно быть […]

Возврат первых N символов строки юникода

У меня есть строка в Юникоде, и мне нужно вернуть первые N символов. Я делаю это: result = unistring[:5] но, конечно, длина строк юникода! = длина символов. Есть идеи? Единственное решение – использовать re? Изменить: Больше информации unistring = "Μεταλλικα" #Metallica written in Greek letters result = unistring[:1] возвращает->? Я думаю, что строки unicode – […]

UnicodeEncodeError: кодек ascii не может кодировать символ u '\ xe7' в позиции 17710: порядковый номер не в диапазоне (128)

Я пытаюсь напечатать строку из заархивированного веб-обхода , но когда я это сделаю, я получаю эту ошибку: print page['html'] UnicodeEncodeError: 'ascii' codec can't encode character u'\xe7' in position 17710: ordinal not in range(128) Когда я пытаюсь напечатать unicode(page['html']) я получаю: print unicode(page['html'],errors='ignore') TypeError: decoding Unicode is not supported Любая идея, как я могу правильно закодировать […]

Python – как конвертировать Unicode имя файла в CP437?

У меня есть файл с именем Unicode, например 'קובץ.txt' . Я хочу упаковать его, и я использую zipfile python. Я могу заархивировать файлы и открыть их позже с проблемой, за исключением того, что имена файлов перепутаны при использовании Windows 7 File Explorer для просмотра файлов (7zip отлично работает). Согласно документам, это общая проблема, и есть […]

Ошибка кодирования Unicode Beautiful Soup

Я пытаюсь использовать следующий код с определенным HTML-файлом from BeautifulSoup import BeautifulSoup import re import codecs import sys f = open('test1.html') html = f.read() soup = BeautifulSoup(html) body = soup.body.contents para = soup.findAll('p') print str(para).encode('utf-8') Я получаю следующую ошибку: UnicodeEncodeError: 'ascii' codec can't encode character u'\u2019' in position 9: ordinal not in range(128) Как мне […]

Interesting Posts

Целевая цепочка сельдерея и доступ к ** kwargs

PIL как масштабировать размер текста по отношению к размеру изображения

Используя Python, напишите файл Excel со столбцами, скопированными из другого файла Excel

Как открыть html-файл?

Объединение файлов данных с помощью PyInstaller 2.1 и MEIPASS error –onefile

UnicodeEncodeError: кодек «ascii» не может кодировать символ u '\ u2013' в позиции 3 2: порядковый номер не в диапазоне (128)

Matplotlib – Как сделать прозрачный цвет лица маркера прозрачным, не делая прозрачную линию

Django: Как я могу проверить последнее время активности пользователя, если пользователь не вышел из системы?

Как использовать скрипт для запроса базы данных sqlite для Android

Как объединить углы QToolTip с CSS и QT

Ошибка прокси-сервера Python с библиотекой запросов

Что заставляет pylint считать мой класс абстрактным?

Python 2.7__unicode __ (self) не работает

Как получить html с обработанным javascript исходным кодом с помощью селена

Простая динамическая модель в PyMC3

Python - лучший язык программирования в мире.