Tag: unicode

Кодирование кода кодирования Unicode Python не в диапазоне <128> с знаком Euro

Я должен прочитать XML-файл на Python и захватить различные вещи, и я столкнулся с разочаровывающей ошибкой с Unicode Encode Error, которую я не мог понять даже при поиске в Google. Вот фрагменты моего кода: #!/usr/bin/python # coding: utf-8 from xml.dom.minidom import parseString with open('data.txt','w') as fout: #do a lot of stuff nameObj = data.getElementsByTagName('name')[0] name […]

как извлечь строку unicode с boost.python

Кажется, что код сработает, когда я extract<const char*>("a unicode string") Кто-нибудь знает, как это решить?

Анализ ввода Unicode с использованием python json.loads

Каков наилучший способ загрузки JSON Strings в Python? Я хочу использовать json.loads для обработки unicode следующим образом: import json json.loads(unicode_string_to_load) Я также попытался поставить параметр «encoding» со значением «utf-16», но ошибка не исчезла. Полный SSCCE с ошибкой: # -*- coding: utf-8 -*- import json value = '{"foo" : "bar"}' print(json.loads(value)['foo']) #This is correct, prints 'bar' […]

Почему я получаю ошибку «TypeError: принуждение к Unicode: нужна строка или буфер, int found»?

После запуска этой небольшой программы: #!/usr/bin/env python2.7 # -*-coding:utf-8 -* a = 1 b = 2 c = 3 title = u"""a=""" + a + u""", b=""" + str(b) + \ u""", c=""" + str(c) print(title) Я получаю следующую ошибку: u""", c=""" + str(c) TypeError: coercing to Unicode: need string or buffer, int found Но […]

Принуждение модуля Python json к работе с ASCII

Я использую json.dump () и json.load () для сохранения / чтения словаря строк на / с диска. Проблема в том, что я не могу иметь ни одной строки в unicode. Кажется, что они находятся в юникоде независимо от того, как я устанавливаю параметры для дампа / загрузки (включая security_ascii и кодировку).

Почему печать настолько медленная в Python 3.3 и как я могу ее исправить?

Я просто попытался запустить этот скрипт с помощью Python 3.3. К сожалению, это примерно в два раза медленнее, чем у Python 2.7. #!/usr/bin/env python from sys import stdin def main(): for line in stdin: try: fields = line.split('"', 6) print(fields[5]) except: pass if __name__ == '__main__': main() Вот результаты: $ time zcat access.log.gz | python3 […]

Если оперативная память не вызывает беспокойства, то читается по очереди быстрее или читает все в ОЗУ и получает к ней доступ? – Python

Если оперативная память не вызывает беспокойства (у меня близко к 200 ГБ на сервере), читается по очереди быстрее или читает все в ОЗУ и получает доступ к ней? Каждая строка будет содержать строку порядка 200-500 символов юникода. Для каждого файла имеется около 2 миллионов строк. Построчно import codecs for i in codecs.open('unicodefile','r','utf8'): print i Чтение […]

Как создать временный файл с кодировкой Unicode?

Когда я open() файл open() , я не могу писать строки unicode. Я узнал, что мне нужно использовать codecs и открыть файл с кодировкой Unicode (см. Http://docs.python.org/howto/unicode.html#reading-and-writing-unicode-data ). Теперь мне нужно создать несколько временных файлов. Я попытался использовать библиотеку tempfile , но у нее нет опции кодирования. Когда я пытаюсь написать строку unicode во временном […]

Почему строки юникода Python требуют специальной обработки для спецификации UTF-8?

По какой-то причине у Python возникают проблемы с спецификацией при чтении строк юникода из файла UTF-8 . Рассмотрим следующее: with open('test.py') as f: for line in f: print unicode(line, 'utf-8') Кажется прямым, не так ли? Это то, что я думал, пока не запустил его из командной строки и не получил: UnicodeEncodeError: кодек 'charmap' не может […]

Как заставить SQLAlchemy правильно вставлять многоточие в unicode в таблицу mySQL?

Я пытаюсь разобрать RSS-канал с помощью feedparser и вставить его в таблицу mySQL, используя SQLAlchemy. На самом деле я смог добиться этого, но сегодня у фида был элемент с многоточием в описании, и я получаю следующую ошибку: UnicodeEncodeError: кодек «latin-1» не может кодировать символ u '\ u2026' в позиции 35: порядковый номер не в диапазоне […]

Python - лучший язык программирования в мире.