Tag: unicode

сообщение python-requests с именами файлов в unicode

Я прочитал несколько связанных вопросов здесь, на SO, но не нашел рабочего решения. У меня есть Flask-сервер с этим упрощенным кодом: app = Flask(__name__) api = Api(app) class SendMailAPI(Resource): def post(self): print request.files return Response(status=200) api.add_resource(SendMailAPI, '/') if __name__ == '__main__': app.run(host='0.0.0.0', debug=True) Затем в клиенте: # coding:utf-8 import requests eng_file_name = 'a.txt' heb_file_name = […]

Настройте Notepad ++ и NppExec для печати символов юникода из python

У меня есть файл с cjk.py utf-8 cjk.py : print("打印") Неудивительно, что запуск python cjk.py дает Traceback (most recent call last): File "cjk.py", line 1, in <module> print('\u6253\u5370') File "C:\Python33\lib\encodings\cp850.py", line 19, in encode return codecs.charmap_encode(input,self.errors,encoding_map)[0] UnicodeEncodeError: 'charmap' codec can't encode characters in position 0-1: character maps to <undefined> Тем не менее работает idle -r […]

UnicodeEncodeError: кодек ascii не может кодировать символ при попытке HTTP POST в Python

Я пытаюсь сделать HTTP POST с строкой unicode (u '\ xe4 \ xf6 \ xfc') в качестве параметра в Python, но я получаю следующую ошибку: UnicodeEncodeError: кодек 'ascii' не может кодировать символ Это код, используемый для создания HTTP POST (с httplib2) http = httplib2.Http() userInfo = [('Name', u'\xe4\xf6\xfc')] data = urlencode(userInfo) resp, content = http.request(url, […]

shlex.split все еще не поддерживает юникод?

Согласно документации, в Python 2.7.3, shlex должен поддерживать UNICODE. Однако при запуске кода ниже я получаю: UnicodeEncodeError: 'ascii' codec can't encode characters in position 184-189: ordinal not in range(128) Я делаю что-то неправильно? import shlex command_full = u'software.py -fileA="sequence.fasta" -fileB="新建文本文档.fasta.txt" -output_dir="…" -FORMtitle="tst"' shlex.split(command_full) Точная ошибка следующая: Traceback (most recent call last): File "<stdin>", line 1, […]

Python: решение юникодного ада с помощью unidecode

Я работал над способами сглаживания текста в ascii. Итак, ā -> a и ñ -> n и т. Д. unidecode был фантастическим для этого. # -*- coding: utf-8 -*- from unidecode import unidecode print(unidecode(u"ā, ī, ū, ś, ñ")) print(unidecode(u"Estado de São Paulo")) Производит: a, i, u, s, n Estado de Sao Paulo Однако я не […]

Что означают двойные круглые скобки в вызове функции? например func (материал) (материал)?

Оригинальное название: « Помогите мне понять эту странную идиому Python? sys.stdout = codecs.getwriter('utf-8')(sys.stdout) " Я использую эту идиому все время, чтобы напечатать кучу контента до стандарта в utf-8 в Python 2. *: sys.stdout = codecs.getwriter('utf-8')(sys.stdout) Но, честно говоря, я понятия не имею, что делает (sys.stdout) . Это напоминает мне закрытие Javascript или что-то в этом […]

unicode string эквивалент содержать

У меня есть ошибка при попытке использования содержать в python. s = u"some utf8 words" k = u"one utf8 word" if s.contains(k): print "contains" Как достичь такого же результата? Пример с обычной строкой ASCII s = "haha i am going home" k = "haha" if s.contains(k): print "contains" Я использую python 2.7.x

кодировать и декодировать строку байтов python

Я пытаюсь преобразовать входящую строку байта, которая содержит символы, отличные от ascii, в действительную строку utf-8, так что я могу сбросить как json. b = '\x80' u8 = b.encode('utf-8') j = json.dumps(u8) Я ожидал, что j будет «\ xc2 \ x80», но вместо этого я получаю: UnicodeDecodeError: 'ascii' codec can't decode byte 0x80 in position […]

Как преобразовать Unicode в строку на уровне Python?

Следующие unicode и string могут существовать самостоятельно, если они определены явно: >>> value_str='Andr\xc3\xa9' >>> value_uni=u'Andr\xc3\xa9' Если у меня есть только u'Andr\xc3\xa9' назначенный переменной, как указано выше, как мне преобразовать ее в 'Andr\xc3\xa9' в Python 2.5 или 2.6? РЕДАКТИРОВАТЬ: Я сделал следующее: >>> value_uni.encode('latin-1') 'Andr\xc3\xa9' который исправляет мою проблему. Может кто-нибудь объяснить мне, что именно происходит?

Будет ли все в стандартной библиотеке обрабатывать строки как unicode в Python 3.0?

Я немного смущен тем, как стандартная библиотека будет вести себя сейчас, когда Python (из 3.0) основан на Unicode. Будут ли модули, такие как CGI и urllib, использовать строки Unicode, или они будут использовать новый тип «байтов» и просто предоставить закодированные данные?

Python - лучший язык программирования в мире.