Tag: unicode

Разница между декодированием и юникодом?

Согласно этому тесту: # -*- coding: utf-8 -*- ENCODING = 'utf-8' # what is the difference between decode and unicode? test_cases = [ 'aaaaa', 'ááááá', 'ℕℤℚℝℂ', ] FORMAT = '%-10s %5d %-10s %-10s %5d %-10s %10s' for text in test_cases : decoded = text.decode(ENCODING) unicoded = unicode(text, ENCODING) equal = decoded == unicoded print FORMAT […]

Печать блокируется навсегда при печати экземпляра подкласса unicode из IDLE

При выполнении следующих строк с запросом IDLE выполнение блокируется навсегда в последней строке. >>> class Foo(unicode): pass >>> foo = Foo('bar') >>> print str(foo) # prints bar >>> print repr(foo) # prints u'bar' >>> print foo # blocks forever!! Это странно, потому что он работает, как ожидалось, при исполнении с консоли python.exe. Это может быть […]

Преобразование строки Unicode в шестнадцатеричную escape-последовательность с использованием Python

Например: >>> u = u'€€€' >>> s = u.encode('utf8') >>> s '\xe2\x82\xac\xe2\x82\xac\xe2\x82\xac' >>> print s €€€ Но я хочу получить строку: "%E2%82%AC%E2%82%AC%E2%82%AC" как это иногда требуется для URL-адресов. В настоящее время я делаю это byte by byte, как в: >>> "%0X" % ord(u.encode('utf8')[0]) 'E2' Есть ли более простой / более элегантный способ сделать это?

Python: исходный файл Unicode добавляет пробелы (фактически нулевые байты) между символами

Я новичок. Однако мне удалось извлечь некоторые строки из txt-файла (unicode) и записать их в другой файл. lines = InFile.readlines() OutFile.writelines(lines[3:]) Он работает, но (я считаю) из-за проблемы с кодированием в каждом из символов в выходном файле добавляется пробел. Пример результата: 2 0 1 3 – 1 2 – 2 3 ; ; 3 6 […]

Python – кодек ascii не может декодировать байта \ xbd в позиции

Я использую LXML, чтобы очистить текст от веб-страниц. Некоторые из текстов содержат фракции. 5½ Мне нужно получить это в формате float. Эти сбои: ugly_fraction.encode('utf-8') #doesn't change to usable format ugly_fraction.replace('\xbd', '') #throws error ugly_freaction.encode('utf-8').replace('\xbd', '') #throws error

Выход Unicode в ноутбуке ipython

Я должен работать с символами Unicode (кириллицей) в IPython Notebook. Есть ли способ выводить строки в Unicode, а не их коды unicode или utf8? Я хотел бы иметь ["АБ","ВГ"] как результат в двух последних примерах ниже. In [62]: "АБВ" Out[62]: '\xd0\x90\xd0\x91\xd0\x92' In [63]: u"АБВ" Out[63]: u'\u0410\u0411\u0412' In [64]: print "АБВ" АБВ In [65]: print u"АБВ" […]

UnicodeEncodeError: кодек «latin-1» не может кодировать символ u '\ u2014'

Я получаю эту ошибку UnicodeEncodeError: кодек «latin-1» не может кодировать символ u '\ u2014' Я пытаюсь загрузить много новостей в MySQLdb. Однако мне трудно справляться с нестандартными символами, я получаю сотни этих ошибок для всех видов символов. Я могу обрабатывать их индивидуально с помощью .replace (), хотя я бы хотел, чтобы более полное решение правильно […]

python разбивает строку юникода на 3-байтный символ utf8

предположим, что мы имеем строку юникода в python, s = u"abc你好def啊" Теперь я хочу разбить это на символы no-ascii, с результатом, таким как result = ["abc", "你好", "def", "啊"] Итак, как это реализовать?

Печать всех символов Юникода в Python

Я написал код для создания всех 4-значных комбинаций шестнадцатеричной системы, и теперь я пытаюсь использовать их для печати всех символов Юникода, связанных с этими значениями. Вот код, который я использую для этого: char_list =["0","1","2","3","4","5","6","7","8","9","A","B","C","D","E","F"] pairs = [] all_chars = [] # Construct pairs list for char1 in char_list: for char2 in char_list: pairs.append(char1 + char2) […]

Магия python не может идентифицировать имя файла Unicode

В моем небольшом проекте мне пришлось идентифицировать типы файлов в каталоге. Поэтому я пошел с модулем python-magic и сделал следующее: from Tkinter import Tk from tkFileDialog import askdirectory def getDirInput(): root = Tk() root.withdraw() return askdirectory() di = getDirInput() print('Selected Directory: ' + di) for f in os.listdir(di): m = magic.Magic(magic_file='magic') print 'Type of ' […]

Interesting Posts for Van-Lav

Поддерживает ли iPython встроенную поддержку просмотра переменной в пейджере?

Потерял важный .py-файл (перезаписан в виде 0-байтного файла), но старая версия все еще загружена в IPYTHON в качестве модуля – может ли она быть восстановлена?

matplotlib: намеренно блокировать выполнение кода в ожидании события GUI

Невозможно использовать замену параметра sqlite3 с помощью PRAGMA?

путаница оператора

Простое наследование python

сопоставление всех символов в любом порядке в регулярном выражении

Проблемы с установкой nimfa (библиотека факторизации матрицы Python)

Найти количество символов в файле с помощью Python

Различные результаты в Go и Pycrypto при использовании AES-CFB

matplotlib не имеет атрибута 'pyplot'

Как распаковать только некоторые аргументы из zip, не все?

Работа с TIFF (импорт, экспорт) в Python с использованием numpy

MapReduce, как разрешить Mapper читать xml-файл для поиска

Django Rest Framework – методы просмотра и переопределения, позволяющие использовать несколько форм значения поиска

Python - лучший язык программирования в мире.