Tag: unicode

Как реализовать соответствие строк в Unicode, складывая в python

У меня есть приложение, реализующее инкрементный поиск. У меня есть каталог строк юникода, который нужно сопоставить, и сопоставлять их с данной «ключевой» строкой; строка каталога является «хитом», если она содержит все символы в ключе, по порядку, и она лучше оценивается, если кластер ключей кластер в строке каталога. В любом случае, это отлично работает и точно […]

Python – обработка файлов с смешанным кодированием

У меня есть файл, который в основном UTF-8, но некоторые символы Windows-1252 также нашли там путь. Я создал таблицу для сопоставления символов Windows-1252 (cp1252) с их юникодными аналогами и хотел бы использовать ее для исправления некодированных символов, например cp1252_to_unicode = { "\x85": u'\u2026', # … "\x91": u'\u2018', # ' "\x92": u'\u2019', # ' "\x93": u'\u201c', […]

Заменить специальные символы эквивалентом ASCII

Есть ли lib, который может заменить специальные символы на эквиваленты ASCII, например: "Cześć" чтобы: "Czesc" Я могу, конечно, создать карту: {'ś':'s', 'ć': 'c'} и используйте некоторую функцию замены. Но я не хочу жестко кодировать все эквиваленты в свою программу, если есть какая-то функция, которая уже делает это.

кодирование python utf-8

Я выполняю некоторые скрипты в python. Я создаю строку, которую я сохраняю в файле. В этой строке было много данных, поступающих из арсенала и имен файлов каталога. Согласно convmv, все мое преддверии находится в UTF-8. Я хочу сохранить все в UTF-8, потому что я сохраню его в MySQL после. Пока что в MySQL, который находится […]

Python: использование .format () в строке с экранированным Unicode

Я использую Python 2.6.5. Мой код требует использования знака «больше или равно». Вот оно: >>> s = u'\u2265' >>> print s >>> ≥ >>> print "{0}".format(s) Traceback (most recent call last): File "<input>", line 1, in <module> UnicodeEncodeError: 'ascii' codec can't encode character u'\u2265' in position 0: ordinal not in range(128)` Почему я получаю эту […]

Строка Python для unicode

Возможный дубликат: Как обрабатывать строку ASCII как unicode и unescape экранированные символы в ней в python? Как преобразовать escape-последовательности unicode в unicode символы в строке python У меня есть строка, которая содержит символы Unicode, например, \u2026 и т. Д. Как-то она не получена мне как unicode , но получена как str . Как преобразовать его […]

Как написать строки в unicode в файл?

Я использую python 2.6.5 Я хочу написать некоторые японские символы в файл. Я получаю эту ошибку, и я не знаю, как изменить кодировку. Python 2.6.5 (r265:79063, Jun 12 2010, 17:07:01) [GCC 4.3.4 20090804 (release) 1] on cygwin >>> s = u'\u5E73\u621015' >>> with open("yop", "wb") as f: … f.write( s + "\n" ); … Traceback […]

urllib.urlencode не любит значения unicode: как об этом обходном пути?

Если у меня есть объект вроде: d = {'a':1, 'en': 'hello'} … тогда я могу передать его urllib.urlencode , не проблема: percent_escaped = urlencode(d) print percent_escaped Но если я попытаюсь передать объект со значением типа unicode , игра закончится: d2 = {'a':1, 'en': 'hello', 'pt': u'olá'} percent_escaped = urlencode(d2) print percent_escaped # This fails with […]

Лучший способ конвертировать URL-адрес Unicode в ASCII (UTF-8-escaped) в Python?

Мне интересно, какой лучший способ – или простой способ со стандартной библиотекой – преобразовать URL-адрес с символами Unicode в доменное имя и путь к эквивалентному URL-адресу ASCII, закодированному в домене как IDNA, и путь% – в соответствии с RFC 3986. Я получаю от пользователя URL-адрес в UTF-8. Поэтому, если они набрали http://➡.ws/♥ я получаю 'http://\xe2\x9e\xa1.ws/\xe2\x99\xa5' […]

Python печатает строки unicode в массивах как символы, а не кодовые точки

Если у меня есть словарь формы: a = {u"foo": u"ბარ"} и я пишу >>> print a[u"foo"] я получил ბარ как и ожидалось. Но если я напишу >>> print a я получил {u'foo': u'\u10d1\u10d0\u10e0'} , но я бы предпочел, чтобы персонажи были напечатаны. В любом случае все данные будут сбрасываться в базу данных, поэтому для решения […]

Interesting Posts

Лучший способ извлечь текст из документа Word без использования COM / автоматизации?

Kivy для приложений для Android

Как найти все термины в выражении в Sympy

Эффективный метод расчета плотности нерегулярно разнесенных точек

Действительно ли эта временная сложность O (n ^ 2)?

установлена ​​подушка, но «нет модуля с подушкой» – python2.7 – Windows 7 – подушка для установки python -m

Использовать «байт-подобный объект» из urlopen.read с JSON?

Как использовать сеанс в Google приложении

Временно отключать отдельные тестовые тесты Python

matplotlib: как я могу преобразовать рассеяние XYZ в пиксельное изображение?

Печать СПИСОК символов unicode без символов escape

Эффективно создайте Pandas DataFrame из большого списка кортежей / строк

Python: Как я могу увеличить char?

django-admin бросает синтаксическую ошибку – проблема с конфигурацией Я думаю

Как вы программно читаете файлы Tensorboard?

Python - лучший язык программирования в мире.