Tag: unicode

Функция print () Python 3 с символами фарси / арабский

Я упростил свой код для лучшего понимания. вот проблема: Дело 1: # -*- coding: utf-8 -*- text = "چرا کار نمیکنی؟" # also using u"…." results the same print(text) вывод: UnicodeEncodeError: 'charmap' codec can't encode characters in position 0-2: character maps to <undefined> случай 2: text = "چرا کار نمیکنی؟".encode("utf-8") print(text) нет выхода. случай 3: […]

Как заставить str.translate работать с строками Unicode?

У меня есть следующий код: import string def translate_non_alphanumerics(to_translate, translate_to='_'): not_letters_or_digits = u'!"#%\'()*+,-./:;<=>?@[\]^_`{|}~' translate_table = string.maketrans(not_letters_or_digits, translate_to *len(not_letters_or_digits)) return to_translate.translate(translate_table) Что отлично работает для строк, отличных от юникода: >>> translate_non_alphanumerics('<foo>!') '_foo__' Но сбой для строк unicode: >>> translate_non_alphanumerics(u'<foo>!') Traceback (most recent call last): File "<stdin>", line 1, in <module> File "<stdin>", line 5, in translate_non_alphanumerics […]

удаление emojis из строки в Python

Я нашел этот код в Python для удаления emojis, но он не работает. Можете ли вы помочь с другими кодами или исправить это? Я заметил, что все мои emjois начинают с \xf но когда я пытаюсь выполнить поиск str.startswith("\xf") я получаю недопустимую ошибку персонажа. emoji_pattern = r'/[x{1F601}-x{1F64F}]/u' re.sub(emoji_pattern, '', word) Вот ошибка: Traceback (most recent […]

преобразование utf-16 -> utf-8 И удалить спецификацию

У нас есть пользователь ввода данных, который закодирован в UTF-16 на Windows и хотел бы иметь utf-8 и удалить спецификацию. Преобразование utf-8 работает, но спецификация все еще существует. Как я могу удалить это? Это то, что я сейчас имею: batch_3={'src':'/Users/jt/src','dest':'/Users/jt/dest/'} batches=[batch_3] for b in batches: s_files=os.listdir(b['src']) for file_name in s_files: ff_name = os.path.join(b['src'], file_name) if […]

Как указать диапазон символов Unicode

Как указать диапазон символов юникода от ' ' (пробел) до \u00D7FF ? У меня есть регулярное выражение, такое как r'[\u0020-\u00D7FF]' и он не будет компилировать, говоря, что это плохой диапазон. Я новичок в регулярных выражениях Unicode, поэтому раньше у меня не было этой проблемы. Есть ли способ сделать это компиляцию или регулярное выражение, которое я […]

Как я могу использовать io.StringIO () с модулем csv?

Я попытался сделать резервную копию программы Python 3 до версии 2.7, и у меня возникла странная проблема: >>> import io >>> import csv >>> output = io.StringIO() >>> output.write("Hello!") # Fail: io.StringIO expects Unicode Traceback (most recent call last): File "<stdin>", line 1, in <module> TypeError: unicode argument expected, got 'str' >>> output.write(u"Hello!") # This […]

Печать Юникода в консоли eclipse Pydev и в режиме ожидания

Моя конфигурация: Win7 + Python 2.6 + eclipse + PyDev Как включить инструкции печати Unicode в: Консоль PyDev в eclipse Idle Python GUI Пример утверждения печати: print(u"שלום עולם") Это происходит так: ùìåí òåìí

python: unicode в терминале Windows, используется кодировка?

Я использую интерпретатор Python в терминале Windows 7. Я пытаюсь обернуть голову вокруг юникода и кодировок. Я печатаю: >>> s='ë' >>> s '\x89' >>> u=u'ë' >>> u u'\xeb' Вопрос 1 : Почему кодировка, используемая в строке s отличается от той, которая используется в строке unicode u ? Я продолжаю и печатаю: >>> us=unicode(s) Traceback (most […]

unicode (). decode ('utf-8', 'ignore'), поднимающий UnicodeEncodeError

Вот код: >>> z = u'\u2022'.decode('utf-8', 'ignore') Traceback (most recent call last): File "<stdin>", line 1, in <module> File "/usr/lib/python2.6/encodings/utf_8.py", line 16, in decode return codecs.utf_8_decode(input, errors, True) UnicodeEncodeError: 'latin-1' codec can't encode character u'\u2022' in position 0: ordinal not in range(256) Почему UnicodeEncodeError возникает, когда я использую .decode? Почему возникает ошибка, когда я использую […]

NameError: глобальное имя 'unicode' не определено – в Python 3

Я пытаюсь использовать пакет Python под названием bidi. В модуле этого пакета (algorithm.py) есть несколько строк, которые дают мне ошибку, хотя это часть пакета. Вот строки: # utf-8 ? we need unicode if isinstance(unicode_or_str, unicode): text = unicode_or_str decoded = False else: text = unicode_or_str.decode(encoding) decoded = True и вот сообщение об ошибке: Traceback (most […]

Interesting Posts

В чем разница между «SAME» и «VALID» дополнением в tf.nn.max_pool тензорного потока?

Python версии 2.7: XML ElementTree: как выполнять итерацию через определенные элементы дочернего элемента, чтобы найти совпадение

Есть ли лучший способ получить названную серию констант (перечисление) в Python?

выдавать в кодировке нечисловой функции числовое значение в Spark и Ipython

Как я могу вставить данные NULL в базу данных MySQL с помощью Python?

Как реализовано ключевое слово 'is' в Python?

Декодирование сообщения WBXML SyncML с устройства S60

Добавление папки на путь Python навсегда

Есть ли эквивалент python Ruby's 'rvm'?

Объединение 2 наборов данных csv с Python общим столбцом идентификатора – один csv имеет несколько записей для уникального идентификатора

«Неожиданное название раздела» с Sphinx – это проблема?

Обнаружение щелчков мыши в окнах с использованием python

ImportError с cx_Freeze и pyinstaller

Фиксированный эффект в Pandas или Statsmodels

Уменьшение использования памяти Django. Низко висящий фрукт?

Python - лучший язык программирования в мире.