Tag: unicode

Будет ли строка UNICODE, содержащая только символы ASCII, всегда равна строке ASCII?

Я заметил следующее: >>> u'abc' == 'abc' True >>> 'abc' == u'abc' True Будет ли это всегда быть верным или может ли оно зависеть от локали системы? (Кажется, строки являются unicode в python 3: например, этот вопрос , но байты в 2.x)

Преобразование данных Unicode в int в python

Я получаю значения, переданные из url как: user_data = {} if (request.args.get('title')) : user_data['title'] =request.args.get('title') if(request.args.get('limit')) : user_data['limit'] = request.args.get('limit') Затем, используя его как if 'limit' in user_data : limit = user_data['limit'] conditions['id'] = {'id':1} int(limit) print type(limit) data = db.entry.find(conditions).limit(limit) Он печатает: <type 'unicode'> но я продолжаю получать type limit как unicode , что […]

Поведение юникода на Python в Google App Engine

Я полностью смутился с гей. У меня есть сценарий, который выполняет почтовый запрос (используя urlfetch из Google App Engine api), в качестве ответа мы получаем hpml-страницу cp1251. Затем я декодирую его, используя .decode ('cp1251') и проанализирую с помощью lxml. Мой код полностью работает на моей локальной машине: import re import leaf #simple wrapper for lxml […]

строки на иврите в python для s60

Я использую python для S60. Я хочу использовать строку на иврите, представлять их в графическом интерфейсе и отправлять их в SMS-сообщении. Кажется, что PythonScriptShell не принимает такие выражения, например: u"אבגדה" что я могу сделать? благодаря развитие ситуации: я добавил строку: # -*- coding: utf-8 -*- в качестве первой строки в исходном файле и в блокноте […]

Ошибка Python os.walk и japanese filename

Возможный дубликат: Python, Unicode и консоль Windows У меня есть папка с именем файла "01 – ナ ナ ナ ン 塊 .txt" Я открываю python в интерактивном приглашении в той же папке, что и файл, и пытаюсь перейти к папке hierachy: Python 3.1.2 (r312:79149, Mar 21 2010, 00:41:52) [MSC v.1500 32 bit (Intel)] on win32 […]

Исходные строки Python и unicode: как использовать веб-вход в качестве шаблонов регулярных выражений?

EDIT: Этот вопрос не имеет смысла, как только вы подберете флаг «r». Подробнее здесь . Для людей, которые ищут быстрый андерс, я добавил ниже. Если я буду вводить регулярное выражение вручную в сценарии Python, я могу использовать 4 комбинации флагов для строк шаблона: p1 = "pattern" p2 = u "pattern" p3 = r "pattern" p4 […]

Unbaking mojibake

Когда вы неправильно декодировали символы, как вы можете определить вероятных кандидатов для исходной строки? Ä×èÈÄÄî▒è¤ô_üiâAâjâüâpâXüj_10òb.png Я знаю, что это имя файла изображения должно было быть японским персонажем. Но с различными догадками в urllib, цитирующем / unquoting, кодировать и декодировать iso8859-1, utf8, я не смог уничтожить и получить исходное имя файла. Является ли коррупция обратимой?

Python os.walk Сделать его поддержкой Unicode / UTF-8?

Я изучил эту проблему, кажется, что использование Python 2.7 по умолчанию – ASCII, я не могу переключиться на python 3 (по умолчанию Unicode) из-за библиотек # -*- coding: utf-8 -*- print u'порядке' кажется, печатает хорошо, это будет ?????? без u но: print list(os.walk(ur'c:\somefoler')) возвращает \u0438\u0442… почему не читается как первый вывод? Кроме того, я использую […]

Чтение данных на русском языке из csv

У меня есть данные в CSV-файле, которые находятся на русском языке: 2-комнатная квартира РДТ', мкр Тастак-3, Аносова — Толе би;Алматы 2-комнатная квартира БГР', мкр Таугуль, Дулати (Навои) — Токтабаева;Алматы 2-комнатная квартира ЦФМ', мкр Тастак-2, Тлендиева — Райымбека;Алматы Разделитель ; символ. Я хочу читать данные и помещать их в массив. Я попытался прочитать эти данные, используя […]

Python, file (1) – Почему числа и диапазон (0x20, 0x100) используются для определения текстового или двоичного файла

Что касается решения для определения, является ли файл двоичным или текстовым в python , то ответчик использует: textchars = bytearray([7,8,9,10,12,13,27]) + bytearray(range(0x20, 0x100)) а затем использует .translate(None, textchars) для удаления (или замены ничем) всех таких символов в файле .translate(None, textchars) двоичным. Ответчик также утверждает, что этот выбор чисел «основан на действии файла (1)» (для текста, […]

Python - лучший язык программирования в мире.