Tag: кодирования

php, python и utf-8

У меня есть программа python, работающая очень хорошо. Он подключается к нескольким веб-сайтам и выводит желаемую информацию. Поскольку не все веб-сайты закодированы с помощью utf-8, я запрашиваю кодировку из заголовков и использую метод unicode(string, encoding) для декодирования (я не уверен, подходит ли это для этого, но он работает очень хорошо). Когда я запускаю программу python, […]

Всегда ли лучше писать функцию для всего, что нужно повторить дважды?

Сам я не могу дождаться, когда напишу функцию, когда мне нужно сделать что-то более двух раз. Но когда дело доходит до вещей, которые появляются только дважды, это немного сложнее. Для кода, которому требуется более двух строк, я напишу функцию. Но когда приходится сталкиваться с такими вещами, как: print ("Hi, Tom") print ("Hi, Mary") Я не […]

Python – сокращение цикла if / for

У меня есть несколько строк кода для итерации над dict в списке, и я хочу сократить его. Он работает отлично, как есть, но кажется, что слишком много кода, и я пытаюсь понять, как сохранить код в Python (или вообще на самом деле). for d in dev['devices']: if d['name'] == devName: devFound = True break Структура […]

Кодировать ключи словарей внутри списка от unicode до ascii

У меня есть образец ответа с списком друзей из facebook: [{u'uid': 513351886, u'name': u'Mohammed Hossein', u'pic_small': u'http://profile.ak.fbcdn.net/hprofile-ak-snc4/hs643.snc3/27383_513351886_4933_t.jpg'}, {u'uid': 516583220, u'name': u'Sim Salabim', u'pic_small': u'http://profile.ak.fbcdn.net/hprofile-ak-snc4/hs348.snc4/41505_516583220_5681339_t.jpg'}] Как я могу проанализировать этот список ключей кодировки словарей на ascii? Я пробовал что-то вроде этого: response = simplejson.load(urllib.urlopen(REST_SERVER, data)) for k in response: for id, stuff in k.items(): id.encode("ascii") logging.debug("id: […]

Функция Python open («x», «r»), откуда я могу узнать, какой кодировке должен иметь файл?

Если скрипт python использует функцию open("filename", "r") для открытия и последующего чтения содержимого текстового файла, как я могу определить, какую кодировку должен иметь этот файл? Обратите внимание, что, поскольку я выполняю этот скрипт из своей собственной программы, если есть какой-либо способ контролировать это через переменные среды, то это достаточно хорошо для меня. Кстати, это Python […]

Как подключить Unicode к родному приложению в PowerShell

У меня есть родная программа, написанная на Python, которая ожидает его ввода на stdin. В качестве простого примера, #!python3 import sys with open('foo.txt', encoding='utf8') as f: f.write(sys.stdin.read()) Я хочу иметь возможность передать строку (PowerShell) этой программе в качестве стандартного ввода. Python ожидает своего стандартного ввода в кодировке, указанной в $env:PYTHONIOENCODING , которую я обычно устанавливаю […]

Частота счета ngrams

Я разделил текст на последующие слова, используя ngrams с этим скриптом Python: from nltk.util import ngrams sentence = open('text.txt', "r") n = 2 sixgrams = ngrams(sentence.read().split(), n) for grams in sixgrams: print (grams) Теперь я столкнулся с двумя следующими проблемами. 1 . Мой результат выглядит так ('\xd1\x8e\xd0\xbc', '\xd0\xb1\xd0\xb0\xd0\xb9\xd0\xb3\xd0\xb0\xd0\xb0\xd0\xbd') Возможно, потому, что файл text.txt имеет русские […]

Python UTF-8 не может декодировать байт на 32-битной машине

он отлично работает на 64-битных машинах, но по какой-то причине не будет работать на python 2.4.3 на 32-битном экземпляре. я получаю ошибку 'utf8' codec can't decode bytes in position 76-79: invalid data для кода try: str(sourceresult.sourcename).encode('utf8','replace') except: raise Exception( repr(sourceresult.sourcename ) ) он возвращает «kazamidori blog \ xf9» Я изменил файл site.py, чтобы сделать UTF8 […]

Строковый литерал байта с символами не-ascii

Видимо, я могу сделать это в Python 2.7: value = '國華' Кажется, Python использует кодировку для кодирования символов в строковом литерале в байтовую строку. Что это за кодировка? Это кодировка, определенная в sys.getdefaultencoding() , кодировка исходного файла или что-то еще? благодаря

Python: предложение о том, как улучшить запись в потоковой текстовый файл в Python

Я изучаю, как писать потоковые строки в виде файлов в python . обычно я использую выражение как myfile = open("test.txt", w) for line in mydata: … myfile.write(line + '\n') myfile.close() Python создает текстовый файл в каталоге и сохраняет значения chunk-by-chunk с интервалами времени. У меня есть следующие вопросы: можно ли установить буфер? (например: сохранение данных […]

Python - лучший язык программирования в мире.