Tag: unicode

Только первый символ строк unicode, записываемых в csv

Вкратце моя проблема заключается в том, что мой скрипт не может писать полные строки unicode (извлеченные из db) в csv, вместо этого в файл записывается только первый символ каждой строки. например: U,1423.0,831,1,139 Где выход должен быть: University of Washington Students,1423.0,831,1,139 Некоторые предпосылки: я подключаюсь к базе данных MSSQL, используя pyodbc. У меня есть файл конфигурации […]

Как получить имя месяца в юникоде в Python?

Я пытаюсь получить unicode-версию calendar.month_abbr[6] . Если я не укажу кодировку для локали, я не знаю, как преобразовать строку в unicode. Пример кода ниже показывает мою проблему: >>> import locale >>> import calendar >>> locale.setlocale(locale.LC_ALL, ("ru_RU")) 'ru_RU' >>> print repr(calendar.month_abbr[6]) '\xb8\xee\xdd' >>> print repr(calendar.month_abbr[6].decode("utf8")) Traceback (most recent call last): File "<stdin>", line 1, in <module> […]

Как удалить этот \ xa0 из строки в python?

У меня есть следующая строка: word = u'Buffalo,\xa0IL\xa060625' Мне не нужен «\ xa0». Как я могу избавиться от него? Строка, которую я хочу: word = 'Buffalo, IL 06025

Убедитесь, что Python 2.6 ftplib не поддерживает имена файлов Unicode? Альтернативы?

Может ли кто-то подтвердить, что Python 2.6 ftplib НЕ поддерживает имена файлов Unicode? Или нужно, чтобы имена файлов Unicode были специально закодированы для использования с модулем ftplib? Следующий обмен электронной почтой, похоже, подтверждает мой вывод о том, что модуль ftplib поддерживает только имена файлов ASCII. Должен ли ftplib использовать кодировку UTF-8 вместо латинского-1? http://mail.python.org/pipermail/python-dev/2009-January/085408.html Любые […]

Python Как исправить сломанную кодировку utf-8?

Моя строка – Niệm Bồ Tát (Thiá»n sÆ° Nhất Hạnh) и я хочу декодировать ее в Niệm Bồ Tát (Thiền sư Nhất Hạnh) Я вижу, что сайт может сделать это http : //www.enderminh.com/minh/utf8-to-unicode-converter.aspx и я начинаю попробовать Python mystr = '09. Bát Nhã Tâm Kinh' mystr.decode('utf-8') но на самом деле это неверно, потому что исходная […]

Ошибка кодирования с помощью node.js

Я переписываю небольшой скрипт python в node.js. Оригинальный скрипт работал следующим образом: # -*- coding: utf-8 -*- import urllib import httplib import json def rpc(url, args = { }): try: post_data = json.dumps({'args': args}) f = urllib.urlopen(url, post_data) if not f or f.code != 200: return { 'result': 1, 'error': 'urlopen returned error' } data […]

Ошибка открытия файла с помощью кодека utf-8 в python

Я выполняю следующий код для windows xp и python 2.6.4 Но это показывает IOError. Как открыть файл, чье имя имеет кодек utf-8. >>> open( unicode('한글.txt', 'euc-kr').encode('utf-8') ) Traceback (most recent call last): File "<pyshell#0>", line 1, in <module> open( unicode('한글.txt', 'euc-kr').encode('utf-8') ) IOError: [Errno 22] invalid mode ('r') or filename: '\xed\x95\x9c\xea\xb8\x80.txt' Но следующий код для […]

Python TypeError: ожидается объект символьного буфера, личное недоразумение

я застрял в этой ошибке в течение длительного времени: TypeError: expected a character buffer object я просто понимаю, что я неправильно понял, это что-то о различии между строкой unicode и «простой» строкой, я попытался использовать вышеуказанный код с «нормальной» строкой, в то время как мне пришлось передать однокодовый файл. Так что простывание простого «u» до […]

IDLE и символы Unicode (2.5.4)

Почему IDLE обрабатывает один символ правильно, но не другой? >>> e = '€' >>> print unichr(ord(e)) # looks like a very thin rectangle on my system. >>> p = '£' >>> print unichr(ord(p)) £ >>> ord(e) 128 >>> ord(p) 163 Я попытался добавить различные строки кодирования #, но это не помогло. EDIT: браузер должен быть […]

Преобразование CSV в YAML, с Unicode?

Я пытаюсь преобразовать CSV-файл, содержащий строки Unicode, в файл YAML с использованием Python 3.4. В настоящее время синтаксический анализатор YAML избегает моего текста в кодировке Unicode в строку ASCII. Я хочу, чтобы анализатор YAML экспортировал строку Unicode в виде строки Unicode без символов escape. Конечно, я что-то недопонимаю, и я был бы признателен за любую […]

Python - лучший язык программирования в мире.