Преобразование Unicode в UTF-8 Python

Я работаю с базой данных, которая на ней разбросала такие символы: â € ™. Мне нужно взять это из базы данных, конвертировать в UTF-8, а затем импортировать в другую базу данных, используя python. При печати в командной строке Windows эти символы выглядят следующим образом: \ xe2 \ u20ac \ u2122. Я попробовал различные комбинации .decode (), .encode () и unicode () для преобразования данных, но Im действительно застрял.

One Solution collect form web for “Преобразование Unicode в UTF-8 Python”

Всегда декодировать на входе и кодировать на выходе. (Для этого должна быть полезная мнемоника: возможно, « отнимите свой код [пальто], когда вы придете в помещении ».)

Декодирование на входе: вы говорите, что кодировка базы данных «UTF_8_bin». Вы используете MySQL-Python ? Если это так, то вы можете установить опцию use_unicode при подключении к базе данных. Затем все строки извлекаются из базы данных в Юникоде, поэтому вам не нужно беспокоиться об их расшифровке.

Кодирование на выходе: вы можете узнать текущую кодировку символов (или « кодовую страницу », как они ее называют в Windows) с chcp команды chcp . Предположим, что это код страницы 1252 . Тогда вы можете написать

 print text.encode('windows-1252') 

для создания чего-то, что вы можете прочитать из командной строки Windows.

Если вы пишете строки обратно в другую базу данных MySQL с использованием MySQL-Python, вам не нужно делать ничего особенного: MySQL-Python утверждает, что «вы всегда можете писать строки Unicode» (независимо от того, был ли указан use_unicode при открытии связь).

  • python - преобразование двоичных данных в utf-8
  • Python получает код символа в разных кодировках?
  • Сделать utf8 доступным для чтения в файле
  • Почему Python не распознает исходный файл, закодированный utf-8?
  • Проблема китайского Юникода?
  • Sublime Text 3, Python 3 и UTF-8 не любят друг друга
  • Байты в строке юникода Python
  • Python + PostgreSQL + странная ошибка ascii = UTF8
  •  
    Interesting Posts for Van-Lav

    Сопоставьте два списка в словаре в Python

    Как перейти на Python 3.4 из 3.5

    Python: разделение строки на элементы и добавление их в список

    Накопительное добавление при переходе по списку

    Ресурс временно недоступной ошибки с модулем подпроцесса в Python

    Изменить раскладку клавиатуры с помощью python?

    Невозможно загрузить видеопотоки с помощью API-интерфейса youtube v3 в python

    Переместить «help» в другую группу аргументов в python argparse

    Сигналы Django против основного метода сохранения

    Почему Python 2.6 добавил глобальную функцию next ()?

    Pandas: найдите строки, которые не существуют в другом DataFrame несколькими столбцами

    Нечувствительные к регистру уникальные поля модели в Django?

    Автоматически извлекать данные JSON через URL каждые X секунд и хранить в Amazon DynamoDB

    Свойство BadRequestError: BLOB, ENITY_PROTO или TEXT concise_topics должно быть в поле raw_property

    Получение черепахи для отскока от стен

    Python - лучший язык программирования в мире.