Как я могу преобразовать строки типа «\ u5c0f \ u738b \ u5b50 \ u003a \ u6c49 \ u6cd5 \ u82f1 \ u5bf9 \ u7167" на иероглифы

Теперь я работаю над небольшим инструментом для запроса и декодирования веб-страницы, на которой китайские символы хранятся в виде строки, например

\u5c0f\u738b\u5b50\u003a\u6c49\u6cd5\u82f1\u5bf9\u7167 

в исходном коде, что-то вроде unicode. Я хочу преобразовать его в китайские символы.

Я могу пройти через этот сайт http://rishida.net/tools/conversion/ . Но как я могу сделать это с помощью python?

  • Python 3 UnicodeDecodeError: кодек 'charmap' не может декодировать байт 0x9d
  • Латинские символы Python и Unicode
  • Как исправить ошибку кодирования при преобразовании списка в формат csv?
  • UnicodeEncodeError: кодек ascii не может кодировать символ u '\ xe7' в позиции 17710: порядковый номер не в диапазоне (128)
  • Литералы Unicode, вызывающие недействительный синтаксис
  • chr () эквивалент, возвращающий объект байтов, в py3k
  • Ошибка MySQL «неправильное строковое значение» при сохранении строки unicode в Django
  • Эквивалент string.ascii_letters для строк unicode в python 2.x?
  • One Solution collect form web for “Как я могу преобразовать строки типа «\ u5c0f \ u738b \ u5b50 \ u003a \ u6c49 \ u6cd5 \ u82f1 \ u5bf9 \ u7167" на иероглифы”

    Это уже кодовые обозначения Unicode. Они представляют китайские иероглифы, но используют escape-коды, которые проще для разработчика:

     >>> print u'\u5c0f\u738b\u5b50\u003a\u6c49\u6cd5\u82f1\u5bf9\u7167'小王子:汉法英对照 

    Вам не нужно ничего делать, чтобы преобразовать их; escape-форма \uxxxx – это просто еще один способ выразить один и тот же код. См. Литералы строк :

    \uxxxx
    Символ с 16-разрядным шестнадцатеричным значением xxxx (только для Unicode)
    \Uxxxxxxxx
    Символ с 32-разрядным шестнадцатеричным значением xxxxxxxx (только для Unicode)

    Python интерпретирует эти escape-коды при чтении исходного кода для построения значения unicode.

    Если источником данных не является исходный код Python, а из Интернета, вместо этого у вас есть данные JSON, который использует тот же формат escape:

     >>> import json >>> print json.loads('"\u5c0f\u738b\u5b50\u003a\u6c49\u6cd5\u82f1\u5bf9\u7167"')小王子:汉法英对照 

    Обратите внимание, что тогда значение должно быть частью большей строки, которая, по крайней мере, включает в себя кавычки, чтобы отметить эту строку.

    Также обратите внимание, что формат escape-последовательности строки JSON отличается от Python, когда речь заходит о не-BMP (дополнительных) кодовых точках; JSON рассматривает такие, как UTF-16, путем создания суррогатной пары и использует две последовательности \uxxxx для такого кода. В Python вы должны использовать 32-разрядное шестнадцатеричное значение \Uhhhhhhhh .

    Python - лучший язык программирования в мире.