Как я могу преобразовать строки типа «\ u5c0f \ u738b \ u5b50 \ u003a \ u6c49 \ u6cd5 \ u82f1 \ u5bf9 \ u7167" на иероглифы

Теперь я работаю над небольшим инструментом для запроса и декодирования веб-страницы, на которой китайские символы хранятся в виде строки, например

\u5c0f\u738b\u5b50\u003a\u6c49\u6cd5\u82f1\u5bf9\u7167 

в исходном коде, что-то вроде unicode. Я хочу преобразовать его в китайские символы.

Я могу пройти через этот сайт http://rishida.net/tools/conversion/ . Но как я могу сделать это с помощью python?

One Solution collect form web for “Как я могу преобразовать строки типа «\ u5c0f \ u738b \ u5b50 \ u003a \ u6c49 \ u6cd5 \ u82f1 \ u5bf9 \ u7167" на иероглифы”

Это уже кодовые обозначения Unicode. Они представляют китайские иероглифы, но используют escape-коды, которые проще для разработчика:

 >>> print u'\u5c0f\u738b\u5b50\u003a\u6c49\u6cd5\u82f1\u5bf9\u7167'小王子:汉法英对照 

Вам не нужно ничего делать, чтобы преобразовать их; escape-форма \uxxxx – это просто еще один способ выразить один и тот же код. См. Литералы строк :

\uxxxx
Символ с 16-разрядным шестнадцатеричным значением xxxx (только для Unicode)
\Uxxxxxxxx
Символ с 32-разрядным шестнадцатеричным значением xxxxxxxx (только для Unicode)

Python интерпретирует эти escape-коды при чтении исходного кода для построения значения unicode.

Если источником данных не является исходный код Python, а из Интернета, вместо этого у вас есть данные JSON, который использует тот же формат escape:

 >>> import json >>> print json.loads('"\u5c0f\u738b\u5b50\u003a\u6c49\u6cd5\u82f1\u5bf9\u7167"')小王子:汉法英对照 

Обратите внимание, что тогда значение должно быть частью большей строки, которая, по крайней мере, включает в себя кавычки, чтобы отметить эту строку.

Также обратите внимание, что формат escape-последовательности строки JSON отличается от Python, когда речь заходит о не-BMP (дополнительных) кодовых точках; JSON рассматривает такие, как UTF-16, путем создания суррогатной пары и использует две последовательности \uxxxx для такого кода. В Python вы должны использовать 32-разрядное шестнадцатеричное значение \Uhhhhhhhh .

  • Scrapy xpath utf-8 литералы
  • Как установить кодировку sys.stdout в Python 3?
  • Как преобразовать escape-последовательности unicode в unicode символы в строке python
  • Печать Юникода в консоли eclipse Pydev и в режиме ожидания
  • Как прочитать ввод Unicode и сравнить строки Unicode в Python?
  • Python - как конвертировать Unicode имя файла в CP437?
  • Как заставить интерпретатор python правильно обрабатывать символы, отличные от ASCII, в строковых операциях?
  • UnicodeDecodeError при использовании json.dumps ()
  • Могу ли я отключить неявные преобразования юникода Python, чтобы найти ошибки в смешанных строках?
  • Нормализация Unicode
  • Правильное выражение регулярного выражения юникода Python не совпадает с некоторыми символами юникода - ошибка или ошибка?
  • Python - лучший язык программирования в мире.