Tag: utf 8

Django UnicodeEncodeError в форме рендеринга ('utf-8')

Я получил UnicodeEncodeError при рендеринге страницы с использованием форм. UnicodeEncodeError at /individual/acc/ 'ascii' codec can't encode character u'\u0142' in position 2: ordinal not in range(128) Вот фрагмент HTML (стандартное использование форм): <table> {{user_form.as_table}} {{individual_form.as_table}} </table> Я создаю их так: user_form = UserCreationForm(request.POST) individual_form = IndividualForm(request.POST) и отправляется на страницу context = {'gd': generalData(request), 'head': "images/header_individual.png", […]

Правильно соскабливание и отображение японских символов с использованием Python Django BeautifulSoup и Curl

Я пытаюсь очистить страницу на японском языке, используя python, curl и BeautifulSoup. Затем я сохраняю текст в базе данных MySQL, использующей кодировку utf-8, и покажу результирующие данные с помощью Django. Вот пример URL: https://www.cisco.apply2jobs.com/ProfExt/index.cfm?fuseaction=mExternal.showJob&RID=930026&CurrentPage=180 У меня есть функция, которую я использую для извлечения HTML в виде строки: def get_html(url): c = Curl() storage = StringIO() […]

Как преобразовать int, представляющий символ UTF-8, в кодовую точку Unicode?

Давайте используем символ Latin Capital Letter a с Ogonek (U + 0104) в качестве примера. У меня есть int, который представляет собой кодированную форму UTF-8: my_int = 0xC484 # Decimal: `50308` # Binary: `0b1100010010000100` Если использовать функцию unichr я получаю: \uC484 или 쒄 (U + C484) Но мне это нужно для вывода: Ą Как преобразовать […]

Должен ли я добавить encoding = 'utf-8' в мой обработчик регистрации Python?

Предположим, что я хотел бы обрабатывать строки Unicode при регистрации с помощью Python 2.7. Кажется «правильным» добавить параметр кодирования в FileHandler. # coding=utf-8 import logging logger = logging.getLogger() logger.addHandler(logging.FileHandler('my_log.txt', encoding='utf-8')) logger.error(u'Pão') logger.error('São') У этого есть несколько проблем, хотя: Он вызывает UnicodeDecodeError в строчном литерале UTF-8 'São'. Выходной файл имеет окончание строк LF в Windows, когда […]

UnicodeDecodeError Загрузка с помощью sqlalchemy

Я запрашиваю базу данных MySQL с sqlalchemy и получаю следующую ошибку: UnicodeDecodeError: 'utf8' codec can't decode bytes in position 498-499: unexpected end of data Столбец в таблице был определен как Unicode(500) поэтому эта ошибка подсказывает мне, что есть запись, которая была усечена, потому что она была длиннее 500 символов. Есть ли способ справиться с этой […]

pandas to_sql дает ошибку декодирования Unicode

У меня есть файл данных pandas, загруженный через read_csv, который я пытаюсь нажать на базу данных через to_sql, когда я пытаюсь df.to_sql("assessmentinfo_pivot", util.ENGINE) Я возвращаю unicodeDecodeError: UnicodeEncodeError: 'ascii' codec can't encode characters in position 83-84: ordinal not in range(128) Нет опции кодирования для to_sql для указания utf-8 для to_sql, а Engine был создан с кодировкой, […]

Почему chardet говорит, что моя кодированная UTF-8 строка (первоначально декодированная из ISO-8859-1) является ASCII?

Я пытаюсь преобразовать символы ascii в utf-8. В этом маленьком примере ниже все еще сохраняются символы ascii: chunk = chunk.decode('ISO-8859-1').encode('UTF-8') print chardet.detect(chunk[0:2000]) Он возвращает: {'confidence': 1.0, 'encoding': 'ascii'} Как так?

Преобразование строки из xmlcharrefreplace обратно в utf-8

У меня есть следующая часть кода: In [8]: st = u"опа" In [11]: st.encode("ascii", "xmlcharrefreplace") Out[11]: 'опа' In [14]: st1 = st.encode("ascii", "xmlcharrefreplace") In [15]: st1.decode("ascii", "xmlcharrefreplace") Out[15]: u'опа' In [16]: st1.decode("utf-8", "xmlcharrefreplace") Out[16]: u'опа' Вы хоть представляете, как преобразовать st1 обратно в u"опа" ?

Разделите модификаторы символов Unicode

Каков самый простой способ удалить модификаторы символов из строки Unicode в Python? Например: A͋͠r͍̞̫̜͌ͦ̈͐t̼̭͞hu̡̙̞̘̙̬͖͓rͬͣ̐ͮͥͨ͏̣ должен стать Артуром Я пробовал документы, но я не мог найти ничего, что бы это делало.

Проблемы с кодировкой python's etree.tostring

Я использую xml.etree.cElementTree python 2.6.2 для создания XML-документа: import xml.etree.cElementTree as etree elem = etree.Element('tag') elem.text = (u"Würth Elektronik Midcom").encode('utf-8') xml = etree.tostring(elem,encoding='UTF-8') В конце дня xml выглядит так: <?xml version='1.0' encoding='UTF-8'?> <tag>Würth Elektronik Midcom</tag> Похоже, что tostring проигнорировала параметр кодирования и закодировала «ü» в какую-либо другую кодировку символов («ü» является допустимой кодировкой utf-8, я […]

 
Interesting Posts for Van-Lav

строка для преобразования OrderedDict в python

поиск дубликатов в списке списков

официальное название этого подхода к программированию для вычисления объединения и пересечения

Как изменить размер фигуры на морском участке?

Ошибка преобразования Unicode с использованием Python в Emacs

Получить формулу из ячейки Excel с помощью python xlrd

Нужно ли знать архитектуру машины для написания кода?

Пожалуйста, ознакомьтесь с моим примером программы Python

Как построить объект timedelta из простой строки

Django: Как представление получает несколько значений из URL-адреса?

Python eval (компиляция (…), песочница), globals идут в песочнице, если только в def, почему?

Как предварительно заполнить поля UserProfile в администраторе Django?

Почему понимание списка намного быстрее, чем numpy для умножения массивов?

Как использовать средний метод для pandas TimeSeries с значениями десятичного типа?

Анализ аудио с использованием быстрого преобразования Фурье

Python - лучший язык программирования в мире.