Tag: unicode

Ошибка при установке и использовании numpy

У меня проблемы с unicode, пытающиеся запустить numpy. Как указано здесь, и здесь я использую python с 4-байтным юникодом, я загрузил исходный код numpy 1.6.1 и запустил установщик python: в исходном каталоге numpy: which python /usr/local/bin/python python -c 'import sys; print sys.maxunicode' 1114111 python setup.py build python setup.py install cd ~ python -c 'import numpy' […]

Торнадо и Юникод

торнадо принимает unicode в адрес? #coding: utf-8 (there is # dont know how to show it here…) import tornado.ioloop import tornado.web class Abdou(tornado.web.RequestHandler): def get(self): self.write("hi") miaw = tornado.web.Application([ (u'/ééé', Abdou), ]) if __name__ == "__main__": miaw.listen(8000) tornado.ioloop.IOLoop в Колбе это сработало !!! from flask import Flask miaw = Flask(__name__) @miaw.route(u'/ééé') def abdou(): return "hi!" […]

UnicodeEncodeError с xlrd

Я пытаюсь прочитать .xlsx с xlrd. У меня все налажено и работает. Он работает с данными с обычными английскими буквами, а также с цифрами. Однако, когда он добирается до шведских букв (ÄÖÅ), это дает мне такую ​​ошибку: print str(sheet.cell_value(1, 2)) + " " + str(sheet.cell_value(1, 3)) + " " + str(sheet.cell_value(1, 4)) + " " […]

Словарь Python Gensim word2vec

Я хочу сделать word2vec с gensim. Я слышал, что словарный корпус должен быть unicode, поэтому я преобразовал его в unicode. # -*- encoding:utf-8 -*- # !/usr/bin/env python import sys reload(sys) sys.setdefaultencoding('utf-8') from gensim.models import Word2Vec import pprint with open('parsed_data.txt', 'r') as f: corpus = map(unicode, f.read().split('\n')) model = Word2Vec(size=128, window=5, min_count=5, workers=4) model.build_vocab(corpus,keep_raw_vocab=False) model.train(corpus) model.save('w2v') […]

Как заменить символы Unicode на турецкие символы в текстовом файле с помощью Python

Я работаю над Twitter. Я получил данные из Twitter с Stream API, и результатом приложения является JSON-файл. Я написал данные твитов в текстовом файле, и теперь я вижу символы Unicode вместо турецких символов. Я не хочу искать / заменять в Notepad ++ вручную. Есть ли автоматическая опция для замены символов путем открытия txt-файла, чтения всех […]

Unicode арабская строка пользователю

У меня есть переменная, содержащая значение, подобное x='مصطفى' и я хочу преобразовать его в форму u'مصطفى' пользователю снова в некоторых функциях .. когда я пытаюсь выполнить u''+x это alawys дают мне ошибка: UnicodeDecodeError: 'ascii' codec can't decode byte 0xd9 in position 0: ordinal not in range(128) Любая помощь ?

Как удалить строку unicode из списка

Я пытаюсь удалить строки unicode «u» в моем списке строк. Список – это список участников с этого сайта http://www.boxofficemojo.com/yearly/chart/?yr=2013&p=.htm . У меня есть метод, который получает эти строки с этого сайта: def getActors(item_url): response = requests.get(item_url) soup = BeautifulSoup(response.content, "lxml") # or BeautifulSoup(response.content, "html5lib") tempActors = [] try: tempActors.append(soup.find(text="Actors:").find_parent("tr").find_all(text=True)[1:]) except AttributeError: tempActors.append("n/a") return tempActors Этот […]

unicode и проблема с python (доступ к кодам Unicode)

Вчера я написал следующую function для преобразования integer в Persian : def integerToPersian(number): listedPersian = ['۰','۱','۲','۳','۴','۵','۶','۷','۸','۹'] listedEnglish = ['0','1','2','3','4','5','6','7','8','9'] returnList = list() listedTmpString = list(str(number)) for i in listedTmpString: returnList.append(listedPersian[listedEnglish.index(i)]) return ''.join(returnList) Когда вы вызываете его так: integerToPersian(3455) , он return ۳۴۵۵ , ۳۴۵۵ равно 3455 на Persian и Arabic language Когда вы читаете такое […]

request.get возвращает 403, в то время как тот же URL-адрес работает в браузере

Я пытаюсь использовать форму поиска на rlsnet.ru . Вот определение формы, которое я извлек из исходного файла: <form id="site_search_form" action="/search_result.htm" method="get"> <input id="simplesearch_text_input" class="search__field" type="text" name="word" value="" autocomplete="off"> <input type="hidden" name="path" value="/" id="path"> <input type="hidden" name="enter_clicked" value="1"> <input id="letters_id" type="hidden" name="letters" value=""> <input type="submit" class="g-btn search__btn" value="Найти" id="simplesearch_button"> <div class="sf_suggestion"> <ul style="display: none; z-index:1000; opacity:0.85;"> […]

Декодирование Unicode в Python

У меня есть функция, которая получает строку, закодированную в Unicode \u05D4\u… как переменную str и я хочу изменить этот Unicode на буквы, так что эта str будет содержать переведенную строку. Как мне это сделать?

Python - лучший язык программирования в мире.