Tag: json

Использование многострочных регулярных выражений в Python?

Я использую регулярные выражения в Python для поиска по источнику страницы и поиска всей json-информации в javascript. В частности, пример будет выглядеть примерно так: var fooData = { id: 123456789, name: "foo bar", country_name: "foo", country_is_eu: null, foo_bars: null, foo_email: null, foo_rate: 1.0, foo_id: 0987654321 }; Я довольно новичок в понимании всего, что нужно знать […]

Python CSV для парсера JSON добавляет кавычки к выводу

У меня есть CSV для скрипта JSON Python, благодаря пользователю Петри, который позволил мне преобразовать свалку Geonames CSV в дружественный MongoImport JSON. Проблема в том, что Geonames имеет поле под названием alternatenames , которое в настоящее время цитируется и рассматривается как одна длинная строка. Поэтому он не может быть запрошен правильно в MongoDB. Я хотел […]

Попытка разобрать twitter json из текстового файла

Я новичок в python и пытаюсь разобрать «твиты» из текстового файла для анализа. В моем тестовом файле есть несколько твитов, вот пример одного из них: {"created_at":"Mon May 06 17:39:59 +0000 2013","id":331463367074148352,"id_str":"331463367074148352","text":"Extra\u00f1o el trabajo en las aulas !! * se jala los cabellos","source":"\u003ca href=\"http:\/\/twitter.com\/download\/iphone\" rel=\"nofollow\"\u003eTwitter for iPhone\u003c\/a\u003e","truncated":false,"in_reply_to_status_id":null,"in_reply_to_status_id_str":null,"in_reply_to_user_id":null,"in_reply_to_user_id_str":null,"in_reply_to_screen_name":null,"user":{"id":276765971,"id_str":"276765971","name":"Shiro","screen_name":"_Shira3mmanueL_","location":"","url":null,"description":null,"protected":false,"followers_count":826,"friends_count":1080,"listed_count":5,"created_at":"Mon Apr 04 01:36:52 +0000 2011","favourites_count":1043,"utc_offset":-21600,"time_zone":"Mexico City","geo_enabled":true,"verified":false,"statuses_count":28727,"lang":"es","contributors_enabled":false,"is_translator":false,"profile_background_color":"1A1B1F","profile_background_image_url":"http:\/\/a0.twimg.com\/images\/themes\/theme9\/bg.gif","profile_background_image_url_https":"https:\/\/si0.twimg.com\/images\/themes\/theme9\/bg.gif","profile_background_tile":false,"profile_image_url":"http:\/\/a0.twimg.com\/profile_images\/3608152674\/45133759fb72090ebbe880145d8966a6_normal.jpeg","profile_image_url_https":"https:\/\/si0.twimg.com\/profile_images\/3608152674\/45133759fb72090ebbe880145d8966a6_normal.jpeg","profile_banner_url":"https:\/\/si0.twimg.com\/profile_banners\/276765971\/1367525440","profile_link_color":"2FC2EF","profile_sidebar_border_color":"181A1E","profile_sidebar_fill_color":"252429","profile_text_color":"666666","profile_use_background_image":true,"default_profile":false,"default_profile_image":false,"following":null,"follow_request_sent":null,"notifications":null},"geo":{"type":"Point","coordinates":[19.30303082,-99.54709768]},"coordinates":{"type":"Point","coordinates":[-99.54709768,19.30303082]},"place":{"id":"1d23a12800a574a8","url":"http:\/\/api.twitter.com\/1\/geo\/id\/1d23a12800a574a8.json","place_type":"city","name":"Lerma","full_name":"Lerma, M\u00e9xico","country_code":"MX","country":"M\u00e9xico","bounding_box":{"type":"Polygon","coordinates":[[[-99.552193,19.223171],[-99.552193,19.4343],[-99.379483,19.4343],[-99.379483,19.223171]]]},"attributes":{}},"contributors":null,"retweet_count":0,"favorite_count":0,"entities":{"hashtags":[],"symbols":[],"urls":[],"user_mentions":[]},"favorited":false,"retweeted":false,"filter_level":"medium","lang":"es"} Мой код: […]

не удалось загрузить библиотеку json при установке модуля twitter api

im пытается работать с twitter api с python3.3 в окнах в то время как я пытаюсь установить, используя python setup.py install Я получаю эту ошибку: raise ImportError, "Unable to load a json library" для этого я устанавливаю простой json-модуль вручную ошибка возвращается снова Traceback (most recent call last): File "C:\Users\schatterjee\workspace\test\test.py", line 1, in <module> import […]

Преобразуйте строку Unicode в UTF-8, а затем в JSON

Я хочу кодировать строку в UTF-8 и просматривать соответствующие байты UTF-8 отдельно. В Python REPL следующее работает нормально: >>> unicode('©', 'utf-8').encode('utf-8') '\xc2\xa9' Обратите внимание, что я использую U + 00A9 COPYRIGHT SIGN в качестве примера здесь. '\xC2\xA9' близок к тому, что я хочу – строка, состоящая из двух отдельных кодовых точек: U + 00C2 и […]

Неужели json.load неэффективен?

Я смотрел на источник модуля json чтобы попытаться ответить на другой вопрос, когда нашел что-то любопытное. Извлечение docstring и целая куча аргументов ключевого слова, источник json.load выглядит следующим образом: def load(fp): return loads(fp.read()) Это было совсем не так, как я ожидал. Если json.load не избегает накладных расходов на чтение всего файла одновременно, является ли его […]

Как фильтровать список URL-адресов в выражении jsonpath, содержащем подстроку в Python

Я должен отфильтровать список URL-адресов в выражении jsonpath, содержащем подстроку в Python, я пробовал следующее, но не смог получить желаемые результаты. Я упомянул http://goessner.net/articles/JsonPath/ и http://mikelev.in/2012/08/implementing-jsonpath-in-python-with-examples/ Вот подробности всего, что я пробовал: Мой ответ json: { "127.0.0.1": { "URLs": [ "http://www.test.ca/", "http://b.scorecardresearch.com/p?ns__t=1387392184071&ns__c=ISO-8859-1&c1=3&c3=_es_7948950&c4=56568219&c5=105139691&c6=&c10=1&c11=1016510&c13=728×90&c16=dfa&c2=14397547&ax_iframe=2&ns_ce_mod=vce_st&ns__p=1387391507295&ax_cid=14397547&ax_bl=0&ax_blt=1228&ns_ad_event=show&ns_ad_id=DCF277937840&ns_ad_sz=728×90", "http://cdn.media.ca/a/mediative/sites/test_en.js", "http://pt200233.unica.com/ntpage.gif?js=1&ts=1387392184554.791&lc=http%3A%2F%2Fwww.test.ca%2F%3Fni_title%3D%2Fhome%2Fhomepage&rf=http%3A%2F%2Fwww.test.ca%2F&rs=1680×1050&cd=32&ln=en&tz=GMT%20-05%3A00&jv=1&ck=UnicaID%3DwQVZatfvXZ5-YZ0yaPj&m.pn=homepage&m.mlc=%2Fhome&m.cv_c13=ctest-new&m.cv_c14=en&m.utv=ut.ctest.2.2.131022.74&m.host=www.test.ca&m.page=%2Fhome%2Fhomepage&m.mlc0=home&ets=1387392184559.194&site=test", ] } } Выше ответа Json анализируется как: parsed_input = json.loads(urllib.urlopen('<URL […]

Разбор вложенных JSON с использованием Python

Этот вывод JSON представляет собой агрегированный запрос MongoDB. Мне по существу нужно разобрать вложенные данные JSON до следующих значений в общую и _id. { 'ok': 1.0, 'result': [ { 'total': 142250.0, '_id': 'BC' }, { 'total': 210.88999999999996, '_id': 'USD' }, { 'total': 1065600.0, '_id': 'TK' } ] } Я пробовал 5 различных методов, чтобы получить […]

Python, читающий весь файл vs line by line – статистика памяти

Я пытаюсь прочитать файл с данными JSON (3.1M + records). Я пытаюсь проверить эффективность памяти и времени между чтением всего файла, как один раз, при чтении файла по строкам. File1 – это сериализованные данные JSON, которые представляют собой один список с словарями 3.1M + с размером 811M. File2 – это сериализованные данные JSON, каждая из […]

Невозможно декодировать строку json для объекта python, используя jsonpickle

Моя структура класса такова: class HelloWorld (object): def __init__(self, name, i, id): self.name = name self.i = i self.id = id Я создаю объект p = HelloWorld('pj', 3456, '1234') и передачу этого объекта в определение, где я использую jsonpickle.encode и jsonpickle.decode следующим образом >>>print(type(p)) <class 'HelloWorld'> >>>x = jsonpickle.encode(p) >>>print(x) {"i": 3456, "name": "pj", "py/object": […]

Python - лучший язык программирования в мире.