Разбор JS с красивым супом

У меня есть страница, обрабатываемая красивым супом. Но там у меня есть код js:

<script type="text/javascript"> var utag_data = { customer_id : "_PHL2883198554", customer_type : "New", loyalty_id : "N", declined_loyalty_interstitial : "false", site_version : "Desktop Site", site_currency: "de_DE_EURO", site_region: "uk", site_language: "en-GB", customer_address_zip : "", customer_email_hash : "", referral_source : "", page_type : "product", product_category_name : ["Lingerie"], product_category_id :[jQuery("meta[name=defaultParent]").attr("content")], product_id : ["5741462261401"], product_image_url : ["http://images.urbanoutfitters.com/is/image/UrbanOutfitters/5741462261401_001_b?$detailmain$"], product_brand : ["Pretty Polly"], product_selling_price : ["20.0"], promo_id : "6", product_referral : ["WOMENS-SHAPEWEAR-LINGERIE-SOLUTIONS-EU"], product_name : ["Pretty Polly Shape It Up Tummy Shaping Camisole"], is_online_only : true, is_back_in_stock : false } </script> 

Как я могу получить некоторые значения из этого ввода? Должен ли я работать с этим примером, например, с текстом? Я имею в виду написать его какой-то переменной и разделить, а затем взять некоторые данные?

благодаря

One Solution collect form web for “Разбор JS с красивым супом”

Когда у вас есть текст скрипта через

 js_text = soup.find('script', type="text/javascript").text 

например. Затем вы можете использовать регулярное выражение для поиска данных, я уверен, что есть более простой способ сделать это, но регулярное выражение также не должно быть трудным.

 import re regex = re.compile('\n^(.*?):(.*?)$|,', re.MULTILINE) #compile regex js_text = re.findall(regex, js_text) # find first item @ new line to : and 2nd item @ from : to the end of the line or , js_text = [jt.strip() for jt in js_text] # to strip away all of the extra white space. 

это вернет список имен и значений в имени | значение | имя2 | значение2 … порядок, с которым позже можно будет возиться с или конвертировать в словарь.

  • Скремблирование сайта с помощью python3.6. Я не могу пройти мимо страницы входа
  • urllib2 не возвращает полную веб-страницу
  • селен не выполняет итерацию по элементам
  • Скремблирование динамического содержимого на веб-сайте
  • Нажав ссылку, используя beautifulsoup в python
  • BeautifulSoup - Получить текст в теге только в том случае, если определенная строка найдена
  • Разбор веб-сайта Python Beautifulsoup4
  • Нажмите кнопку на веб-сайте, затем очистите веб-страницу
  • шаблон regex в python для анализа тегов заголовков HTML
  • Может ли телеграмм бот читать сообщения канала
  • Python: csv.writer, записывающий каждый символ слова в отдельном столбце / ячейке
  • Python - лучший язык программирования в мире.