Скремблирование веб-контента с использованием xpath не будет работать

Я использую xpath для очистки веб-страницы Amazon в частности, но это не сработает. Может ли кто-нибудь дать мне совет? Вот ссылка на эту страницу: ссылка

Я хочу очистить их: «Веселье, печать с размером кредитной карты» Код, который я использую, находится здесь:

from lxml import html import requests url = 'http://www.amazon.co.uk/dp/B009CX5VN2' page = requests.get(url) tree = html.fromstring(page.text) feature_bullets = tree.xpath('//*[@id="feature-bullets"]/ul/li[1]/span/text()') 

Но feature_bullets всегда пуст. На самом деле нужна помощь.

HTML, который я загружаю, не соответствует вашим ожиданиям. Вот выражение, которое работает для меня:

 tree.xpath('//div[@id="technicalProductFeaturesATF"]/ul/li[1]/text()') 

Полная программа:

 from lxml import html import requests from pprint import pprint url = 'http://www.amazon.co.uk/dp/B009CX5VN2' page = requests.get(url) tree = html.fromstring(page.text) feature_bullets = tree.xpath('//div[@id="technicalProductFeaturesATF"]/ul/li/text()') pprint(feature_bullets) 

Результат:

 $ python foo.py ['Fun, credit card-sized prints', 'LCD film counter and shooting mode display', 'Camera mounted mirror for self portraits', 'Powered by CR2 Batteries, Built-in, Automatic electronic flash', 'Fujifilm Instax Mini 25 + 30 Instax Mini Film']