Получить внутренний текст из lxml

lxml.html.fromstring настаивает на завершении всего тега ( p умолчанию). Из этого дерева тегов,

 <p>this is <b>the</b> good stuff<p> 

Я хочу извлечь строку:

 this is <b>the</b> good stuff 

Как мне это сделать?

One Solution collect form web for “Получить внутренний текст из lxml”

Это часто называют «внутренним xml», а не «внутренним текстом». Это один из возможных способов получить внутренний xml элемента:

 import lxml.etree as etree import lxml.html html = "<p>this is <b>the</b> good stuff<p>" tree = lxml.html.fromstring(html) node = tree.xpath("//p")[0] result = node.text + ''.join(etree.tostring(e) for e in node) print(result) 

вывод :

 this is <b>the</b> good stuff 
  • Python XpathEvaluator без пространства имен
  • lxml xpath не игнорирует "& nbsp;"
  • Установка easy_install ... для установки lxml
  • Setup.py: установить lxml с Python2.6 на CentOS
  • Как я могу удалить пространства имен из дерева lxml?
  • Невозможно правильно отобразить строку unicode после разбора файла с помощью lxml, отлично работает с простым чтением файла
  • Исходный код Parsing (Python). Подход: прекрасный суп, lxml, разность html5lib?
  • В чем заключаются сделки с https при использовании lxml?
  •  
    Interesting Posts for Van-Lav
    Python - лучший язык программирования в мире.