Получить внутренний текст из lxml

lxml.html.fromstring настаивает на завершении всего тега ( p умолчанию). Из этого дерева тегов,

 <p>this is <b>the</b> good stuff<p> 

Я хочу извлечь строку:

 this is <b>the</b> good stuff 

Как мне это сделать?

One Solution collect form web for “Получить внутренний текст из lxml”

Это часто называют «внутренним xml», а не «внутренним текстом». Это один из возможных способов получить внутренний xml элемента:

 import lxml.etree as etree import lxml.html html = "<p>this is <b>the</b> good stuff<p>" tree = lxml.html.fromstring(html) node = tree.xpath("//p")[0] result = node.text + ''.join(etree.tostring(e) for e in node) print(result) 

вывод :

 this is <b>the</b> good stuff 
  • Как эту функцию можно переписать для реализации OrderedDict?
  • Проверка schematron с помощью lxml в Python: как получить ошибки проверки?
  • Анализ большого XML-файла с помощью Python lxml и Iterparse
  • Используйте lxml для анализа текстового файла с плохим заголовком в Python
  • Как извлечь родительский тег html в Python, сопоставляя строку
  • синтаксический анализ XML-файла получает UnicodeEncodeError (ElementTree) / ValueError (lxml)
  • Python3, lxml и «Symbol not found: _lzma_auto_decoder» в Mac OS X 10.9
  • Невозможно правильно отобразить строку unicode после разбора файла с помощью lxml, отлично работает с простым чтением файла
  • Python - лучший язык программирования в мире.