разобрать html красивый суп

У меня есть html-страница

<a email="corporate@max.ru" href="http://www.max.ru/agent?message&to=corporate@max.ru" title="Click herе" class="mf_spIco spr-mrim-9"></a><a class="mf_t11" type="booster" href="http://max.ru/mail/corporate/"> 

Я пишу строку синтаксического анализа

  soup = BeautifulSoup(data string = soup.find("a",{"email": ""}) print string 

Но это не работает. Где ошибка?

One Solution collect form web for “разобрать html красивый суп”

Ваша ошибка заключалась в использовании attrs dict для поиска элементов с атрибутом электронной почты, который пуст. Попробуйте это вместо этого.

 #!/usr/bin/env python from BeautifulSoup import BeautifulSoup import urllib2 req = urllib2.urlopen('http://worldnuclearwar.ru') soup = BeautifulSoup(req) print soup.find("a", email=True)["email"] 

Чтобы напечатать атрибут email первого элемента, который имеет атрибут email . Если вам нужны все электронные письма, попробуйте

 for link in soup.findAll("a", email=True): print link["email"] 
  • Регулярное выражение Python, соответствующее свойствам Unicode
  • Замена текста с использованием регулярного выражения в Python с именованными параметрами
  • Regex для разделения слов в Python
  • Поиск в HTML-строке по строке с регулярным выражением в Python
  • Регулярное выражение Python: включение пробела внутри диапазона символов
  • IP-адрес regex python
  • Удаление хэш-комментариев, которые не входят в кавычки
  • python: шаблон поиска регулярных выражений для двоичных файлов (половина байта)
  • Необязательно получить параметры в django?
  • Удаление Unicode \ uxxxx в String из JSON с использованием Regex
  • Проблема с Python 2 re.sub
  • Python - лучший язык программирования в мире.