разобрать html красивый суп

У меня есть html-страница

<a email="corporate@max.ru" href="http://www.max.ru/agent?message&to=corporate@max.ru" title="Click herе" class="mf_spIco spr-mrim-9"></a><a class="mf_t11" type="booster" href="http://max.ru/mail/corporate/"> 

Я пишу строку синтаксического анализа

  soup = BeautifulSoup(data string = soup.find("a",{"email": ""}) print string 

Но это не работает. Где ошибка?

One Solution collect form web for “разобрать html красивый суп”

Ваша ошибка заключалась в использовании attrs dict для поиска элементов с атрибутом электронной почты, который пуст. Попробуйте это вместо этого.

 #!/usr/bin/env python from BeautifulSoup import BeautifulSoup import urllib2 req = urllib2.urlopen('http://worldnuclearwar.ru') soup = BeautifulSoup(req) print soup.find("a", email=True)["email"] 

Чтобы напечатать атрибут email первого элемента, который имеет атрибут email . Если вам нужны все электронные письма, попробуйте

 for link in soup.findAll("a", email=True): print link["email"] 
  • Извлечь дату и значение валюты (разделенные запятой) из файла
  • Как использовать регулярное выражение python для замены с помощью захваченной группы?
  • Python Regex работает не так, как ожидалось
  • Python regex конвертирует URL-адрес youtube в YouTube
  • Исходная строка и регулярное выражение в Python
  • Написание правил грамматики для контекстно-зависимых элементов с использованием Pyparsing
  • python - проблемы с регулярным выражением и unicode
  • Регулярное выражение для соответствия началу имени файла и расширению имени файла.
  • Python - лучший язык программирования в мире.