Python fetchching <title>

Я хочу получить заголовок веб-страницы, которую я открываю с помощью urllib2. Каков наилучший способ сделать это, проанализировать html и найти то, что мне нужно (на данный момент только -tag, но может потребоваться больше в будущем).

Есть ли хороший синтаксический разбор для этой цели?

4 Solutions collect form web for “Python fetchching <title>”

Да, я бы порекомендовал BeautifulSoup

Если вы получаете титул, это просто:

soup = BeautifulSoup(html) myTitle = soup.html.head.title 

или

 myTitle = soup('title') 

Взято из документации

Он очень надежный и будет анализировать html независимо от того, насколько он бесполезен.

Попробуйте Красивый суп :

 url = 'http://www.example.com' response = urllib2.urlopen(url) html = response.read() soup = BeautifulSoup(html) title = soup.html.head.title print title.contents 

Почему вы, ребята, импортируете всю дополнительную библиотеку для одной задачи. Нет регулярных выражений? не был ли запрос на urllib, а не bs4 или mech, которые являются сторонними? со стандартными библиотеками анализируйте html и сопоставляйте строку, затем разделите '>' '<' на re или whateves.

 N=(len(html)) for a in html(N): if '<title>' in a: Title=(str(a)) 

thats python 2 Думаю, вы можете разбить его

Используйте красивый суп .

 html = urllib2.urlopen("...").read() from BeautifulSoup import BeautifulSoup soup = BeautifulSoup(html) print soup.title.string 
  • Как получить URL-адрес перенаправления с помощью Python
  • urllib2 python (Перенос-кодирование: chunked)
  • Доступ к API Github с использованием Personal Access Token с Python urllib2
  • Выполнение процедуры urllib2 urlopen в Python 2.4
  • urllib2.urlopen будет висеть навсегда, несмотря на таймаут
  • Как «поддерживать жизнь» с cookielib и httplib в python?
  • wget vs urlretrieve of python
  • Получение URL-адреса с сервера Jenkins, защищенного базой данных, с помощью urllib2
  •  
    Interesting Posts for Van-Lav

    Текущее решение для чистого python для facebook-oauth?

    Сломанная труба при использовании менеджеров многопроцессорности Python (BaseManager / SyncManager) для обмена очередью с удаленными машинами

    Как расширить класс класса Python

    Создание меток, где строка отображается в матплот-либере

    Копирование файлов Windows на Python с поддержкой подстановочных знаков

    python http server, несколько одновременных запросов

    Включение ранее зарегистрированных событий в новый обработчик ведения журнала

    Niqqud неправильно выравниваются при рисовании текста на иврите, используя PIL (Python Imaging Library)

    Clojure Overtone – альтернатива Python

    Google app engine Как считать SUM из datestore?

    Перемещение функции на кадре данных

    Как я могу получать значения в разных диапазонах ячеек?

    Понимание ограничений производительности Tkinter Canvas

    Добавление столбца фрейма данных с len () значений другого столбца

    Преобразовать строки Python в float явно используя запятую или точку как разделители

    Python - лучший язык программирования в мире.