Извлечение текста между тегами с помощью BeautifulSoup

Я пытаюсь извлечь текст из серии веб-страниц, которые следуют аналогичному формату с помощью BeautifulSoup. Html для текста, который я хочу извлечь, приведен ниже. Фактическая ссылка находится здесь: http://www.p2016.org/ads1/bushad120215.html .

<p><span style="color: rgb(153, 153, 153);"></span><font size="-1"> <span style="font-family: Arial;"><big><span style="color: rgb(153, 153, 153);"></span></big></span></font><span style="color: rgb(153, 153, 153);"></span><font size="-1"><span style="font-family: Arial;"><big><span style="color: rgb(153, 153, 153);"></span></big></span></font><font size="-1"><span style="font-family: Arial;"><big><span style="color: rgb(153, 153, 153);"></span></big></span></font><font size="-1"><span style="font-family: Arial;"><big><span style="color: rgb(153, 153, 153);"></span></big></span></font></p> <p><span style="color: rgb(153, 153, 153);">[Music]</span><span style="text-decoration: underline;"><br> </span></p> <p><small><span style="text-decoration: underline;">TEXT</span>: The Medal of Honor is the highest award for valor in action against an enemy force</small><span style="text-decoration: underline;"><br> </span></p> <p><span style="text-decoration: underline;">Col. Jay Vargas</span>:&nbsp; We were completely surrounded, 116 Marines locking heads with 15,000 North Vietnamese.&nbsp; Forty hours with no sleep, fighting hand to hand.<span style="text-decoration: underline;"><br> <span style="font-family: helvetica,sans-serif;"><br> </span> 

Я хотел бы найти способ повторить все html-файлы в моей папке и извлечь текст между всеми маркерами. Я включил здесь соответствующие разделы моего кода:

 text=[] for page in pages: html_doc = codecs.open(page, 'r') soup = BeautifulSoup(html_doc, 'html.parser') for t in soup.find_all('<p>'): t = t.get_text() text.append(t.encode('utf-8')) print t 

Однако ничего не происходит. Извините за вопрос noob и заблаговременно за вашу помощь.

Python - лучший язык программирования в мире.