Использование Python для очистки вложенных разделов и интервалов в Twitter?

Я пытаюсь очистить понравившиеся и ретвиты от результатов поиска в Twitter.

После запуска Python ниже я получаю пустой список, [] . Я не использую API-интерфейс Twitter, потому что он не смотрит на твиты хэштегом так далеко.

Код, который я использую:

 from bs4 import BeautifulSoup import requests url = 'https://twitter.com/search?q=%23bangkokbombing%20since%3A2015-08-10%20until%3A2015-09-30&src=typd&lang=en' r = requests.get(url) data = r.text soup = BeautifulSoup(data, "lxml") all_likes = soup.find_all('span', class_='ProfileTweet-actionCountForPresentation') print(all_likes) 

Я могу успешно сохранить html в файл, используя этот код. При поиске текста не хватает больших объемов информации, таких как имена классов, которые я ищу …

Поэтому (часть) проблема, по-видимому, заключается в точном доступе к исходному коду.

  filename = 'newfile2.txt' with open(filename, 'w') as handle: handle.writelines(str(data)) 

На этом снимке экрана показан диапазон, который я пытаюсь очистить.

Скриншот именно того диапазона и содержимого, которое я пытаюсь очистить.

Я посмотрел на этот вопрос, другие понравились, но я не совсем понял.
Как использовать BeautifulSoup для получения глубоко вложенных значений div?

One Solution collect form web for “Использование Python для очистки вложенных разделов и интервалов в Twitter?”

Кажется, что ваш запрос GET возвращает допустимый HTML, но без элементов твита в элементе #timeline. Однако, добавление агента пользователя в заголовки запроса, похоже, исправляет это.

 from bs4 import BeautifulSoup import requests url = 'https://twitter.com/search?q=%23bangkokbombing%20since%3A2015-08-10%20until%3A2015-09-30&src=typd&lang=en' headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2228.0 Safari/537.36'} r = requests.get(url, headers=headers) data = r.text soup = BeautifulSoup(data, "lxml") all_likes = soup.find_all('span', class_='ProfileTweet-actionCountForPresentation') print(all_likes) 
Interesting Posts

Группы повторного захвата Python

Как проверить, имеет ли строка числовое значение в Python?

В python, как я могу сделать неблокирующий системный вызов?

Остановить сублимированный текст при выполнении бесконечного цикла

Вопрос о уникальности экземпляра строки в python

xpath: манипуляция строк

Как преобразовать целое число в шестнадцатеричное без дополнительных «0x» ведущих и «L» конечных символов в Python?

Получить количество строк виджета Text tkinter

Программно остановить выполнение скрипта python?

Ошибка выполнения: реестр приложений еще не готов

Инициализация в Python с использованием ключевых слов Arg без обмена между экземплярами

Датстор данных для приложения Google, дата на сегодняшний день на Python?

шрифт matplotlib не найден

Wrap C struct с элементом массива для доступа в python: SWIG? Cython? ctypes?

open () не может найти заданный путь к файлу относительно PYTHONPATH

Python - лучший язык программирования в мире.