Разведочный анализ данных что мы знаем о каналах YouTube

Разведочный анализ данных все, что мы знаем о каналах YouTube

Получение статистических данных с использованием Pandas и YouTube Data API

Фото: Гленн Карстенс-Петерс, Unsplash

В настоящее время количество активных пользователей YouTube превышает 2,7 миллиарда, и для многих людей YouTube – это не только развлечение, но и важный источник дохода. Но как это работает? Сколько просмотров или подписчиков могут получить разные YouTube-каналы? С помощью Python, Pandas и YouTube Data API мы можем получить интересные исследования.

Методология

Эта статья будет разделена на несколько частей:

  • Использование YouTube Data API. С помощью этого API мы сможем получить список YouTube-каналов для разных запросов. Мы получим информацию о количестве видео, просмотров и подписчиков для каждого канала.
  • Получение списка интересующих нас каналов. Это можно сделать только один раз.
  • Сбор данных о каналах. Чтобы получить статистические данные, нам нужно собрать данные за определенный период времени.
  • Анализ данных.

Без лишних слов, приступим к делу.

1. YouTube Data API

Во-первых, хорошая новость для всех, кто интересуется сбором данных из больших сетей, таких как YouTube: API YouTube бесплатно, и нам не нужно за него платить. Чтобы начать использовать это API, нам нужно выполнить два шага:

  • Откройте https://console.cloud.google.com и создайте новый проект. У меня уже был старый проект, но после некоторого периода неактивности все его ограничения API были установлены в ноль, и я не нашел способа их сбросить. Поэтому лучше создать новый.
Google Cloud Console, Изображение автора
  • Перейдите в раздел «API и службы» и включите «YouTube Data API». Откройте API, перейдите в раздел «Учетные данные» и создайте ключ API. Если все сделано правильно, страница с квотами будет выглядеть так:
YouTube API Quotas, Изображение автора