Рассказывание историй с анимированными облаками слов

Использование анимированных облаков слов для рассказа историй

Анимированные облака слов превращают классические облака слов в динамичную визуализацию. Узнайте больше о рассказе данных на языке Python.

Введение

Анимированное облако слов отображает абсолютные частоты n-грамм (последовательности текстовых элементов) во времени в виде последовательности изображений в видеофайле. Он придает большее значение словам, которые чаще появляются в исходном тексте. Чем больше и выразительнее отображается n-грамма, тем чаще она встречается в тексте. Он основан на интуитивной логике классических облаков слов и добавляет временную перспективу к визуализации.

Поскольку в настоящее время собираются множество текстовых наборов данных в качестве наблюдений текста за несколько периодов времени, есть особая проблема визуализации изменений данных во времени. Вместо создания сводных таблиц или графиков для множества разных периодов давайте подготовим видео в формате MP4, которое расскажет историю, привлечет аудиторию и вызовет “вау-эффект” в презентации.

В этой статье будет описано создание анимированных облаков слов из текстовых данных на языке Python. Вот некоторые уникальные особенности библиотеки AnimatedWordCloud:

  • Предоставляет визуализацию частоты n-грамм для всех языков, использующих латиницу
  • Очищает текстовый набор данных от знаков пунктуации, чисел и стоп-слов, включенных в списки стоп-слов NLTK
  • Генерирует годовые или месячные частоты n-грамм.

Как использовать это

Чтобы использовать библиотеку, следуйте этим шагам:

1. Установка

Создайте виртуальное окружение для проекта, чтобы избежать конфликтов зависимостей. AnimatedWordCloud зависит от Python 3.8 из-за его визуализационных требований. Для установки с помощью pip используйте:

pip install AnimatedWordCloud