Облако слов — это визуальное представление данных текста, в котором часто встречающиеся слова в тексте показываются в более крупном размере, а реже встречающиеся слова — в более мелком. Это позволяет легко идентифицировать ключевые темы и тенденции в документе или наборе текстов.
Для создания Word Cloud на Python можно использовать библиотеку `wordcloud`. Сначала необходимо установить библиотеку, если она еще не установлена. Это можно сделать через командную строку или терминал, используя пакетный менеджер pip:
!pip install wordcloud
Импортируем необходимые библиотеки:
from wordcloud import WordCloud
import matplotlib.pyplot as plt
Зададим игрушечный текст:
text = "Python Python Python WordCloud визуализация данных текст обработка данных анализ данных визуализация WordCloud облако слов Python программирование"
Создадим объект WordCloud:
wordcloud = WordCloud(width = 800, height = 800,
background_color ='white',
min_font_size = 10).generate(text)
Покажем сгенерированное изображение:
plt.figure(figsize = (8, 8), facecolor = None)
plt.imshow(wordcloud)
plt.axis("off")
plt.tight_layout(pad = 0)
plt.show()
В результате выполнения кода вы получите изображение, на котором часто встречающиеся слова, такие как "Python" и "WordCloud", будут представлены крупнее, чем менее частые слова.
Ноутбук, не требующий дополнительной настройки на момент написания статьи, можно скачать здесь.
© Лена Капаца. Все права защищены.