Облако слов (Word Cloud) - Лена Капаца
Облако слов (Word Cloud) by Лена Капаца March 10, 2024 Основы

Облако слов — это визуальное представление данных текста, в котором часто встречающиеся слова в тексте показываются в более крупном размере, а реже встречающиеся слова — в более мелком. Это позволяет легко идентифицировать ключевые темы и тенденции в документе или наборе текстов. 

Для создания Word Cloud на Python можно использовать библиотеку `wordcloud`. Сначала необходимо установить библиотеку, если она еще не установлена. Это можно сделать через командную строку или терминал, используя пакетный менеджер pip:


!pip install wordcloud

Импортируем необходимые библиотеки:


from wordcloud import WordCloud
import matplotlib.pyplot as plt

 

Зададим игрушечный текст:


text = "Python Python Python WordCloud визуализация данных текст обработка данных анализ данных визуализация WordCloud облако слов Python программирование"

 

Создадим объект WordCloud:


wordcloud = WordCloud(width = 800, height = 800,
                background_color ='white',
                min_font_size = 10).generate(text)

 

Покажем сгенерированное изображение:


plt.figure(figsize = (8, 8), facecolor = None)
plt.imshow(wordcloud)
plt.axis("off")
plt.tight_layout(pad = 0)

plt.show()

 

В результате выполнения кода вы получите изображение, на котором часто встречающиеся слова, такие как "Python" и "WordCloud", будут представлены крупнее, чем менее частые слова.

Ноутбук, не требующий дополнительной настройки на момент написания статьи, можно скачать здесь.

© Лена Капаца. Все права защищены.