用python画词云

标签:
python统计图 |
分类: python语言 |
今天一个学生询问画词云的问题。他收集了30个word文档,都是关于大学生就业方面的资料,想分词并画词云。python、R和nvivo都可以绘制,我今天用python和nvivo试了下:
nvivo是windows窗口程序,绘制词云效率很高,不过不能自定义词云的样式,不能改变形状,只能用软件提供的那几种样式。
python用wordcloud包来绘制词云,这个包是从R移植到python的,功能相似。不过R中的wordcloud已经升级二代,叫wordcloud2,而python中的还是一代。
python绘制wordcloud要敲代码,但使用挺简单。只要把分词后结果(用空格间隔)作为参数输入绘图函数即可。不用去统计词频,wordcloud自动统计。python的灵活度很高,词云的形状可以自定义。用photoshop画个图,输如到函数,即可输出各种图形的词云,这点比nvivo强。
python分词是用结巴分词包,效率和效果很好。nvivo用什么模型分词暂不得知。
下面是效果图和源码:
2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 |
import
# # files # # # # # wcloud wcloud.generate( |