智客公社

标题: 自然言语处理—词云图制造 [打印本页]

作者: 321顽童乐天下    时间: 2020-3-2 06:42
标题: 自然言语处理—词云图制造
自然言语处理(NLP)是计算机迷信,人工智能,言语学关注计算机和人类(自然)言语之间的互相作用的范畴。因此,自然言语处理是与人机交互的范畴有关的。

在自然言语处理面临很多应战,包括自然言语了解,因此,自然言语处理触及人机交互的面积。在NLP诸多应战触及自然言语了解,即计算机源于人为或自然言语输入的意思,和其他触及到自然言语生成。

本文作为自然言语处理的一部分,做出好看的词云图一共有七步,下面随我一同边欣赏、边实际。

一、导入标准库

conda install jieba

conda install wordcloud

conda install PIL #安装生成词云的依赖包和运转环境
import matplotlib.pyplot as plt     #数学绘图库import jieba      #jieba分词库from wordcloud import WordCloud,ImageColorGenerator    #词云库from PIL import Image     #图像处理标准库import numpy as np       #数据迷信计算的核心库
[attach]302318[/attach]

二、读取文本数据
text = open(r'C:\\Users\\Administrator\\Desktop\\词云图\\词云.txt',"r",encoding="utf-8").read()   #读入txt文本数据print(text)
[attach]302319[/attach]

三、运用jieba分词,将汉语按照言语结构分开
lyrics = jieba.cut(text)  #运用jieba分词txt = "/".join(lyrics)print(txt)
[attach]302320[/attach]

四、自定义背景图
image = Image.open(r'C:\\\\Users\\\\27342\\\\Desktop\\\\图片.jpg')  #初始化自定义背景图graph = np.array(image)      #图像数据化
[attach]302321[/attach]

五、产生词云图
wc = WordCloud(font_path = r"C:\\\\Users\\\\27342\\\\Desktop\\\\微软雅黑.ttf",background_color='white',max_font_size=80,mask=graph)wc.generate(txt) #导入字体
[attach]302322[/attach]

六、设置文字颜色、背景图颜色
import matplotlib.pyplot as plt     #数学绘图库import jieba      #jieba分词库from wordcloud import WordCloud,ImageColorGenerator    #词云库from PIL import Image      #图像处理标准库import numpy as np   #数据迷信计算的核心库
[attach]302323[/attach]

七、显示图片
text = open(r'C:\\Users\\Administrator\\Desktop\\词云图\\词云.txt',"r",encoding="utf-8").read()  #读入txt文本数据print(text)
[attach]302324[/attach]

本文来源于公众号:大话数据分析

更多适用的数据分析知识,请持续关注!
作者: 22mins    时间: 2020-3-2 06:49
分享了
作者: 摄氏十三度    时间: 2020-3-2 06:55
分享了
作者: 六月失忆    时间: 2020-3-2 06:57
分享了
作者: niuboss1    时间: 2020-3-2 21:08
这帖子写的不错
作者: 阿琪love锋    时间: 2020-3-3 20:54
我也顶起出售广告位
作者: dreamy77    时间: 2020-3-4 15:06
这帖子写的不错




欢迎光临 智客公社 (http://bbs.cnaiplus.com/) Powered by Discuz! X3.4