我是那个分析了孙燕姿的4万歌词,觉得要注孤生了po主。很意外也很开心受到大家这么多关注。楼主不是程序员,是个完完全全的小白,得到大家这么多鼓励还有很多真大神的指导,让我更有信心坚持下去了,谢谢大家!
之前的教程因为主要是记录学习的过程,所以写的比较繁琐,而且也有很多很多不足的地方,包括有需要手工的部分,可移植性不强等等...因为收到很多朋友的私信,求自己爱豆的图,所以这里再贴一个改进版一键式成图教程。
哦,言归正传 周总最喜欢的四个字是哈哈哈哈
程序及相关配置文件在这里下载
链接:http://pan.baidu.com/s/1gff6ZLL 密码:exo9
文件夹叫Soda_song,包括三个文件
- All_one.py是主程序
- ID_list是我已经抓好的歌手在该网站对应的ID
- msyh.ttc是绘制词云所用的微软雅黑字体
接着准备开发环境
- 当然第一件事就是安装python咯。楼主是用的Anaconda3(64bit) 安装可以参见这里https://jingyan.baidu.com/article/fd8044faca4cd75031137ac8.html
- 第二步安装包 文件运行需要的包有numpy,pandas,requests,warning,bs4,re,jieba,wordcloud,codecs
Anaconda已经自带了很多包,楼主只记得安装jieba和wordcloud是自己安装的。
安装包很简单,以安装jieba为例
1.win+R后输入cmd打开命令行
2.输入 pip install jieba
3.其他包安装类似
最后就跑程序吧
在命令行下切换到Soda_song文件夹,并输入python All_one.py 回车运行程序
因为楼主真的很小白,所以尽力了程序的效率也不高
-
输入歌手名:输入你爱豆的名字 回车
-
选择词云类型:比如像看四字的,就输入数字4。看所有词一起的就输入0
-等待。。。。
因为po主真的很渣,所以你可能需要好几杯茶,等我成长了会再来改进的!
啦啦 出结果啦
文件夹下孙燕姿4.png即是结果
额。。写到最后才发现明明是周总,不知不觉又写成我姿了.sigh...
那么,再附录几个
陈奕迅
蔡依林
梁静茹
大家有成功的,欢迎返图!
另外 以上仅供娱乐 因为数据清洗全自动了 所以不够干净 结果可能不太严谨