2018-06-28《intent意图分类模型》

任务一:自己写一个intent(意图)分类

1.数据查看与了解:

总集数据:4622条  

按照2:8比例划分。训练集:3697条      测试集:925条

数据格式:三元组形式(句子,slot标记,intent意图)

数据格式:(句子,slot,intent)

意图种类有:5种   {'play', 'stop&play', 'stop', 'query', 'pause'}

2.intent分类:

其实这里也适用Decoder-Encoder思想框架,因为存在句对<Q,A>也就是<句子,意图>。从分类的角度来看,这是一个多分类问题。

搭建一个softmax多分类模型。

自己搭建的模型:

1
48行这个语句为:relu_feature_maps1 = tf.nn.relu(tf.nn.conv2d(encoder_new, conv_filter_w1,strides=[1, 1, 1, 1], padding='SAME') + conv_filter_b1)


3
4
5

训练结果与预测结果:

训练结果与预测结果

从结果准确率上来看,自己搭建的意图分类模型,没有出现过拟合,因为测试集准确率能跟上训练集准确率。 但是,在训练的迭代次数为3或4的时候,对于数据集的意图准确率马上就达到了很高的准确率。这可以说明,我们的数据集较简单,不需要模型的深度训练


参考文章:

【1】深度学习之卷积神经网络CNN及tensorflow代码实现示例


任务二:周杰伦粉丝团数据--情感主题

jieba分词词性标注:

jieba分词及词性标注

jieba词性标注说明:

jieba的词性标注的简单说明

A.只保留形容词

只保留形容词部分代码

LDA模型--专辑情感主题结果:

专辑的情感主题分类,我设置的是分为31个主题,希望按照专辑数量这个粒度来进行主题数量划分。其实主题个数设置为其它数值也行。



(0, '0.002*"可乐" + 0.002*"惶恐" + 0.002*"憨笑" + 0.002*"成熟" + 0.002*"不错" + 0.002*"最强" + 0.002*"无聊" + 0.002*"厉害" + 0.002*"很酷" + 0.002*"杰迷"')

(1, '0.051*"尊重" + 0.044*"惊喜" + 0.034*"凉凉" + 0.034*"特效" + 0.034*"弱弱" + 0.034*"好烦" + 0.030*"充满" + 0.022*"幸好" + 0.021*"微博" + 0.021*"好奇"')

(2, '0.059*"凉凉" + 0.002*"可乐" + 0.002*"暗淡" + 0.002*"最美" + 0.002*"疲倦" + 0.002*"清爽" + 0.002*"遥远" + 0.002*"有趣" + 0.002*"简单" + 0.002*"完美"')

(3, '0.002*"悦耳" + 0.002*"温热" + 0.002*"蛮快" + 0.002*"超傲" + 0.002*"轻狂" + 0.002*"重名" + 0.002*"有愧" + 0.002*"悲观" + 0.002*"偏要" + 0.002*"犹豫"')

(4, '0.002*"很毒" + 0.002*"灵感" + 0.002*"酷酷" + 0.002*"神秘" + 0.002*"恐怖" + 0.002*"巧妙" + 0.002*"慈悲" + 0.002*"稳如" + 0.002*"合适" + 0.002*"挺挺"')

(5, '0.053*"不错" + 0.053*"合适" + 0.053*"一大" + 0.002*"悲观" + 0.002*"犹豫" + 0.002*"超傲" + 0.002*"轻狂" + 0.002*"重名" + 0.002*"悦耳" + 0.002*"真好玩"')

(6, '0.002*"珍贵" + 0.002*"孤单" + 0.002*"很酷" + 0.002*"激动" + 0.002*"好巧" + 0.002*"温柔" + 0.002*"最美" + 0.002*"浪漫" + 0.002*"憨笑" + 0.002*"恐怖"')

(7, '0.018*"激动" + 0.018*"温柔" + 0.018*"惊恐" + 0.018*"最爱" + 0.018*"惶恐" + 0.018*"不错" + 0.018*"厉害" + 0.018*"很烦" + 0.018*"憨笑" + 0.018*"杰迷"')

(8, '0.021*"幸运" + 0.021*"悲伤" + 0.021*"幸好" + 0.020*"最爱" + 0.019*"快乐" + 0.018*"憨笑" + 0.011*"浮沉" + 0.011*"苦痛" + 0.011*"幼稚" + 0.011*"模糊"')

(9, '0.002*"悦耳" + 0.002*"温热" + 0.002*"蛮快" + 0.002*"超傲" + 0.002*"轻狂" + 0.002*"重名" + 0.002*"有愧" + 0.002*"悲观" + 0.002*"偏要" + 0.002*"犹豫"')

(10, '0.002*"杰迷" + 0.002*"神奇" + 0.002*"欢乐" + 0.002*"不错" + 0.002*"凉凉" + 0.002*"骄傲" + 0.002*"尴尬" + 0.002*"优越" + 0.002*"滑稽" + 0.002*"年轻"')

(11, '0.025*"无聊" + 0.025*"矫情" + 0.025*"安稳" + 0.025*"幸福" + 0.025*"幸运" + 0.025*"心疼" + 0.025*"好奇" + 0.025*"惊恐" + 0.025*"憨笑" + 0.025*"尴尬"')

(12, '0.053*"憨笑" + 0.053*"孤独" + 0.053*"成功" + 0.002*"惶恐" + 0.002*"幽默" + 0.002*"和谐" + 0.002*"好爽" + 0.002*"不愧" + 0.002*"活泼" + 0.002*"亲爱"')

(13, '0.016*"太狠" + 0.016*"纯洁" + 0.015*"好巧" + 0.014*"年轻" + 0.014*"酷酷" + 0.014*"遗憾" + 0.014*"最强" + 0.013*"快乐" + 0.013*"惶恐" + 0.013*"完美"')

(14, '0.002*"最多" + 0.002*"轻松" + 0.002*"很大" + 0.002*"完美" + 0.002*"奇妙" + 0.002*"凛听" + 0.002*"遗憾" + 0.002*"可乐" + 0.002*"最美" + 0.002*"一晃"')

(15, '0.002*"悦耳" + 0.002*"温热" + 0.002*"蛮快" + 0.002*"超傲" + 0.002*"轻狂" + 0.002*"重名" + 0.002*"有愧" + 0.002*"悲观" + 0.002*"偏要" + 0.002*"犹豫"')

(16, '0.002*"悦耳" + 0.002*"温热" + 0.002*"蛮快" + 0.002*"超傲" + 0.002*"轻狂" + 0.002*"重名" + 0.002*"有愧" + 0.002*"悲观" + 0.002*"偏要" + 0.002*"犹豫"')

(17, '0.002*"悦耳" + 0.002*"温热" + 0.002*"蛮快" + 0.002*"超傲" + 0.002*"轻狂" + 0.002*"重名" + 0.002*"有愧" + 0.002*"悲观" + 0.002*"偏要" + 0.002*"犹豫"')

(18, '0.031*"不易" + 0.031*"不爽" + 0.017*"成熟" + 0.017*"辛苦" + 0.017*"尴尬" + 0.017*"温柔" + 0.017*"幸运" + 0.017*"好酷" + 0.017*"恐怖" + 0.017*"伤害"')

(19, '0.056*"糊涂" + 0.056*"一大" + 0.002*"美好" + 0.002*"很大" + 0.002*"挺挺" + 0.002*"颓大" + 0.002*"惊喜" + 0.002*"混混" + 0.002*"凄凉" + 0.002*"合适"')

(20, '0.002*"悦耳" + 0.002*"温热" + 0.002*"蛮快" + 0.002*"超傲" + 0.002*"轻狂" + 0.002*"重名" + 0.002*"有愧" + 0.002*"悲观" + 0.002*"偏要" + 0.002*"犹豫"')

(21, '0.029*"惊恐" + 0.029*"惶恐" + 0.029*"最爱" + 0.029*"憨笑" + 0.029*"温柔" + 0.015*"骄傲" + 0.015*"不爽" + 0.015*"正好" + 0.015*"疯狂" + 0.015*"最酷"')

(22, '0.016*"简单" + 0.016*"悲伤" + 0.016*"恐怖" + 0.016*"幸福" + 0.016*"最多" + 0.016*"好奇" + 0.016*"凉凉" + 0.016*"惊恐" + 0.016*"憨笑" + 0.008*"勇敢"')

(23, '0.016*"落后" + 0.016*"成功" + 0.016*"激动" + 0.015*"完整" + 0.015*"最爱" + 0.014*"惊恐" + 0.013*"杰迷" + 0.013*"厉害" + 0.013*"憨笑" + 0.013*"不错"')

(24, '0.012*"幸福" + 0.012*"隐晦" + 0.012*"朦胧" + 0.012*"太惨" + 0.012*"忙碌" + 0.012*"浪漫" + 0.012*"有趣" + 0.012*"美好" + 0.012*"最香" + 0.012*"深爱"')

(25, '0.031*"惶恐" + 0.031*"厉害" + 0.031*"惊恐" + 0.031*"轻松" + 0.031*"优秀" + 0.031*"尊重" + 0.031*"风靡" + 0.031*"孤独" + 0.031*"正火" + 0.031*"强迫"')

(26, '0.016*"微博" + 0.016*"先出" + 0.016*"完美" + 0.016*"纯真" + 0.016*"成功" + 0.016*"妥帖" + 0.016*"惊讶" + 0.016*"完大" + 0.016*"悲壮" + 0.016*"很好"')

(27, '0.016*"亲爱" + 0.016*"憨笑" + 0.016*"惊恐" + 0.016*"遗憾" + 0.016*"快乐" + 0.016*"厉害" + 0.016*"有趣" + 0.016*"嚣张" + 0.016*"杰迷" + 0.016*"潇洒"')

(28, '0.023*"太酷" + 0.023*"更爽" + 0.023*"尊重" + 0.023*"正要" + 0.023*"不缺" + 0.023*"轻易" + 0.023*"惊艳" + 0.023*"心疼" + 0.023*"辛苦" + 0.023*"憨笑"')

(29, '0.016*"很丧" + 0.016*"潇洒" + 0.016*"紧张" + 0.016*"难熬" + 0.016*"耐听" + 0.016*"傲气" + 0.016*"柔情" + 0.016*"不耐烦" + 0.016*"忐忑" + 0.016*"优秀"')

(30, '0.026*"神奇" + 0.025*"惊恐" + 0.024*"不错" + 0.022*"幸福" + 0.021*"憨笑" + 0.020*"惶恐" + 0.020*"厉害" + 0.017*"快乐" + 0.017*"很酷" + 0.017*"完整"')



LDA模型--歌曲情感主题结果:

歌曲的情感主题分类,我设置的主题个数也是31个主题。可以根据需要设置其它主题个数。



(0, '0.028*"憨笑" + 0.019*"不错" + 0.019*"激动" + 0.019*"厉害" + 0.019*"恭喜" + 0.019*"著名" + 0.010*"杰迷" + 0.010*"快乐" + 0.010*"简单" + 0.010*"辛苦"')

(1, '0.009*"厲害" + 0.009*"很皮" + 0.009*"欢快" + 0.009*"很棒" + 0.009*"酷酷" + 0.009*"惶恐" + 0.009*"有趣" + 0.009*"惊恐" + 0.009*"不错" + 0.009*"最爱"')

(2, '0.038*"不错" + 0.034*"憨笑" + 0.031*"厉害" + 0.025*"惊恐" + 0.023*"成功" + 0.021*"欢乐" + 0.020*"舒服" + 0.017*"惊艳" + 0.015*"合适" + 0.015*"欢快"')

(3, '0.021*"厉害" + 0.015*"不错" + 0.015*"惊恐" + 0.015*"憨笑" + 0.015*"惶恐" + 0.011*"漂亮" + 0.011*"最强" + 0.011*"杰迷" + 0.010*"心疼" + 0.010*"幸福"')

(4, '0.022*"厉害" + 0.022*"憨笑" + 0.018*"很棒" + 0.017*"最多" + 0.015*"很大" + 0.015*"年轻" + 0.014*"惊恐" + 0.014*"酷好" + 0.013*"惊喜" + 0.013*"最强"')

(5, '0.016*"憨笑" + 0.014*"不错" + 0.014*"厉害" + 0.013*"舒服" + 0.012*"简单" + 0.012*"很棒" + 0.012*"幸福" + 0.012*"惊恐" + 0.012*"惶恐" + 0.011*"温柔"')

(6, '0.022*"厉害" + 0.022*"完美" + 0.019*"清晰" + 0.017*"舒服" + 0.017*"年轻" + 0.016*"惊恐" + 0.016*"憨笑" + 0.015*"惊艳" + 0.015*"太酷" + 0.013*"浮躁"')

(7, '0.015*"憨笑" + 0.014*"简单" + 0.013*"安好" + 0.013*"惊恐" + 0.012*"快乐" + 0.012*"心疼" + 0.012*"最爱" + 0.011*"幸运" + 0.011*"成熟" + 0.010*"成功"')

(8, '0.020*"憨笑" + 0.017*"厉害" + 0.017*"不错" + 0.016*"最爱" + 0.016*"惊恐" + 0.014*"杰迷" + 0.014*"幸福" + 0.013*"悲伤" + 0.012*"简单" + 0.010*"完美"')

(9, '0.020*"憨笑" + 0.017*"惶恐" + 0.016*"完美" + 0.016*"快乐" + 0.016*"厉害" + 0.015*"最爱" + 0.015*"不错" + 0.014*"幸福" + 0.014*"惊恐" + 0.013*"尴尬"')

(10, '0.025*"憨笑" + 0.019*"快乐" + 0.019*"厉害" + 0.019*"惶恐" + 0.019*"凉凉" + 0.012*"完美" + 0.012*"舒服" + 0.012*"幸福" + 0.012*"不错" + 0.012*"幸运"')

(11, '0.013*"惊恐" + 0.013*"憨笑" + 0.012*"不错" + 0.011*"最强" + 0.011*"遗憾" + 0.011*"厉害" + 0.011*"温柔" + 0.010*"年轻" + 0.010*"快乐" + 0.010*"美好"')

(12, '0.015*"幸福" + 0.015*"厉害" + 0.014*"杰迷" + 0.014*"惊恐" + 0.012*"美好" + 0.012*"最爱" + 0.012*"憨笑" + 0.011*"完美" + 0.011*"辛苦" + 0.011*"惊喜"')

(13, '0.017*"憨笑" + 0.015*"幸福" + 0.015*"厉害" + 0.014*"温柔" + 0.012*"遗憾" + 0.012*"杰迷" + 0.012*"简单" + 0.012*"美好" + 0.012*"成功" + 0.011*"惊恐"')

(14, '0.023*"憨笑" + 0.021*"悲伤" + 0.020*"幸运" + 0.017*"不错" + 0.016*"厉害" + 0.015*"很好" + 0.014*"别扭" + 0.012*"惊恐" + 0.012*"不好意思" + 0.012*"尊重"')

(15, '0.020*"幸福" + 0.020*"憨笑" + 0.018*"遗憾" + 0.016*"厉害" + 0.013*"快乐" + 0.013*"悲伤" + 0.012*"浪漫" + 0.012*"完整" + 0.011*"美好" + 0.011*"不错"')

(16, '0.018*"憨笑" + 0.016*"不错" + 0.016*"惊恐" + 0.014*"厉害" + 0.012*"遗憾" + 0.011*"优秀" + 0.011*"快乐" + 0.010*"杰迷" + 0.010*"美好" + 0.009*"幸福"')

(17, '0.019*"幸福" + 0.016*"最爱" + 0.015*"不错" + 0.014*"厉害" + 0.014*"完美" + 0.014*"憨笑" + 0.014*"美好" + 0.013*"年轻" + 0.013*"快乐" + 0.012*"惊恐"')

(18, '0.015*"优秀" + 0.015*"幼稚" + 0.013*"很大" + 0.013*"简单" + 0.012*"不错" + 0.012*"厉害" + 0.010*"最爱" + 0.010*"美好" + 0.010*"不腻" + 0.010*"安好"')

(19, '0.014*"成功" + 0.014*"完整" + 0.013*"杰迷" + 0.013*"惊恐" + 0.010*"骄傲" + 0.010*"完爆" + 0.010*"优秀" + 0.010*"灵感" + 0.010*"郁闷" + 0.009*"幸好"')

(20, '0.014*"孤独" + 0.014*"正好" + 0.013*"成功" + 0.013*"遗憾" + 0.013*"厉害" + 0.013*"不错" + 0.012*"精美" + 0.010*"有趣" + 0.010*"挺好" + 0.010*"漂亮"')

(21, '0.033*"憨笑" + 0.025*"惊恐" + 0.017*"最强" + 0.017*"厉害" + 0.017*"不错" + 0.017*"好爽" + 0.017*"简单" + 0.017*"幸运" + 0.017*"好烦" + 0.009*"完美"')

(22, '0.018*"憨笑" + 0.017*"惊恐" + 0.017*"最爱" + 0.017*"不错" + 0.014*"厉害" + 0.014*"惊喜" + 0.014*"幸福" + 0.014*"惶恐" + 0.013*"温柔" + 0.012*"年轻"')

(23, '0.015*"憨笑" + 0.013*"幸福" + 0.013*"快乐" + 0.012*"最强" + 0.012*"最爱" + 0.011*"惊恐" + 0.011*"厉害" + 0.011*"激动" + 0.011*"不错" + 0.011*"年轻"')

(24, '0.026*"憨笑" + 0.021*"不错" + 0.018*"完美" + 0.017*"漂亮" + 0.016*"惊恐" + 0.016*"厉害" + 0.013*"简单" + 0.013*"甜蜜" + 0.013*"矫情" + 0.012*"浪漫"')

(25, '0.014*"憨笑" + 0.012*"简单" + 0.012*"美好" + 0.011*"惊恐" + 0.010*"惊喜" + 0.010*"温柔" + 0.009*"孤单" + 0.008*"很小" + 0.008*"勇敢" + 0.008*"快乐"')

(26, '0.015*"不错" + 0.015*"惊恐" + 0.015*"憨笑" + 0.012*"厉害" + 0.012*"充满" + 0.011*"惶恐" + 0.011*"很棒" + 0.010*"激动" + 0.009*"美好" + 0.009*"遗憾"')

(27, '0.016*"年轻" + 0.016*"有趣" + 0.016*"不错" + 0.016*"最强" + 0.016*"勇敢" + 0.016*"惭愧" + 0.016*"漂亮" + 0.016*"伤害" + 0.016*"谦虚" + 0.016*"太酷"')

(28, '0.025*"憨笑" + 0.023*"厉害" + 0.017*"温柔" + 0.016*"最美" + 0.015*"简单" + 0.015*"惊恐" + 0.014*"好奇" + 0.014*"不腻" + 0.013*"美好" + 0.013*"幸福"')

(29, '0.031*"幸福" + 0.024*"憨笑" + 0.019*"厉害" + 0.019*"惊恐" + 0.014*"惊艳" + 0.014*"简单" + 0.013*"惶恐" + 0.013*"尴尬" + 0.013*"不错" + 0.011*"不腻"')

(30, '0.019*"憨笑" + 0.017*"不错" + 0.016*"滑稽" + 0.015*"惊恐" + 0.014*"惊讶" + 0.013*"厉害" + 0.012*"完美" + 0.012*"幸运" + 0.012*"不好意思" + 0.011*"惶恐"')



B.对表情符号进行过滤处理

由于形容词里面有很多词,是通过发送表情符号而带上的汉字,这些词其实对当前问题的情感主题划分是没有贡献的,所以有必要过滤掉这种评论者自身带有的情感色彩词,保留下对周杰伦音乐本事评价的情感词。

需要处理掉的数据长相
需要处理掉的数据长相

符号表情词过滤:

符号表情词过滤代码

LDA模型--专辑情感主题结果:



(0, '0.030*"不错" + 0.020*"温柔" + 0.020*"恐怖" + 0.020*"杰迷" + 0.020*"无聊" + 0.020*"简单" + 0.020*"激动" + 0.020*"惊艳" + 0.020*"厉害" + 0.020*"惊喜"')

(1, '0.002*"轻狂" + 0.002*"悦耳" + 0.002*"有愧" + 0.002*"真好玩" + 0.002*"蛮快" + 0.002*"超傲" + 0.002*"慵懒" + 0.002*"重名" + 0.002*"犹豫" + 0.002*"温热"')

(2, '0.002*"酷酷" + 0.002*"年轻" + 0.002*"强大" + 0.002*"单挑" + 0.002*"激动" + 0.002*"最爱" + 0.002*"不爽" + 0.002*"最多" + 0.002*"很小" + 0.002*"惊艳"')

(3, '0.009*"傲气" + 0.009*"尴尬" + 0.009*"落寞" + 0.009*"不好意思" + 0.009*"厉害" + 0.009*"骄傲" + 0.009*"意外" + 0.009*"滑稽" + 0.009*"强大" + 0.009*"低俗"')

(4, '0.002*"干活" + 0.002*"很酷" + 0.002*"亲热" + 0.002*"轻狂" + 0.002*"神奇" + 0.002*"骄傲" + 0.002*"平凡" + 0.002*"熟练" + 0.002*"纯白" + 0.002*"干净"')

(5, '0.020*"不错" + 0.013*"完美" + 0.013*"最酷" + 0.013*"很酷" + 0.013*"厉害" + 0.013*"年轻" + 0.013*"疯狂" + 0.013*"滑稽" + 0.013*"惊艳" + 0.013*"幸运"')

(6, '0.002*"迷喜" + 0.002*"漂亮" + 0.002*"蛮高" + 0.002*"嘶哑" + 0.002*"很蠢" + 0.002*"自由" + 0.002*"弱弱" + 0.002*"强多" + 0.002*"亲爱" + 0.002*"憋着"')

(7, '0.026*"孤独" + 0.024*"成功" + 0.018*"尴尬" + 0.018*"幸运" + 0.018*"无聊" + 0.017*"浪漫" + 0.017*"漂亮" + 0.014*"好奇" + 0.014*"最美" + 0.014*"温柔"')

(8, '0.002*"微博" + 0.002*"很好" + 0.002*"幸福" + 0.002*"遗憾" + 0.002*"精致" + 0.002*"不适" + 0.002*"最爱" + 0.002*"虚伪" + 0.002*"疯狂" + 0.002*"年轻"')

(9, '0.030*"神奇" + 0.030*"快乐" + 0.030*"美好" + 0.030*"惊艳" + 0.030*"幸福" + 0.030*"完美" + 0.030*"不错" + 0.030*"无聊" + 0.030*"最爱" + 0.030*"青涩"')

(10, '0.011*"一大" + 0.011*"激动" + 0.011*"很大" + 0.011*"幸福" + 0.011*"厉害" + 0.011*"很酷" + 0.011*"快乐" + 0.011*"不腻" + 0.011*"最多" + 0.011*"轻松"')

(11, '0.024*"辛苦" + 0.024*"不错" + 0.024*"厉害" + 0.024*"幸好" + 0.024*"激动" + 0.024*"完美" + 0.024*"骄傲" + 0.024*"一大" + 0.024*"很好" + 0.024*"正要"')

(12, '0.015*"成功" + 0.015*"厉害" + 0.015*"完整" + 0.015*"不错" + 0.015*"激动" + 0.015*"浮躁" + 0.015*"一大" + 0.015*"太酷" + 0.015*"不懂" + 0.015*"舒服"')

(13, '0.036*"温柔" + 0.036*"最爱" + 0.018*"一晃" + 0.018*"厉害" + 0.018*"骄傲" + 0.018*"不好意思" + 0.018*"团建" + 0.018*"超酷" + 0.018*"亲切" + 0.018*"纯洁"')

(14, '0.067*"凉凉" + 0.034*"最多" + 0.034*"幸福" + 0.034*"悲伤" + 0.034*"恐怖" + 0.034*"简单" + 0.034*"漂亮" + 0.034*"温柔" + 0.034*"最美" + 0.034*"难熬"')

(15, '0.002*"轻狂" + 0.002*"悦耳" + 0.002*"有愧" + 0.002*"真好玩" + 0.002*"蛮快" + 0.002*"超傲" + 0.002*"慵懒" + 0.002*"重名" + 0.002*"犹豫" + 0.002*"温热"')

(16, '0.002*"轻狂" + 0.002*"悦耳" + 0.002*"有愧" + 0.002*"真好玩" + 0.002*"蛮快" + 0.002*"超傲" + 0.002*"慵懒" + 0.002*"重名" + 0.002*"犹豫" + 0.002*"温热"')

(17, '0.018*"幸好" + 0.017*"最爱" + 0.016*"遗憾" + 0.015*"尊重" + 0.015*"完美" + 0.015*"不错" + 0.015*"厉害" + 0.012*"凉凉" + 0.012*"很烦" + 0.012*"弱弱"')

(18, '0.002*"激动" + 0.002*"简单" + 0.002*"厉害" + 0.002*"心疼" + 0.002*"惊艳" + 0.002*"悲哀" + 0.002*"不错" + 0.002*"无聊" + 0.002*"不好意思" + 0.002*"最强"')

(19, '0.002*"幸福" + 0.002*"杰迷" + 0.002*"心疼" + 0.002*"激动" + 0.002*"疯狂" + 0.002*"很酷" + 0.002*"太慢" + 0.002*"神奇" + 0.002*"自由" + 0.002*"快乐"')

(20, '0.002*"害羞" + 0.002*"简单" + 0.002*"苦楚" + 0.002*"惊喜" + 0.002*"轻松" + 0.002*"快乐" + 0.002*"娴静" + 0.002*"亲切" + 0.002*"自由" + 0.002*"艰苦"')

(21, '0.002*"忧愁" + 0.002*"单挑" + 0.002*"俏皮" + 0.002*"阴郁" + 0.002*"热爱" + 0.002*"酷酷" + 0.002*"惊喜" + 0.002*"悲伤" + 0.002*"意外" + 0.002*"凉凉"')

(22, '0.019*"快乐" + 0.018*"遗憾" + 0.018*"厉害" + 0.017*"亲爱" + 0.014*"惊喜" + 0.014*"很棒" + 0.014*"杰迷" + 0.013*"不错" + 0.012*"嚣张" + 0.012*"有趣"')

(23, '0.027*"心疼" + 0.027*"独秀" + 0.027*"悦耳" + 0.027*"快乐" + 0.027*"犹豫" + 0.027*"很好" + 0.027*"熟稔" + 0.027*"温热" + 0.027*"肤浅" + 0.027*"最爱"')

(24, '0.002*"欢乐" + 0.002*"严肃" + 0.002*"真挚" + 0.002*"亲爱" + 0.002*"热爱" + 0.002*"轻松" + 0.002*"不好玩" + 0.002*"寂寞" + 0.002*"亲切" + 0.002*"忠实"')

(25, '0.015*"艳丽" + 0.015*"不烦" + 0.015*"了秀" + 0.015*"太酷" + 0.015*"高贵" + 0.015*"不小" + 0.015*"很大" + 0.015*"低俗" + 0.015*"疯狂" + 0.015*"成熟"')

(26, '0.002*"幸福" + 0.002*"遗憾" + 0.002*"有趣" + 0.002*"很大" + 0.002*"血大" + 0.002*"顽强" + 0.002*"一大" + 0.002*"完整" + 0.002*"孤独" + 0.002*"犹寒"')

(27, '0.038*"苦痛" + 0.038*"悲伤" + 0.038*"幸好" + 0.038*"幼稚" + 0.038*"最爱" + 0.038*"模糊" + 0.038*"委婉" + 0.038*"浮沉" + 0.038*"幸运" + 0.038*"冲淡"')

(28, '0.002*"忧愁" + 0.002*"愉快" + 0.002*"私聊" + 0.002*"欢乐" + 0.002*"妥妥" + 0.002*"唯美" + 0.002*"热爱" + 0.002*"骄傲" + 0.002*"凉凉" + 0.002*"简单"')

(29, '0.002*"鲜艳" + 0.002*"沉默" + 0.002*"遗憾" + 0.002*"新颖" + 0.002*"闷热" + 0.002*"红遍" + 0.002*"轻狂" + 0.002*"模糊" + 0.002*"好酷" + 0.002*"平均"')

(30, '0.002*"轻狂" + 0.002*"悦耳" + 0.002*"有愧" + 0.002*"真好玩" + 0.002*"蛮快" + 0.002*"超傲" + 0.002*"慵懒" + 0.002*"重名" + 0.002*"犹豫" + 0.002*"温热"')



LDA模型--歌曲情感主题结果:



(0, '0.025*"厉害" + 0.025*"悲伤" + 0.017*"尊重" + 0.017*"最全" + 0.017*"快乐" + 0.017*"不错" + 0.017*"最强" + 0.017*"年轻" + 0.017*"最多" + 0.017*"耳熟"')

(1, '0.014*"厉害" + 0.012*"幸福" + 0.012*"不错" + 0.012*"最爱" + 0.011*"正好" + 0.010*"简单" + 0.010*"完美" + 0.010*"尴尬" + 0.010*"骄傲" + 0.009*"成功"')

(2, '0.013*"不错" + 0.013*"厉害" + 0.011*"最爱" + 0.011*"尴尬" + 0.011*"杰迷" + 0.011*"成功" + 0.009*"紧张" + 0.009*"疯狂" + 0.009*"心疼" + 0.009*"快乐"')

(3, '0.027*"不好意思" + 0.025*"厉害" + 0.024*"杰迷" + 0.022*"不错" + 0.022*"幸福" + 0.018*"年轻" + 0.015*"很好" + 0.015*"幸运" + 0.015*"完美" + 0.014*"很棒"')

(4, '0.016*"不错" + 0.015*"害羞" + 0.014*"厉害" + 0.014*"惊喜" + 0.014*"幸好" + 0.013*"简单" + 0.013*"舒服" + 0.012*"快乐" + 0.012*"有趣" + 0.011*"神奇"')

(5, '0.012*"年轻" + 0.011*"快乐" + 0.011*"惊喜" + 0.011*"最爱" + 0.010*"幸福" + 0.010*"厉害" + 0.010*"不错" + 0.009*"最多" + 0.009*"亲爱" + 0.008*"无聊"')

(6, '0.028*"优秀" + 0.022*"不错" + 0.022*"厉害" + 0.017*"很好" + 0.017*"快乐" + 0.017*"优美" + 0.017*"浪漫" + 0.011*"孤独" + 0.011*"舒服" + 0.011*"自私"')

(7, '0.015*"不错" + 0.013*"年轻" + 0.012*"厉害" + 0.011*"珍惜" + 0.011*"简单" + 0.010*"好奇" + 0.010*"很酷" + 0.010*"疯狂" + 0.009*"很大" + 0.009*"舒服"')

(8, '0.014*"幸福" + 0.014*"厉害" + 0.013*"完美" + 0.013*"很棒" + 0.013*"最爱" + 0.012*"寂静" + 0.012*"不错" + 0.011*"温柔" + 0.010*"杰迷" + 0.010*"孤独"')

(9, '0.013*"完美" + 0.013*"美好" + 0.013*"幸福" + 0.012*"快乐" + 0.012*"不错" + 0.012*"幸运" + 0.012*"温柔" + 0.012*"年轻" + 0.012*"简单" + 0.011*"最强"')

(10, '0.017*"幸运" + 0.017*"好烦" + 0.013*"害羞" + 0.012*"意外" + 0.011*"最美" + 0.011*"惊喜" + 0.011*"疯狂" + 0.010*"完美" + 0.010*"尴尬" + 0.010*"杰迷"')

(11, '0.020*"幸福" + 0.020*"厉害" + 0.018*"不错" + 0.016*"勇敢" + 0.016*"温柔" + 0.015*"最爱" + 0.014*"沉默" + 0.013*"最多" + 0.013*"完美" + 0.013*"简单"')

(12, '0.028*"幸好" + 0.027*"厉害" + 0.019*"孤独" + 0.019*"幸福" + 0.019*"凄美" + 0.019*"激动" + 0.016*"深爱" + 0.015*"杰迷" + 0.013*"浪漫" + 0.013*"最爱"')

(13, '0.018*"厉害" + 0.015*"不错" + 0.013*"快乐" + 0.012*"最爱" + 0.012*"悲伤" + 0.011*"惊喜" + 0.011*"尊重" + 0.010*"年轻" + 0.010*"最美" + 0.010*"幸运"')

(14, '0.025*"厉害" + 0.023*"年轻" + 0.023*"有爱" + 0.020*"不错" + 0.015*"连续" + 0.015*"欢快" + 0.014*"妥妥" + 0.014*"快乐" + 0.012*"神奇" + 0.012*"最爱"')

(15, '0.032*"不错" + 0.021*"厉害" + 0.017*"合适" + 0.017*"简单" + 0.016*"杰迷" + 0.012*"成熟" + 0.012*"珍惜" + 0.012*"年轻" + 0.012*"尴尬" + 0.012*"青涩"')

(16, '0.015*"杰迷" + 0.015*"浪漫" + 0.015*"神奇" + 0.015*"简单" + 0.015*"灵感" + 0.015*"厉害" + 0.015*"精通" + 0.015*"很美" + 0.015*"最爱" + 0.015*"阴暗"')

(17, '0.019*"不错" + 0.018*"成功" + 0.015*"最爱" + 0.014*"美好" + 0.014*"疯狂" + 0.014*"遗憾" + 0.013*"幸福" + 0.013*"孤独" + 0.012*"很棒" + 0.012*"珍惜"')

(18, '0.026*"不错" + 0.023*"伤害" + 0.019*"最强" + 0.015*"年轻" + 0.015*"太酷" + 0.014*"有趣" + 0.014*"滑稽" + 0.013*"惭愧" + 0.012*"恐怖" + 0.011*"不腻"')

(19, '0.022*"厉害" + 0.019*"幼稚" + 0.018*"不错" + 0.017*"安好" + 0.016*"美好" + 0.015*"最爱" + 0.013*"青涩" + 0.012*"唯美" + 0.012*"最美" + 0.012*"不腻"')

(20, '0.026*"厉害" + 0.020*"幸福" + 0.018*"不错" + 0.014*"很棒" + 0.014*"最爱" + 0.013*"正好" + 0.013*"疯狂" + 0.012*"成功" + 0.012*"美好" + 0.012*"完美"')

(21, '0.001*"很棒" + 0.001*"厉害" + 0.001*"不好意思" + 0.001*"幸福" + 0.001*"珍惜" + 0.001*"惊讶" + 0.001*"骄傲" + 0.001*"成功" + 0.001*"完美" + 0.001*"很好"')

(22, '0.019*"好酷" + 0.015*"杰迷" + 0.015*"温柔" + 0.015*"不错" + 0.015*"幸福" + 0.013*"真美" + 0.010*"紧张" + 0.010*"有趣" + 0.009*"一晃" + 0.009*"不腻"')

(23, '0.011*"惊艳" + 0.011*"美好" + 0.010*"不错" + 0.010*"完美" + 0.010*"清纯" + 0.010*"纯爱" + 0.010*"优美" + 0.010*"良心" + 0.009*"无聊" + 0.009*"伤害"')

(24, '0.022*"厉害" + 0.022*"一大" + 0.021*"著名" + 0.018*"不错" + 0.014*"骄傲" + 0.013*"成功" + 0.012*"完整" + 0.012*"心疼" + 0.011*"激动" + 0.011*"辛苦"')

(25, '0.020*"厉害" + 0.017*"温柔" + 0.015*"成功" + 0.015*"简单" + 0.015*"杰迷" + 0.015*"尴尬" + 0.015*"幸福" + 0.014*"快乐" + 0.013*"最爱" + 0.012*"遗憾"')

(26, '0.016*"不错" + 0.015*"厉害" + 0.013*"杰迷" + 0.012*"完美" + 0.011*"尴尬" + 0.011*"幸福" + 0.011*"激动" + 0.011*"疯狂" + 0.011*"最强" + 0.011*"遗憾"')

(27, '0.020*"舒服" + 0.019*"最爱" + 0.019*"厉害" + 0.018*"幸福" + 0.016*"欢乐" + 0.015*"惊艳" + 0.015*"尴尬" + 0.014*"简单" + 0.013*"不错" + 0.013*"疯狂"')

(28, '0.021*"美好" + 0.019*"凉凉" + 0.018*"快乐" + 0.018*"最强" + 0.018*"幸福" + 0.017*"最爱" + 0.016*"杰迷" + 0.015*"厉害" + 0.014*"矫情" + 0.013*"幸运"')

(29, '0.022*"厉害" + 0.016*"遗憾" + 0.016*"快乐" + 0.015*"幸福" + 0.014*"最强" + 0.013*"很棒" + 0.013*"完美" + 0.012*"最爱" + 0.011*"激动" + 0.011*"不错"')

(30, '0.015*"完美" + 0.014*"很棒" + 0.014*"不错" + 0.013*"厉害" + 0.012*"幸福" + 0.011*"快乐" + 0.011*"最爱" + 0.011*"遗憾" + 0.011*"美好" + 0.010*"温柔"')




该任务完成!!!!代码放在:

任务存放位置,运行里面的model.py就行


参考文章:

【1】Jieba分词词性标注以及词性说明

【2】了解Jieba分词,可参考:Jieba

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,761评论 5 460
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,953评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,998评论 0 320
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,248评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,130评论 4 356
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,145评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,550评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,236评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,510评论 1 291
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,601评论 2 310
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,376评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,247评论 3 313
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,613评论 3 299
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,911评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,191评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,532评论 2 342
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,739评论 2 335

推荐阅读更多精彩内容

  • 《机械制图》10%(50+30=80) 单项选择题 Q-B1-E-001 L 基本幅面不能满足需要而采用加长幅面时...
    开源时代阅读 3,709评论 1 1
  • 做生意或者发展事业,必须要经过一个集腋成裘,积沙成塔的过程。每个平台的发展历程是不一样的,起点也是不一样的。 在发...
    子颜论道阅读 377评论 0 0
  • 从土里刨食 也许能刨到土豆 刨到溯水而上的鱼 在人海行走 也许会遇到故知 遇到从未谋面的人 这个夏天,我反复失眠 ...
    春风明月阅读 210评论 0 0
  • 说起传销,有的人觉得这是一个很沉重的话题,有的人觉得与自己无关,不过是新闻上说的比较玄乎的一个话题而已。但是随着越...
    孤松堂主阅读 3,754评论 0 2
  • ↑欢迎点击上方蓝色字体订阅LubQ↑ 这是LubQ的第79篇原创文章,2017年分享的第20篇原创文章。 交朋友、...
    LubQ阅读 697评论 6 16