情感分析初战

from snownlp import SnowNLP
import pandas as pd
import numpy as np

traindata=pd.read_csv('/Users/xuyizhou/Desktop/trainData.csv')
  • 报错:
    UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc6 in position 8: inva
    subline查看文件乱码,修改后不是乱码

  • 报错:
    ParserError: Error tokenizing data. C error: Expected 5 fields in line 17077, saw 7
    \r的错


try another way

df=pd.read_xlsx('/Users/xuyizhou/Desktop/trainData.xlsx')

wrong

df=pd.read_excel('/Users/xuyizhou/Desktop/trainData.xlsx')

fundamental operation

df.head()
df.head(1)
df.dtypes
df.index
df.describe
df.iloc[3:5,1:4]

NLP
object->string

eg.

import json
data = [ { 'a':'A', 'b':(2, 4), 'c':3.0 } ]
data_string = json.dumps(data)
print 'ENCODED:', data_string
decoded = json.loads(data_string)
print 'DECODED:', decoded
print 'ORIGINAL:', type(data[0]['b'])
print 'DECODED :', type(decoded[0]['b'])

take the content[1] for example

s.words
Out[68]: 
['热水器',
 '加',
 '热',
 '时间',
 '太',
 '长',
 ',',
 '安装',
 '费',
 '太',
 '贵',
 ',',
 '预留',
 '太阳能',
 '口',
 '摆设',
 ',',
 '根本',
 '用',
 '不',
 '到',
 ',',
 '没有',
 '水位',
 '指示器',
 ',',
 '加',
 '满',
 '热水',
 '的',
 '指示',
 '灯',
 '放在',
 '了',
 '最',
 '侧面',
 ',',
 '不',
 '方便',
 '用户',
 '看',
 '指示',
 '灯',
 ',',
 '必须',
 '斜',
 '着',
 '看',
 '才',
 '能',
 '看到',
 ',']

the train data use the

theme-主题                加热时间;安装费;用户;
sentiment_word-情感关键词      太长;太贵;不方便;

use a cycle

successfully split the words

..to be continue 1102

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,491评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,856评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,745评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,196评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,073评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,112评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,531评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,215评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,485评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,578评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,356评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,215评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,583评论 3 299
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,898评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,174评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,497评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,697评论 2 335

推荐阅读更多精彩内容

  • 应该是夏天的尾巴了。阳光不再那么刺眼,风已经变得凌烈。那大片大片的玉米疯狂的生长,一如那年彼此的拥抱,不知所措……...
    素依是一只夜行的猫阅读 408评论 1 7
  • 图、文/简书小二 游戏,我想大家或多或少都有一点儿接触吧。现在几乎每家每户都有电脑,人手一部手机,难免会接触到各种...
    简书小二阅读 531评论 3 8
  • 分开以后我最大的领悟,不是我有多好也不是你有多坏,而是我看清了自己,更明白了两个人在一起的意义,好的爱情,永远是两...
    白色帆布鞋_702c阅读 566评论 0 1
  • 一个月总有那么几天情绪低落的时候。 比女生的大姨妈还准时。 这种情况不只是我的专利,很多人都有,达达令老师也有,不...
    动动笔记阅读 249评论 0 3
  • 直接上源码吧自己看这里是通过创建adapter的时候传进来的int数值来判断当前选中的是哪一个 这里主要是做了一个...
    人生刚开始阅读 7,088评论 1 1