R语言不是中国人开发的,自然对中文的处理上没有特别考虑,但是我们依然可以处理。
下面我给出了解决方案。但我想,别的读取解决方案应该也是一样的。不信,可以看我的下一篇文章对各种类型的中文数据的读取。
一个例子,R语言读取excel表的中文数据,关于excel表的读取请看博客R语言包gdata读取excel文件。
setwd("..")#设置工作目录
getwd()#查看工作目录
> a<-read.xls("watermelon.xlsx",sheet=1,header =T)
> a
缂栧彿 鑹叉辰 鏍硅拏 鏁插0 绾圭悊 鑴愰儴 瑙.劅
1 4 闈掔豢 铚风缉 娌夐椃 娓呮櫚 鍑归櫡 纭粦
2 6 闈掔豢 绋嶈湻 娴婂搷 娓呮櫚 绋嶅嚬 杞矘
3 8 涔岄粦 绋嶈湻 娴婂搷 娓呮櫚 绋嶅嚬 纭粦
4 10 闈掔豢 纭尯 娓呰剢 娓呮櫚 骞冲潶 杞矘
5 12 娴呯櫧 铚风缉 娴婂搷 妯$硦 骞冲潶 杞矘
6 14 娴呯櫧 绋嶈湻 娌夐椃 绋嶇硦 鍑归櫡 纭粦
7 16 娴呯櫧 铚风缉 娴婂搷 妯$硦 骞冲潶 纭粦
濂界摐
1 鏄\xaf"\n5,娴呯櫧,铚风缉,娴婂搷,娓呮櫚,鍑归櫡,纭粦,鏄\xaf"
2 鏄\xaf"\n7,涔岄粦,绋嶈湻,娴婂搷,绋嶇硦,绋嶅嚬,杞矘,鏄\xaf"
3 鏄\xaf"\n9,涔岄粦,绋嶈湻,娌夐椃,绋嶇硦,绋嶅嚬,纭粦,鍚\xa6"
4 鍚\xa6"\n11,娴呯櫧,纭尯,娓呰剢,妯$硦,骞冲潶,纭粦,鍚\xa6"
5 鍚\xa6"\n13,闈掔豢,绋嶈湻,娴婂搷,绋嶇硦,鍑归櫡,纭粦,鍚\xa6"
6 鍚\xa6"\n15,涔岄粦,绋嶈湻,娴婂搷,娓呮櫚,绋嶅嚬,杞矘,鍚\xa6"
7 鍚\xa6"\n17,闈掔豢,铚风缉,娌夐椃,绋嶇硦,绋嶅嚬,纭粦,鍚\xa6"
乱码了,下面来处理。
> a<-read.xls("watermelon.xlsx",sheet=1,header =T,fileEncoding="utf8")
> a
编号 色泽 根蒂 敲声 纹理 脐部 触感 好瓜
1 1 青绿 蜷缩 浊响 清晰 凹陷 硬滑 是
2 2 乌黑 蜷缩 沉闷 清晰 凹陷 硬滑 是
3 3 乌黑 蜷缩 浊响 清晰 凹陷 硬滑 是
4 4 青绿 蜷缩 沉闷 清晰 凹陷 硬滑 是
5 5 浅白 蜷缩 浊响 清晰 凹陷 硬滑 是
6 6 青绿 稍蜷 浊响 清晰 稍凹 软粘 是
7 7 乌黑 稍蜷 浊响 稍糊 稍凹 软粘 是
8 8 乌黑 稍蜷 浊响 清晰 稍凹 硬滑 是
9 9 乌黑 稍蜷 沉闷 稍糊 稍凹 硬滑 否
10 10 青绿 硬挺 清脆 清晰 平坦 软粘 否
11 11 浅白 硬挺 清脆 模糊 平坦 硬滑 否
12 12 浅白 蜷缩 浊响 模糊 平坦 软粘 否
13 13 青绿 稍蜷 浊响 稍糊 凹陷 硬滑 否
14 14 浅白 稍蜷 沉闷 稍糊 凹陷 硬滑 否
15 15 乌黑 稍蜷 浊响 清晰 稍凹 软粘 否
16 16 浅白 蜷缩 浊响 模糊 平坦 硬滑 否
17 17 青绿 蜷缩 沉闷 稍糊 稍凹 硬滑 否
OK啦,完美解决。好高兴,好有成就感哟!