Jsoup官方给出的文档,链接:http://www.open-open.com/jsoup/
描述问题:
学校教务处系统中,我想获取所有科目以及对应的成绩,因此我采用了Jsoup抓取
采集成绩:fenshu=item.select("span.ui-li-count"); 使用fenshu.get(i).text()-OK
采集科目:kecheng=item.select("h4"); 使用kecheng.get(i).text()-Not fine
出现内容:
预期:科目:计算机控制技术与系统
成绩:未录入
实际:科目:计算机控制技术与系统 81110206 - 1 李大中 未录入
成绩:未录入
互联网类似问题:http://ask.csdn.net/questions/189739
Jsoup中没有给出明确解决办法,其中帖子给出的的方法此处不适用
解决办法:
把kecheng的计算机控制技术与系统 81110206 - 1 李大中 未录入导入字符串str
利用函数StringTokenizer()自定义字符串" ",这样就把str中空格内容过滤掉
String str = kecheng.get(i).text();
String split =" ";
StringTokenizer token =new StringTokenizer(str, split);
最后效果:
科目:计算机控制技术与系统
成绩:未录入