若div为当前节点,使用.xpath('//div//text()').extract()开头或者结尾会有\r\n\t。
使用 .xpath('normalize-space(//div)').extract() 输出结果则是去掉了开头的\r\n\t
但是 .xpath('normalize-space(//div//text())').extract()是获取不到值的
因为text()返回的是节点集,normalize-space()无法标准化。可如果text()返回一个节点的时候,会自动转化为字符串