scrapy关于.xpath中的normalize-space()的理解

若div为当前节点,使用.xpath('//div//text()').extract()开头或者结尾会有\r\n\t。

使用 .xpath('normalize-space(//div)').extract() 输出结果则是去掉了开头的\r\n\t

但是 .xpath('normalize-space(//div//text())').extract()是获取不到值的

因为text()返回的是节点集,normalize-space()无法标准化。可如果text()返回一个节点的时候,会自动转化为字符串

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容