天天看点

scrapy框架爬虫xpath的extract()和extract_first()之区别

使用scrapy爬虫时,我们会使用xpath来获取html标签,通常有两种数据提取的方法,分别是:

extract():返回的是一个数组list,里面包含了多个string,若只有一个string,则返回[‘ABC’]这种格式。

extract_first():返回的是一个string字符串,是list数组里面的第一个字符串

继续阅读