天天看點

scrapy下載下傳圖檔時,圖檔連結報錯Missing scheme in request url: %s' % self._url

抓取的URL存下來的時候可能為字元串,scrapy提取的時候隻提取到第一個字母 h 。

解決方案:

image_url = post_node.css('dt.img a img::attr(onerror)').extract_first('')  # 擷取圖檔
front_image_url = [image_url if 'http:' in image_url else ('http:' + image_url)]  # 判斷圖檔是否為連結
           

繼續閱讀