抓取的URL存下來的時候可能為字元串,scrapy提取的時候隻提取到第一個字母 h 。
解決方案:
image_url = post_node.css('dt.img a img::attr(onerror)').extract_first('') # 擷取圖檔
front_image_url = [image_url if 'http:' in image_url else ('http:' + image_url)] # 判斷圖檔是否為連結
抓取的URL存下來的時候可能為字元串,scrapy提取的時候隻提取到第一個字母 h 。
解決方案:
image_url = post_node.css('dt.img a img::attr(onerror)').extract_first('') # 擷取圖檔
front_image_url = [image_url if 'http:' in image_url else ('http:' + image_url)] # 判斷圖檔是否為連結