在簡數采集平台中,可通過清單提取器快速提取多個詳情頁連結,配置主要有3個步驟:
1、點選“重置目前字段”按鈕,重新開始配置;
2、用滑鼠點選要采集的連結(标題),隻需點選兩個不同連結,系統便會自動選中其它相似的連結;
3、檢查頁面左下角“資料預覽” 下方是否列出了文章連結位址,如果有,則配置正确,如果沒有,需要再點選,直到出現連結。
網址采集配置結果示例:

詳細使用步驟:
1. 清除舊配置
智能向導建立任務過程中或者任務建立完成後,如果網址采集規則不正确,那麼可以打開“清單提取器”進行修改。
在清單提取器右上方點選 【重置目前字段配置】按鈕,點選 【OK】,清除已有的配置:
2. 在頁面上點選要采集的連結
用滑鼠點選要采集的連結(标題),隻需點選兩個不同連結,系統便會自動選中其它相似的連結。
點選兩個後,檢查頁面左下角“資料預覽” 下方是否列出了文章連結位址,如果有,則配置正确,如果沒有,需要再點選,直到出現連結。(若無連結出現,請檢視清單頁配置常見問題及解決)
(可選)網址采集規則通用性測試:如果任務配置了采集多個清單頁面(如翻頁),那麼可點選‘典型清單頁網址’ 的輸入框,就會出現其它清單頁網址的下拉清單,随便選擇一兩個不同的連結,即可進行。
進階配置說明:清單提取器隻能配置一個url字段,并預設勾選上 ‘隻擷取網址’ 和 ‘自動選中類似元素’ 功能。
清單頁配置常見問題及解決
I、點選不出來連結,怎麼辦?
解決方法主要分四種情況:
重新選擇,移動變化點選的區域,縮小或者放大。或者注意變通,選擇其它位置達到相同的目的。如清單中有“閱讀全文”連結;
手動修改“目前字段xpath”:清單詳情連結xpath一般最後都是/a,或者a/kds 。如果看到不是這樣的,可以把最後其它的删除。(/kds這個删除或保留都不影響);
如果需要的區域内容為空,那麼可以試試勾選“使用JS動态資料”來動态加載頁面;
清單提取器擷取特殊連結網址(如在onclick屬性),點選檢視詳細教程;
II、清單提取器的入口?
清單提取器的入口主要有兩個:
任務清單的快速入口;
任務基本資訊頁面的入口;