天天看點

Eclipse下運作啟動Heritrix1.14.4

前面我們知道了如何通過執行heritrix官方提供的jar包去啟動heritrix,慶幸的是,heritrix是完全開源的,是以我們可以将heritrix的源碼直接導入eclipse去運作它。

首先解壓heritrix-1.14.4-src.zip到任意盤符,這裡我直接解壓到桌面,解壓後你會看到如圖的目錄結構:

Eclipse下運作啟動Heritrix1.14.4

 src下毫無疑問是源碼檔案,lib是heritrix依賴的jar包。testdata檔案夾裡存放的是測試檔案,可以忽略。

Eclipse下運作啟動Heritrix1.14.4

 将heritrix-1.14.4-src\src\java下的org,com,st3個目錄copy到剛建立的project的src下,

Eclipse下運作啟動Heritrix1.14.4

 源碼複制進去後有很多代碼報錯,是因為我們還沒有添加jar依賴,首先在project裡建立一個folder取名lib用于存放依賴的第三方jar包,如圖:

Eclipse下運作啟動Heritrix1.14.4
Eclipse下運作啟動Heritrix1.14.4

 将heritrix-1.14.4\lib下的所有jar包全部copy到剛剛建立的lib下,如圖:

Eclipse下運作啟動Heritrix1.14.4

 選中全部jar,然後add to build path,如圖:

Eclipse下運作啟動Heritrix1.14.4

 然後建立一個source folder取名為conf(名字随便取,不一定要叫conf),如圖:

Eclipse下運作啟動Heritrix1.14.4

 将heritrix-1.14.4\src\conf下的所有檔案及檔案夾全部copy到建立的conf源碼檔案夾下,如圖:

Eclipse下運作啟動Heritrix1.14.4
Eclipse下運作啟動Heritrix1.14.4

 然後繼續建立一個source folder 取名為resources,如圖:

Eclipse下運作啟動Heritrix1.14.4

 然後resources下建立一個org. archive.util包,如圖:

Eclipse下運作啟動Heritrix1.14.4
Eclipse下運作啟動Heritrix1.14.4

 然後将heritrix-1.14.4\src\resources\org\archive\util下的tlds-alpha-by-domain.txt檔案copy到剛剛建立的org.acchive.util包下,如圖:

Eclipse下運作啟動Heritrix1.14.4

 然後将heritrix-1.14.4\src下的webapps整個目錄複制到目前project的根目錄下,如圖:

Eclipse下運作啟動Heritrix1.14.4

 然後在eclipse中打開heritrix.properties配置檔案,稍作修改,如圖:

Eclipse下運作啟動Heritrix1.14.4

 這一切工作完成後,在eclipse界面裡按下ctrl + shift + t,然後查找heritrix類,如圖:

Eclipse下運作啟動Heritrix1.14.4

 然後你就可以滑鼠右鍵run as運作它來啟動heritrix啦,運作後如果你在控制台看到如圖的提示資訊,即表明heritrix啟動成功啦!

Eclipse下運作啟動Heritrix1.14.4

iteye不允許我貼我的qq和群号,要聯系我看之前的部落格吧,不然iteye又要封我部落格啦,坑爹的iteye!

轉載:http://iamyida.iteye.com/blog/2239775

繼續閱讀