天天看點

網頁自動操作:爬蟲 – 擷取股票資訊

上次寫了《自動錄入機器人》後,很多朋友問我能不能幫做各種場景的問題,回答了幾個問題後,總結一下:需求集中在把Excel表中資料錄入系統。我在這裡統一回答:隻要有網頁端的系統,都可以自動錄入!

最近有個朋友在分析股票,把相關股票資訊收集到Excel裡進行分析,包括曆史記錄及每天的更新。每天往Excel表裡更新幾十支股票的資訊是一個沒有任何價值但是不得不去做的事情。問我能不能幫忙搞一個自動抓取股票資訊,包括股票代碼,日期,開盤價,收盤價,最高價,最低價以及每天的交易量。

以Tesla為例:通過Yahoo可以看到詳細的曆史記錄https://finance.yahoo.com/quote/TSLA/history?p=TSLA

網頁自動操作:爬蟲 – 擷取股票資訊

資料都有,隻要把網頁的xPath分析出來,寫入Excel就可以了。

目前能解析xPath的工具有:

  • HtmlAgilityPack (隻有一個dll檔案,不用引用其它dll)
  • AngleSharp
  • DotnetSpider(國産,要引用超級多dll,有40多個)

我選用的HtmlAgilityPack,因為它簡單,隻引用一個dll檔案就可以了。

Excel操作用的微軟官方的 Microsoft.Office.Interop.Excel

軟體使用:

先在Excel檔案的CompanyCode表中維護你要下載下傳的股票代碼,儲存關閉Excel:

網頁自動操作:爬蟲 – 擷取股票資訊

運作軟體:選擇你剛剛儲存的Excel檔案,點選Download

網頁自動操作:爬蟲 – 擷取股票資訊

等運作完畢後,軟體自動退出

打開Excel看一下結果吧

網頁自動操作:爬蟲 – 擷取股票資訊

結果還不錯吧。

如果你有相同的需求,歡迎加微信免費索取軟體: