前幾天,Tony老師幫朋友寫了一個爬蟲工具,抓取網頁上的股票資訊,後來有人問我,有其它更友善的方法嗎?
還真有!不用程式設計,滑鼠點幾下,就把網頁的資訊抓取到表格裡面去,然後還能直接分析資料,而且軟體也免費。。。
這麼牛逼的軟體是什麼呢?那就是Power BI。
接下來,Tony老師會開一系列課程,教大家學習Power BI,如果你有興趣學Power BI,歡迎加入QQ群,共同探讨:282308215
我們以一個實際案例來學習如何抓取網頁資料:
統計過去一個月上海的天氣情況。
在Google上搜尋上海天氣,第三個連結應該是這個:
http://tianqi.2345.com/wea_history/58362.htm

打開Power BI,在資料源的地方選擇Web,并輸入網址。
選擇Table 0,點Load,我們看到天氣的資料已經被我們抓取到表格裡面了。
我們看到最高氣溫和最低氣溫是字元串28℃,這樣沒辦法做資料對比,我們要把28和℃分開。
這就要用到一個Power Query的工具。
順便提一下,使用Power BI的順序(一定記住了):
Power Query -> Power Pivot -> Power View
在菜單欄點Edit Queries
選中要分列的字段點右鍵,選中【拆分列】-【按照從數字到非數字轉換】
然後把數字字段轉換為浮點資料類型,同樣通過點右鍵【更改類型】-【小數】
我們可以點【進階編輯】,看一下M語言
Power BI裡面有兩種語言,一個是M語言,是在Power Query裡整理資料源的時候的語言,另外一種是DAX語言,類似于Excel公式的一種語言。
點選左上角的【關閉并應用】,關閉Power Query。
在View界面的可視化點【折線】并設定如下參數:
點【堆積條形圖】,并設定如下參數:
瞬間可以做出下面的圖表:
是不是很神奇,Tony老師試了幾個能夠展現出Table樣式的網頁,基本上都能抓取成功,包括股票,天氣,成績。。。。。。
如果你想學Power BI,歡迎關注Tony老師。或者加入QQ群,共同學習:282308215
今天先講到這裡,謝謝。