天天看點

ruby抓取web頁面

    一種方法是net::http.new方法,傳回resp碼和實際的data:

不過resp可以取到,但data傳回nil值,換其他網頁同樣如此.後來發現那是早期的方法傳回值,新的ruby隻傳回一個值,我們可以用resp.body來通路網頁内容,坑爹啊:

還可以用以下方法效果類似:

注意用uri生成的url字元串要以http://開頭,否則貌似有錯.不過實際中我們要加錯誤處理和逾時處理,否則你就且等吧:

運作結果如下: