python3.x爬蟲：爬取大學排名資料

2023-06-28 22:54:11

import requests
from bs4 import BeautifulSoup
import bs4

def getHTMLText(url):
    try:
        r = requests.get(url, timeout=30)
        r.raise_for_status()
        r.encoding = r.apparent_encoding

        return r.text
    except:
        return "通路出錯"

def fillUnivList(ulist,html):
    soup = BeautifulSoup(html, "html.parser")
    for tr in soup.find('tbody').children:
        if isinstance(tr, bs4.element.Tag):
            tds = tr('td')
            ulist.append([tds[0].string,tds[1].string,tds[2].string,tds[3].string,tds[4].string])


def printUnivList(ulist,num):
    tplt="{0:^10}\t{1:{5}^10}\t{2:^10}\t{3:^10}\t{4:^10}" #中英文對齊，格式化
    print(tplt.format("排名","學校名稱","省份","總分","名額得分",chr(12288)))
    for i in range(num):
        u = ulist[i]
        print(tplt.format(u[0],u[1],u[2],u[3],u[4],chr(12288)))


def main():
    uinfo = []
    url = 'http://www.zuihaodaxue.cn/zuihaodaxuepaiming2016.html'
    html = getHTMLText(url)
    print(html)
    fillUnivList(uinfo,html)
    printUnivList(uinfo, 20)

main()

python3.x爬蟲：爬取大學排名資料

繼續閱讀

python好玩的自制項目－美桌網的王者榮耀最新英雄皮膚高清桌面的爬取

爬蟲（13）-爬蟲爬取CVPR+ICCV+ECCV期刊論文自動下載下傳PDF儲存檔案中（科研黨福利）

Python使用BeautifulSoup與Requests爬取大學排名實作工具具體代碼代碼分析列印前100的榜單

Python3實作百度雲盤資源自動轉存

Python爬蟲實戰：使用代理（requests子產品）

Python_爬蟲_喜馬拉雅音頻

Python實戰|騰訊招聘你幹什麼？python可視化告訴你

Python爬蟲實戰：東方财富網股吧資料爬取（二）Python爬蟲實戰系列文章目錄前言一、項目說明二、問題重述二、實施過程總結寫在最後

Python爬蟲實戰：東方财富網股吧資料爬取（一）Python爬蟲實戰系列文章目錄前言一、項目說明二、實施過程總結寫在最後

Scrapy + MongoDB 抓取豆瓣 Top250 入門爬蟲進階6.2 輕按兩下打開檔案進行安裝，在安裝過程中，可以通過點選 "Custom(自定義)" 按鈕來設定你的安裝目錄。

Python 異步爬蟲原了解析及爬取實戰一、基本概念二、協程用法三、異步爬蟲實作

Python爬蟲遇到亂碼問題及解決方法

Python爬蟲實戰 | (1) 爬取貓眼電影官網的TOP100電影榜單

爬蟲基礎執行個體 Requests _post請求

《python爬蟲實戰》：爬取圖檔