網絡爬蟲、request子產品

2023-08-05 22:56:42

自動抓取網際網路資訊的程式；

利用網際網路資料進行分析、開發産品

步驟：

1.通過網絡連結擷取網頁内容

2.對獲得的網頁内容進行處理

requests子產品是一個簡潔且簡單的處理HTTP請求的工具

支援非常豐富的連結通路功能，包括URL擷取，HTTP會話，Cookie記錄等

requests網頁請求：

get() 對應HTTP的GET方式

post() 對應HTTP的POST方式，用于傳遞使用者資料

requests對象屬性

status_code HTTP請求的傳回狀态，200表示連結成功，400表示失敗

text HTTP相應内容的字元串形式，即url對應的頁面内容。

# -*- coding:utf-8 -*-
import requests

def get_html_text(url):
    """
    傳回url的文本
    :param url:
    :return:
    """
    r = requests.get(url,timeout = 30)
    #print(r.status_code)
    return r.text


def main():
    city_name = input('請輸入城市拼音:')
    url = 'http://pm25.in/' + city_name
    url_text = get_html_text(url)
    #print(url_text)
    aqi = """
    <div class="span12 data">
        <div class="span1">
          <div class="value">
            """
    index = url_text.find(aqi)
    begin_index = index + len(aqi)
    end_index = begin_index +2
    aqi_val  = url_text[begin_index:end_index]
    print('空氣品質為{}'.format(aqi_val))
if __name__ == '__main__':
    main()

網絡爬蟲、request子產品

繼續閱讀

numpy數組轉置（my_array.T）

Pandas常用方法一

pandas DataFrame的屬性和資訊概覽

機器學習之Pandas 基礎2Pandas 基礎知識2

pandas資料劃分區間用pandas将資料劃分區間案例資料pandas.cut()介紹給資料加上區間和标簽

Pandas繪圖

我的第一個 Python 程式

人工智能之推薦系統基礎知識筆記

Python基礎知識：變量和引用

python資料類型之字典表

Python-開發之路-協程舉例

python中可異步執行的多程序、多線程子產品concurrent.futures

python科學計算生态-002-數字python科學計算生态-002-數字

(一)Python----開發環境搭建Linux（ipython,jupyter），Windows（Pycharm）python三. 開發環境安裝一. linux系統Windows安裝

我要悄悄學Python之環境搭建前言Python安裝包擷取Python的安裝驗證安裝安裝失敗如何處理最後

matplotlib繪制條形圖(bar、設定不同的顔色、設定每個條形圖文字)