02-12 多任務異步協程執行個體

2023-08-07 03:41:03

一、注意事項：

'''
1、将多個對象存儲到一個清單中，然後将該清單注冊到事件循環中，
在注冊過程中，該清單需要用wait方法進行處理
2、在任務對象對應的特殊函數内部的實作中，不可以出現不支援異步
子產品的代碼，否則會中斷整個異步效果，并且在該函數的内部中每一
組阻塞操作都必須使用await關鍵字進行修飾
3、requests子產品不支援異步，是以不能出現在async 修飾的函數中

二、代碼架構

import time
import asyncio

urls=[
    'http://www.taobao.com',
    'http://www.taobao.com',
    'http://www.taobao.com'
]

async def get_request(url):
    print('正在請求：',url)
    # time.sleep(2) 此時錯誤，因為協程子產品待執行函數中
    # 不允許出現不支援異步子產品的函數，需改為
    # asyncio.sleep(2) 此時雖不會報錯，但還是有問題
    # 阻塞操作必須有await關鍵字修飾，還需修改為

    await asyncio.sleep(2)
    
    print('請求結束:',url)
    return 'xinxin'

tasks=[]

for url in urls:
    c=get_request(url)

    task=asyncio.ensure_future(c)
    tasks.append(task)

loop=asyncio.get_event_loop()
# resp=loop.run_until_complete(tasks) 此時語句是錯誤
# 的，因為loop中注冊的每個任務都是有阻塞的，是以執行過程
# 中必須手動設定挂起操作，即
resp=loop.run_until_complete(asyncio.wait(tasks))

三、執行個體應用

import time
import requests
import asyncio
import aiohttp
from lxml import etree

urls=[
    'http://www.taobao.com',
    'http://www.taobao.com',
    'http://www.taobao.com'
]
start_time=time.time()

async def get_request(url):
    # page_text=requests.get(url).text
    #注意，這個請求過程本身就是一個阻塞過程
    # 注意，因為爬蟲最常用的requests子產品，但我們為了
    # 速度，需要學習異步效果，是以說明了requests子產品
    # 不支援異步，是以需改用aiohttp子產品，改寫

    with aiohttp.ClientSession() as s:
        with s.get(url) as resp:
            page_text=resp.text()
            #響應為字元byte時，resp.read()
            return page_text

    #注意，上述隻是主題架構，結果還不能實作異步，需添加細節
    #每一個with前面+async ，在每一步則塞錢加await,即完整代碼


    async with aiohttp.ClientSession() as s:
        async with await s.get(url) as resp:
            page_text = await resp.text()
            # 響應為字元byte時，resp.read()
            return page_text

def parse(task): # 解析函數式就是回調函數
    page_text=tasks.result()   
     #關鍵第一步，将爬取的響應結果取到
    tree=etree.HTML(page_text)
    response=tree.xpath('//p/text()')[0]
    print(response)

if __name__=='__main__' :

    tasks=[]
    for url in urls:
        c=get_request(url)

        task=asyncio.ensure_future(c)
         #發送請求獲得響應
        task.add_done_callback(parse) 
        #解析網頁，實作聚焦爬蟲

        tasks.append(task)
    loop=asyncio.get_event_loop()
    result=loop.run_until_complete(asyncio.wait(tasks))

    print('共計時間為',time.time()-start_time)

02-12 多任務異步協程執行個體

繼續閱讀

02-12 單線程+多任務異步協程

一本筆記，搞定從一年級到六年級的數學知識要點，學生複習必備

坑！坑！！坑！！！随着駕駛證考試難度的不斷增加，尤其是理論知識（科目一和科目四）的考試題越來越多，很多考試的扣分項目也不

三年級下冊數學：各單元知識要點列印給孩子學習，這些知識一定要了解透！電子版（word）👉@三年級學科資料

又是一季金三銀四，Spring之AOP知識要點總結

高一數學必修二“平面向量的運算”知識要點總結和思維拓展聯考數學要想拿高分，基礎知識點必須先吃透。#高一##數學#

中考曆史專題——“中外重大改革”的知識要點歸納中考曆史考查範圍廣、對學生了解知識點的要求較高，需要考生對基礎知識進行專題

weak reference的介紹

【人教版五年級數學（下冊）知識要點】

hello，我是風浔，一個持續分享@個人成長幹貨@自媒體營運的全職寶媽。～邁入6月，2023年即将過半。大家的上半年過得

期末國文第三輪複習(3天)【複習内容及方法】1.模拟自測考前3天找期末模拟測試題給孩子做，根據孩子自身情況選擇做幾套，最

100個國學知識要點，碼住學習…[祈禱][來看我]

03-07 map函數-list()-split()詳解

中華人民共和國保密法知識要點

二年級上國文《植物媽媽有辦法》課堂筆記分享！太詳細了快收藏！假期是彎道超車的最佳時機，有規劃的家長此時都會給孩子準備好一