socket起源于unix,而unix/linux基本哲學之一就是“一切皆檔案”,對于檔案用【打開】【讀寫】【關閉】模式來操作。socket就是該模式的一個實作,socket即是一種特殊的檔案,一些socket函數就是對其進行的操作(讀/寫io、打開、關閉)
基本上,socket 是任何一種計算機網絡通訊中最基礎的内容。例如當你在浏覽器位址欄中輸入 http://www.cnblogs.com/ 時,你會打開一個套接字,然後連接配接到 http://www.cnblogs.com/ 并讀取響應的頁面然後然後顯示出來。而其他一些聊天用戶端如 gtalk 和 skype 也是類似。任何網絡通訊都是通過 socket 來完成的。
socket和file的差別:
1、file子產品是針對某個指定檔案進行【打開】【讀寫】【關閉】
2、socket子產品是針對 伺服器端 和 用戶端socket 進行【打開】【讀寫】【關閉】
python 編寫server的步驟:
python編寫client的步驟:
python 提供了兩個基本的 socket 子產品。
第一個是 socket,它提供了标準的 bsd sockets api。
第二個是 socketserver, 它提供了伺服器中心類,可以簡化網絡伺服器的開發。
下面講的是socket子產品功能
套接字格式:
socket(family,type[,protocal]) 使用給定的位址族、套接字類型、協定編号(預設為0)來建立套接字。
socket類型
描述
socket.af_unix
隻能夠用于單一的unix系統程序間通信
socket.af_inet
伺服器之間網絡通信
socket.af_inet6
ipv6
socket.sock_stream
流式socket , for tcp
socket.sock_dgram
資料報式socket , for udp
socket.sock_raw
原始套接字,普通的套接字無法處理icmp、igmp等網絡封包,而sock_raw可以;其次,sock_raw也可以處理特殊的ipv4封包;此外,利用原始套接字,可以通過ip_hdrincl套接字選項由使用者構造ip頭。
socket.sock_seqpacket
可靠的連續資料包服務
建立tcp socket:
建立udp socket:
s=socket.socket(socket.af_inet,socket.sock_dgram)
注意點:
1)tcp發送資料時,已建立好tcp連接配接,是以不需要指定位址。udp是面向無連接配接的,每次發送要指定是發給誰。
2)服務端與用戶端不能直接發送清單,元組,字典。需要字元串化repr(data)。
socket函數
服務端socket函數
s.bind(address)
将套接字綁定到位址, 在af_inet下,以元組(host,port)的形式表示位址.
s.listen(backlog)
開始監聽tcp傳入連接配接。backlog指定在拒絕連接配接之前,作業系統可以挂起的最大連接配接數量。該值至少為1,大部分應用程式設為5就可以了。
s.accept()
接受tcp連接配接并傳回(conn,address),其中conn是新的套接字對象,可以用來接收和發送資料。address是連接配接用戶端的位址。
用戶端socket函數
s.connect(address)
連接配接到address處的套接字。一般address的格式為元組(hostname,port),如果連接配接出錯,傳回socket.error錯誤。
s.connect_ex(adddress)
功能與connect(address)相同,但是成功傳回0,失敗傳回errno的值。
公共socket函數
s.recv(bufsize[,flag])
接受tcp套接字的資料。資料以字元串形式傳回,bufsize指定要接收的最大資料量。flag提供有關消息的其他資訊,通常可以忽略。
s.send(string[,flag])
發送tcp資料。将string中的資料發送到連接配接的套接字。傳回值是要發送的位元組數量,該數量可能小于string的位元組大小。
s.sendall(string[,flag])
完整發送tcp資料。将string中的資料發送到連接配接的套接字,但在傳回之前會嘗試發送所有資料。成功傳回none,失敗則抛出異常。
s.recvfrom(bufsize[.flag])
接受udp套接字的資料。與recv()類似,但傳回值是(data,address)。其中data是包含接收資料的字元串,address是發送資料的套接字位址。
s.sendto(string[,flag],address)
發送udp資料。将資料發送到套接字,address是形式為(ipaddr,port)的元組,指定遠端位址。傳回值是發送的位元組數。
s.close()
關閉套接字。
s.getpeername()
傳回連接配接套接字的遠端位址。傳回值通常是元組(ipaddr,port)。
s.getsockname()
傳回套接字自己的位址。通常是一個元組(ipaddr,port)
s.setsockopt(level,optname,value)
設定給定套接字選項的值。
s.getsockopt(level,optname[.buflen])
傳回套接字選項的值。
s.settimeout(timeout)
設定套接字操作的逾時期,timeout是一個浮點數,機關是秒。值為none表示沒有逾時期。一般,逾時期應該在剛建立套接字時設定,因為它們可能用于連接配接的操作(如connect())
s.gettimeout()
傳回目前逾時期的值,機關是秒,如果沒有設定逾時期,則傳回none。
s.fileno()
傳回套接字的檔案描述符。
s.setblocking(flag)
如果flag為0,則将套接字設為非阻塞模式,否則将套接字設為阻塞模式(預設值)。非阻塞模式下,如果調用recv()沒有發現任何資料,或send()調用無法立即發送資料,那麼将引起socket.error異常。
s.makefile()
建立一個與該套接字相關連的檔案
tcp服務端:
1 建立套接字,綁定套接字到本地ip與端口
# socket.socket(socket.af_inet,socket.sock_stream) , s.bind()
2 開始監聽連接配接 #s.listen()
3 進入循環,不斷接受用戶端的連接配接請求 #s.accept()
4 然後接收傳來的資料,并發送給對方資料 #s.recv() , s.sendall()
5 傳輸完畢後,關閉套接字 #s.close()
tcp用戶端:
1 建立套接字,連接配接遠端位址
# socket.socket(socket.af_inet,socket.sock_stream) , s.connect()
2 連接配接後發送資料和接收資料 # s.sendall(), s.recv()
3 傳輸完畢後,關閉套接字 #s.close()
socket更多功能
注:撸主知道大家懶,是以把全部功能的中文标記在每個功能的下面啦。下面撸主列一些經常用到的吧
sk.bind(address)
s.bind(address) 将套接字綁定到位址。address位址的格式取決于位址族。在af_inet下,以元組(host,port)的形式表示位址。
sk.listen(backlog)
開始監聽傳入連接配接。backlog指定在拒絕連接配接之前,可以挂起的最大連接配接數量。backlog等于5,表示核心已經接到了連接配接請求,但伺服器還沒有調用accept進行處理的連接配接個數最大為5。這個值不能無限大,因為要在核心中維護連接配接隊列
sk.setblocking(bool)
是否阻塞(預設true),如果設定false,那麼accept和recv時一旦無資料,則報錯。
sk.accept()
接受連接配接并傳回(conn,address),其中conn是新的套接字對象,可以用來接收和發送資料。address是連接配接用戶端的位址。
接收tcp 客戶的連接配接(阻塞式)等待連接配接的到來
sk.connect(address)
連接配接到address處的套接字。一般,address的格式為元組(hostname,port),如果連接配接出錯,傳回socket.error錯誤。
sk.connect_ex(address)
同上,隻不過會有傳回值,連接配接成功時傳回 0 ,連接配接失敗時候傳回編碼,例如:10061
sk.close()
關閉套接字
sk.recv(bufsize[,flag])
接受套接字的資料。資料以字元串形式傳回,bufsize指定最多可以接收的數量。flag提供有關消息的其他資訊,通常可以忽略。
sk.recvfrom(bufsize[.flag])
與recv()類似,但傳回值是(data,address)。其中data是包含接收資料的字元串,address是發送資料的套接字位址。
sk.send(string[,flag])
将string中的資料發送到連接配接的套接字。傳回值是要發送的位元組數量,該數量可能小于string的位元組大小。即:可能未将指定内容全部發送。
sk.sendall(string[,flag])
将string中的資料發送到連接配接的套接字,但在傳回之前會嘗試發送所有資料。成功傳回none,失敗則抛出異常。内部通過遞歸調用send,将所有内容發送出去。
sk.sendto(string[,flag],address)
将資料發送到套接字,address是形式為(ipaddr,port)的元組,指定遠端位址。傳回值是發送的位元組數。該函數主要用于udp協定。
sk.settimeout(timeout)
設定套接字操作的逾時期,timeout是一個浮點數,機關是秒。值為none表示沒有逾時期。一般,逾時期應該在剛建立套接字時設定,因為它們可能用于連接配接的操作(如 client 連接配接最多等待5s )
sk.getpeername()
傳回連接配接套接字的遠端位址。傳回值通常是元組(ipaddr,port)。
sk.getsockname()
傳回套接字自己的位址。通常是一個元組(ipaddr,port)
sk.fileno()
套接字的檔案描述符
tcp:
案例一:機器人聊天
案例二 上傳檔案
udp:
udp傳輸
web服務應用:
i/o(input/output),即輸入/輸出端口。每個裝置都會有一個專用的i/o位址,用來處理自己的輸入輸出資訊。首先什麼是i/o:i/o分為磁盤io和網絡io,這裡說的是網絡io
io多路複用:i/o多路複用指:通過一種機制,可以監視多個描述符(socket),一旦某個描述符就緒(一般是讀就緒或者寫就緒),能夠通知程式進行相應的讀寫操作。
linux中的 select,poll,epoll 都是io多路複用的機制。
linux下網絡i/o使用socket套接字來通信,普通i/o模型隻能監聽一個socket,而i/o多路複用可同時監聽多個socket.
i/o多路複用避免阻塞在io上,原本為多程序或多線程來接收多個連接配接的消息變為單程序或單線程儲存多個socket的狀态後輪詢處理.
python中有一個select子產品,其中提供了:select、poll、epoll三個方法,分别調用系統的 select,poll,epoll 進而實作io多
對于select子產品操作的方法:
利用select監聽終端操作執行個體
利用select實作僞同時處理多個socket用戶端請求
利用select實作僞同時處理多個socket用戶端請求讀寫分離
socketserver内部使用 io多路複用 以及 “多線程” 和 “多程序” ,進而實作并發處理多個用戶端請求的socket服務端。即:每個用戶端請求連接配接到伺服器時,socket服務端都會在伺服器是建立一個“線程”或者“程序” 專門負責處理目前用戶端的所有請求。
threadingtcpserver
threadingtcpserver實作的soket伺服器内部會為每個client建立一個 “線程”,該線程用來和用戶端進行互動。
1、threadingtcpserver基礎
使用threadingtcpserver:
建立一個繼承自 socketserver.baserequesthandler 的類
類中必須定義一個名稱為 handle 的方法
啟動threadingtcpserver
2、threadingtcpserver源碼剖析
threadingtcpserver的類圖關系如下:
内部調用流程為:
啟動服務端程式
執行 tcpserver.__init__ 方法,建立服務端socket對象并綁定 ip 和 端口
執行 baseserver.__init__ 方法,将自定義的繼承自socketserver.baserequesthandler 的類 myrequesthandle指派給 self.requesthandlerclass
執行 baseserver.server_forever 方法,while 循環一直監聽是否有用戶端請求到達 ...
當用戶端連接配接到達伺服器
執行 threadingmixin.process_request 方法,建立一個 “線程” 用來處理請求
執行 threadingmixin.process_request_thread 方法
執行 baseserver.finish_request 方法,執行 self.requesthandlerclass() 即:執行 自定義 myrequesthandler 的構造方法(自動調用基類baserequesthandler的構造方法,在該構造方法中又會調用 myrequesthandler的handle方法)
socketserver的threadingtcpserver之是以可以同時處理請求得益于 select 和 threading 兩個東西,其實本質上就是在伺服器端為每一個用戶端建立一個線程,目前線程用來處理對應用戶端的請求,是以,可以支援同時n個用戶端連結(長連接配接)。