天天看點

socket網絡程式設計基礎小記

        “一切皆Socket!”

        話雖些許誇張,但是事實也是,現在的網絡程式設計幾乎都是用的socket。

                                                          ——有感于實際程式設計和開源項目研究。

        我們深谙資訊交流的價值,那網絡中程序之間如何通信,如我們每天打開浏覽器浏覽網頁時,浏覽器的程序怎麼與web伺服器通信的?當你用QQ聊天時,QQ程序怎麼與伺服器或你好友所在的QQ程序通信?這些都得靠socket?那什麼是socket?socket的類型有哪些?還有socket的基本函數,這些都是本文想介紹的。本文的主要内容如下:

1、網絡中程序之間如何通信?
2、Socket是什麼?
3、socket的基本操作
    3.1、socket()函數
    3.2、bind()函數
    3.3、listen()、connect()函數
    3.4、accept()函數
    3.5、read()、write()函數等
    3.6、close()函數
4、socket中TCP的三次握手建立連接配接詳解
5、socket中TCP的四次握手釋放連接配接詳解
6、一個例子(實踐一下)
7、留下一個問題,歡迎大家回帖回答!!!
           

1、網絡中程序之間如何通信?

        本地的程序間通信(IPC)有很多種方式,但可以總結為下面4類:

消息傳遞(管道、FIFO、消息隊列)
同步(互斥量、條件變量、讀寫鎖、檔案和寫記錄鎖、信号量)
共享記憶體(匿名的和具名的)
遠端過程調用(Solaris門和Sun RPC)
           

        但這些都不是本文的主題!我們要讨論的是網絡中程序之間如何通信?首要解決的問題是如何唯一辨別一個程序,否則通信無從談起!在本地可以通過程序PID來唯一辨別一個程序,但是在網絡中這是行不通的。其實TCP/IP協定族已經幫我們解決了這個問題,網絡層的“ip位址”可以唯一辨別網絡中的主機,而傳輸層的“協定+端口”可以唯一辨別主機中的應用程式(程序)。這樣利用三元組(ip位址,協定,端口)就可以辨別網絡的程序了,網絡中的程序通信就可以利用這個标志與其它程序進行互動。

        使用TCP/IP協定的應用程式通常采用應用程式設計接口:UNIX BSD的套接字(socket)和UNIX System V的TLI(已經被淘汰),來實作網絡程序之間的通信。就目前而言,幾乎所有的應用程式都是采用socket,而現在又是網絡時代,網絡中程序通信是無處不在,這就是我為什麼說“一切皆socket”。

2、什麼是Socket?

        上面我們已經知道網絡中的程序是通過socket來通信的,那什麼是socket呢?socket起源于Unix,而Unix/Linux基本哲學之一就是“一切皆檔案”,都可以用“打開open –> 讀寫write/read –> 關閉close”模式來操作。我的了解就是Socket就是該模式的一個實作,socket即是一種特殊的檔案,一些socket函數就是對其進行的操作(讀/寫IO、打開、關閉),這些函數我們在後面進行介紹。

socket一詞的起源

   在組網領域的首次使用是在1970年2月12日釋出的文獻IETF RFC33中發現的,撰寫者為Stephen Carr、Steve Crocker和Vint Cerf。根據美國計算機曆史博物館的記載,Croker寫道:“命名空間的元素都可稱為套接字接口。一個套接字接口構成一個連接配接的一端,而一個連接配接可完全由一對套接字接口規定。”計算機曆史博物館補充道:“這比BSD的套接字接口定義早了大約12年。”
           

3、socket的基本操作

        既然socket是“open—write/read—close”模式的一種實作,那麼socket就提供了這些操作對應的函數接口。下面以TCP為例,介紹幾個基本的socket接口函數。

3.1、socket()函數

int socket(int domain, int type, int protocol);
           

        socket函數對應于普通檔案的打開操作。普通檔案的打開操作傳回一個檔案描述字,而socket()用于建立一個socket描述符(socket descriptor),它唯一辨別一個socket。這個socket描述字跟檔案描述字一樣,後續的操作都有用到它,把它作為參數,通過它來進行一些讀寫操作。

        正如可以給fopen的傳入不同參數值,以打開不同的檔案。建立socket的時候,也可以指定不同的參數建立不同的socket描述符,socket函數的三個參數分别為:

domain:即協定域,又稱為協定族(family)。常用的協定族有,AF_INET、AF_INET6、AF_LOCAL(或稱AF_UNIX,Unix域socket)、AF_ROUTE等等。協定族決定了socket的位址類型,在通信中必須采用對應的位址,如AF_INET決定了要用ipv4位址(32位的)與端口号(16位的)的組合、AF_UNIX決定了要用一個絕對路徑名作為位址。
   type:指定socket類型。常用的socket類型有,SOCK_STREAM、SOCK_DGRAM、SOCK_RAW、SOCK_PACKET、SOCK_SEQPACKET等等(socket的類型有哪些?)。
   protocol:故名思意,就是指定協定。常用的協定有,IPPROTO_TCP、IPPTOTO_UDP、IPPROTO_SCTP、IPPROTO_TIPC等,它們分别對應TCP傳輸協定、UDP傳輸協定、STCP傳輸協定、TIPC傳輸協定(這個協定我将會單獨開篇讨論!)。
           

        注意:并不是上面的type和protocol可以随意組合的,如SOCK_STREAM不可以跟IPPROTO_UDP組合。當protocol為0時,會自動選擇type類型對應的預設協定。

        當我們調用socket建立一個socket時,傳回的socket描述字它存在于協定族(address family,AF_XXX)空間中,但沒有一個具體的位址。如果想要給它指派一個位址,就必須調用bind()函數,否則就當調用connect()、listen()時系統會自動随機配置設定一個端口。

3.2、bind()函數

        正如上面所說bind()函數把一個位址族中的特定位址賦給socket。例如對應AF_INET、AF_INET6就是把一個ipv4或ipv6位址和端口号組合賦給socket。

int bind(int sockfd, const struct sockaddr *addr, socklen_t addrlen);
           

        函數的三個參數分别為:

sockfd:即socket描述字,它是通過socket()函數建立了,唯一辨別一個socket。bind()函數就是将給這個描述字綁定一個名字。
   addr:一個const struct sockaddr *指針,指向要綁定給sockfd的協定位址。這個位址結構根據位址建立socket時的位址協定族的不同而不同,如ipv4對應的是: 

struct sockaddr_in {
    sa_family_t    sin_family; /* address family: AF_INET */
    in_port_t      sin_port;   /* port in network byte order */
    struct in_addr sin_addr;   /* internet address */
};

/* Internet address. */
struct in_addr {
    uint32_t       s_addr;     /* address in network byte order */
};

ipv6對應的是: 

struct sockaddr_in6 { 
    sa_family_t     sin6_family;   /* AF_INET6 */ 
    in_port_t       sin6_port;     /* port number */ 
    uint32_t        sin6_flowinfo; /* IPv6 flow information */ 
    struct in6_addr sin6_addr;     /* IPv6 address */ 
    uint32_t        sin6_scope_id; /* Scope ID (new in 2.4) */ 
};

struct in6_addr { 
    unsigned char   s6_addr[16];   /* IPv6 address */ 
};

Unix域對應的是: 

#define UNIX_PATH_MAX    108

struct sockaddr_un { 
    sa_family_t sun_family;               /* AF_UNIX */ 
    char        sun_path[UNIX_PATH_MAX];  /* pathname */ 
};

addrlen:對應的是位址的長度。
           

        通常伺服器在啟動的時候都會綁定一個衆所周知的位址(如ip位址+端口号),用于提供服務,客戶就可以通過它來接連伺服器;而用戶端就不用指定,有系統自動配置設定一個端口号和自身的ip位址組合。這就是為什麼通常伺服器端在listen之前會調用bind(),而用戶端就不會調用,而是在connect()時由系統随機生成一個。

網絡位元組序與主機位元組序

   主機位元組序就是我們平常說的大端和小端模式:不同的CPU有不同的位元組序類型,這些位元組序是指整數在記憶體中儲存的順序,這個叫做主機序。引用标準的Big-Endian和Little-Endian的定義如下:

  a) Little-Endian就是低位位元組排放在記憶體的低位址端,高位位元組排放在記憶體的高位址端。

  b) Big-Endian就是高位位元組排放在記憶體的低位址端,低位位元組排放在記憶體的高位址端。

   網絡位元組序:4個位元組的32 bit值以下面的次序傳輸:首先是0~7bit,其次8~15bit,然後16~23bit,最後是24~31bit。這種傳輸次序稱作大端位元組序。由于TCP/IP首部中所有的二進制整數在網絡中傳輸時都要求以這種次序,是以它又稱作網絡位元組序。位元組序,顧名思義位元組的順序,就是大于一個位元組類型的資料在記憶體中的存放順序,一個位元組的資料沒有順序的問題了。

   是以:在将一個位址綁定到socket的時候,請先将主機位元組序轉換成為網絡位元組序,而不要假定主機位元組序跟網絡位元組序一樣使用的是Big-Endian。由于這個問題曾引發過血案!公司項目代碼中由于存在這個問題,導緻了很多莫名其妙的問題,是以請謹記對主機位元組序不要做任何假定,務必将其轉化為網絡位元組序再賦給socket。
           

3.3、listen()、connect()函數

        如果作為一個伺服器,在調用socket()、bind()之後就會調用listen()來監聽這個socket,如果用戶端這時調用connect()發出連接配接請求,伺服器端就會接收到這個請求。

int listen(int sockfd, int backlog);
int connect(int sockfd, const struct sockaddr *addr, socklen_t addrlen);
           

        listen函數的第一個參數即為要監聽的socket描述字,第二個參數為相應socket可以排隊的最大連接配接個數。socket()函數建立的socket預設是一個主動類型的,listen函數将socket變為被動類型的,等待客戶的連接配接請求。

        connect函數的第一個參數即為用戶端的socket描述字,第二參數為伺服器的socket位址,第三個參數為socket位址的長度。用戶端通過調用connect函數來建立與TCP伺服器的連接配接。

3.4、accept()函數

        TCP伺服器端依次調用socket()、bind()、listen()之後,就會監聽指定的socket位址了。TCP用戶端依次調用socket()、connect()之後就想TCP伺服器發送了一個連接配接請求。TCP伺服器監聽到這個請求之後,就會調用accept()函數取接收請求,這樣連接配接就建立好了。之後就可以開始網絡I/O操作了,即類同于普通檔案的讀寫I/O操作。

int accept(int sockfd, struct sockaddr *addr, socklen_t *addrlen);
           

        accept函數的第一個參數為伺服器的socket描述字,第二個參數為指向struct sockaddr *的指針,用于傳回用戶端的協定位址,第三個參數為協定位址的長度。如果accpet成功,那麼其傳回值是由核心自動生成的一個全新的描述字,代表與傳回客戶的TCP連接配接。

        注意:accept的第一個參數為伺服器的socket描述字,是伺服器開始調用socket()函數生成的,稱為監聽socket描述字;而accept函數傳回的是已連接配接的socket描述字。一個伺服器通常通常僅僅隻建立一個監聽socket描述字,它在該伺服器的生命周期内一直存在。核心為每個由伺服器程序接受的客戶連接配接建立了一個已連接配接socket描述字,當伺服器完成了對某個客戶的服務,相應的已連接配接socket描述字就被關閉。

3.5、read()、write()等函數

        萬事具備隻欠東風,至此伺服器與客戶已經建立好連接配接了。可以調用網絡I/O進行讀寫操作了,即實作了網咯中不同程序之間的通信!網絡I/O操作有下面幾組:

read()/write()
recv()/send()
readv()/writev()
recvmsg()/sendmsg()
recvfrom()/sendto()
           

        我推薦使用recvmsg()/sendmsg()函數,這兩個函數是最通用的I/O函數,實際上可以把上面的其它函數都替換成這兩個函數。它們的聲明如下:

#include <unistd.h>

ssize_t read(int fd, void *buf, size_t count);

ssize_t write(int fd, const void *buf, size_t count);

#include <sys/types.h>
#include <sys/socket.h>

ssize_t send(int sockfd, const void *buf, size_t len, int flags);

ssize_t recv(int sockfd, void *buf, size_t len, int flags);

   ssize_t sendto(int sockfd, const void *buf, size_t len, int flags, const struct sockaddr *dest_addr, socklen_t addrlen);

   ssize_t recvfrom(int sockfd, void *buf, size_t len, int flags, struct sockaddr *src_addr, socklen_t *addrlen);

   ssize_t recvmsg(int sockfd, struct msghdr *msg, int flags);
           

        read函數是負責從fd中讀取内容.當讀成功時,read傳回實際所讀的位元組數,如果傳回的值是0表示已經讀到檔案的結束了,小于0表示出現了錯誤。如果錯誤為EINTR說明讀是由中斷引起的,如果是ECONNREST表示網絡連接配接出了問題。

        write函數将buf中的nbytes位元組内容寫入檔案描述符fd.成功時傳回寫的位元組數。失敗時傳回-1,并設定errno變量。 在網絡程式中,當我們向套接字檔案描述符寫時有倆種可能。1)write的傳回值大于0,表示寫了部分或者是全部的資料。2)傳回的值小于0,此時出現了錯誤。我們要根據錯誤類型來處理。如果錯誤為EINTR表示在寫的時候出現了中斷錯誤。如果為EPIPE表示網絡連接配接出現了問題(對方已經關閉了連接配接)。

        其它的我就不一一介紹這幾對I/O函數了,具體參見man文檔或者baidu、Google,下面的例子中将使用到send/recv。

3.6、close()函數

        在伺服器與用戶端建立連接配接之後,會進行一些讀寫操作,完成了讀寫操作就要關閉相應的socket描述字,好比操作完打開的檔案要調用fclose關閉打開的檔案。

#include <unistd.h>
int close(int fd);
           

        close一個TCP socket的預設行為時把該socket标記為以關閉,然後立即傳回到調用程序。該描述字不能再由調用程序使用,也就是說不能再作為read或write的第一個參數。

        注意:close操作隻是使相應socket描述字的引用計數-1,隻有當引用計數為0的時候,才會觸發TCP用戶端向伺服器發送終止連接配接請求。

4、socket中TCP的三次握手建立連接配接詳解

        我們知道tcp建立連接配接要進行“三次握手”,即交換三個分組。大緻流程如下:

用戶端向伺服器發送一個SYN J
伺服器向用戶端響應一個SYN K,并對SYN J進行确認ACK J+1
用戶端再想伺服器發一個确認ACK K+1
           

        隻有就完了三次握手,但是這個三次握手發生在socket的那幾個函數中呢?請看下圖:

socket網絡程式設計基礎小記

        從圖中可以看出,當用戶端調用connect時,觸發了連接配接請求,向伺服器發送了SYN J包,這時connect進入阻塞狀态;伺服器監聽到連接配接請求,即收到SYN J包,調用accept函數接收請求向用戶端發送SYN K ,ACK J+1,這時accept進入阻塞狀态;用戶端收到伺服器的SYN K ,ACK J+1之後,這時connect傳回,并對SYN K進行确認;伺服器收到ACK K+1時,accept傳回,至此三次握手完畢,連接配接建立。

總結:用戶端的connect在三次握手的第二個次傳回,而伺服器端的accept在三次握手的第三次傳回。
           

5、socket中TCP的四次握手釋放連接配接詳解

        上面介紹了socket中TCP的三次握手建立過程,及其涉及的socket函數。現在我們介紹socket中的四次握手釋放連接配接的過程,請看下圖:

socket網絡程式設計基礎小記

        圖示過程如下:

  • 某個應用程序首先調用close主動關閉連接配接,這時TCP發送一個FIN M;
  • 另一端接收到FIN M之後,執行被動關閉,對這個FIN進行确認。它的接收也作為檔案結束符傳遞給應用程序,因為FIN的接收意味着應用程序在相應的連接配接上再也接收不到額外資料;
  • 一段時間之後,接收到檔案結束符的應用程序調用close關閉它的socket。這導緻它的TCP也發送一個FIN N;
  • 接收到這個FIN的源發送端TCP對它進行确認。

        這樣每個方向上都有一個FIN和ACK。

6、一個例子(實踐一下)

        說了這麼多了,動手實踐一下。下面編寫一個簡單的伺服器、用戶端(使用TCP)——伺服器端一直監聽本機的6666号端口,如果收到連接配接請求,将接收請求并接收用戶端發來的消息;用戶端與伺服器端建立連接配接并發送一條消息。

        伺服器端代碼:

#include<stdio.h>
#include<stdlib.h>
#include<string.h>
#include<errno.h>
#include<sys/types.h>
#include<sys/socket.h>
#include<netinet/in.h>

#define MAXLINE 4096

int main(int argc, char** argv)
{
    int    listenfd, connfd;
    struct sockaddr_in     servaddr;
    char    buff[];
    int     n;

    if( (listenfd = socket(AF_INET, SOCK_STREAM, )) == - ){
    printf("create socket error: %s(errno: %d)\n",strerror(errno),errno);
    exit();
    }

    memset(&servaddr, , sizeof(servaddr));
    servaddr.sin_family = AF_INET;
    servaddr.sin_addr.s_addr = htonl(INADDR_ANY);
    servaddr.sin_port = htons();

    if( bind(listenfd, (struct sockaddr*)&servaddr, sizeof(servaddr)) == -){
    printf("bind socket error: %s(errno: %d)\n",strerror(errno),errno);
    exit();
    }

    if( listen(listenfd, ) == -){
    printf("listen socket error: %s(errno: %d)\n",strerror(errno),errno);
    exit();
    }

    printf("======waiting for client's request======\n");
    while(){
    if( (connfd = accept(listenfd, (struct sockaddr*)NULL, NULL)) == -){
        printf("accept socket error: %s(errno: %d)",strerror(errno),errno);
        continue;
    }
    n = recv(connfd, buff, MAXLINE, );
    buff[n] = '\0';
    printf("recv msg from client: %s\n", buff);
    close(connfd);
    }

    close(listenfd);
}
           

        用戶端代碼:

#include<stdio.h>
#include<stdlib.h>
#include<string.h>
#include<errno.h>
#include<sys/types.h>
#include<sys/socket.h>
#include<netinet/in.h>

#define MAXLINE 4096

int main(int argc, char** argv)
{
    int    sockfd, n;
    char    recvline[], sendline[];
    struct sockaddr_in    servaddr;

    if( argc != ){
    printf("usage: ./client <ipaddress>\n");
    exit();
    }

    if( (sockfd = socket(AF_INET, SOCK_STREAM, )) < ){
    printf("create socket error: %s(errno: %d)\n", strerror(errno),errno);
    exit();
    }

    memset(&servaddr, , sizeof(servaddr));
    servaddr.sin_family = AF_INET;
    servaddr.sin_port = htons();
    if( inet_pton(AF_INET, argv[], &servaddr.sin_addr) <= ){
    printf("inet_pton error for %s\n",argv[]);
    exit();
    }

    if( connect(sockfd, (struct sockaddr*)&servaddr, sizeof(servaddr)) < ){
    printf("connect error: %s(errno: %d)\n",strerror(errno),errno);
    exit();
    }

    printf("send msg to server: \n");
    fgets(sendline, , stdin);
    if( send(sockfd, sendline, strlen(sendline), ) < )
    {
    printf("send msg error: %s(errno: %d)\n", strerror(errno), errno);
    exit();
    }

    close(sockfd);
    exit();
}
           

        當然上面的代碼很簡單,也有很多缺點,這就隻是簡單的示範socket的基本函數使用。其實不管有多複雜的網絡程式,都使用的這些基本函數。上面的伺服器使用的是疊代模式的,即隻有處理完一個用戶端請求才會去處理下一個用戶端的請求,這樣的伺服器處理能力是很弱的,現實中的伺服器都需要有并發處理能力!為了需要并發處理,伺服器需要fork()一個新的程序或者線程去處理請求等。

7、動動手

        留下一個問題,歡迎大家回帖回答!!!是否熟悉Linux下網絡程式設計?如熟悉,編寫如下程式完成如下功能:

        伺服器端:

        接收位址192.168.100.2的用戶端資訊,如資訊為“Client Query”,則列印“Receive Query”

        用戶端:

        向位址192.168.100.168的伺服器端順序發送資訊“Client Query test”,“Cleint Query”,“Client Query Quit”,然後退出。

        題目中出現的ip位址可以根據實際情況定。

                                                      ——本文隻是介紹了簡單的socket程式設計。

    更為複雜的需要自己繼續深入。

    (unix domain socket)使用udp發送>=128K的消息會報ENOBUFS的錯誤(一個實際socket程式設計中遇到的問題,希望對你有幫助)

作者:吳秦

出處:http://www.cnblogs.com/skynet/

本文基于署名 2.5 中國大陸許可協定釋出,歡迎轉載,演繹或用于商業目的,但是必須保留本文的署名吳秦(包含連結).

http://www.cnblogs.com/skynet/archive/2010/12/12/1903949.html

繼續閱讀