從MySQL源碼看其網絡IO模型

前言

MySQL是當今最流行的開源資料庫，閱讀其源碼是一件大有裨益的事情(雖然其代碼感覺比較淩亂)。而筆者閱讀一個Server源碼的習慣就是先從其網絡IO模型看起。于是，便有了本篇部落格。

MySQL啟動Socket監聽

看源碼，首先就需要找到其入口點，mysqld的入口點為mysqld_main,跳過了各種配置檔案的加載

之後，我們來到了network_init初始化網絡環節,如下圖所示:

下面是其調用棧:

mysqld_main (MySQL Server Entry Point)
    |-network_init (初始化網絡)
        /* 建立tcp套接字 */
        |-create_socket (AF_INET)
        |-mysql_socket_bind (AF_INET)
        |-mysql_socket_listen (AF_INET)
        /* 建立UNIX套接字*/
        |-mysql_socket_socket (AF_UNIX)
        |-mysql_socket_bind (AF_UNIX)
        |-mysql_socket_listen (AF_UNIX)

值得注意的是，在tcp socket的初始化過程中，考慮到了ipv4/v6的兩種情況:

// 首先建立ipv4連接配接
ip_sock= create_socket(ai, AF_INET, &a);
// 如果無法建立ipv4連接配接，則嘗試建立ipv6連接配接
if(mysql_socket_getfd(ip_sock) == INVALID_SOCKET)
     ip_sock= create_socket(ai, AF_INET6, &a);

如果我們以很快的速度stop/start mysql,會出現上一個mysql的listen port沒有被release導緻無法目前mysql的socket無法bind的情況，在此種情況下mysql會循環等待，其每次等待時間為目前重試次數retry * retry/3 +1秒,一直到設定的--port-open-timeout(預設為0)為止,如下圖所示:

MySQL建立連接配接處理循環

通過handle_connections_sockets處理MySQL的建立連接配接循環,根據作業系統的配置通過poll/select處理循環(非epoll,這樣可移植性較高，且mysql瓶頸不在網絡上)。

MySQL通過線程池的模式處理連接配接(一個連接配接對應一個線程，連接配接關閉後将線程歸還到池中),如下圖所示:

對應的調用棧如下所示:

handle_connections_sockets
    |->poll/select
    |->new_sock=mysql_socket_accept(...sock...) /*從listen socket中擷取新連接配接*/
    |->new THD 連接配接線程上下文 /* 如果擷取不到足夠記憶體，則shutdown new_sock*/
    |->mysql_socket_getfd(sock) 從socket中擷取
        /** 設定為NONBLOCK和環境有關 **/
    |->fcntl(mysql_socket_getfd(sock), F_SETFL, flags | O_NONBLOCK);
    |->mysql_socket_vio_new
        |->vio_init (VIO_TYPE_TCPIP)
            |->(vio->write = vio_write)
            /* 預設用的是vio_read */
            |->(vio->read=(flags & VIO_BUFFERED_READ) ?vio_read_buff :vio_read;)
            |->(vio->viokeepalive = vio_keepalive) /*tcp層面的keepalive*/
            |->.....
    |->mysql_net_init
        |->設定逾時時間，最大packet等參數
    |->create_new_thread(thd) /* 實際是從線程池拿，不夠再建立pthread線程 */
        |->最大連接配接數限制
        |->create_thread_to_handle_connection
            |->首先看下線程池是否有空閑線程
                |->mysql_cond_signal(&COND_thread_cache) /* 有則發送信号 */
            /** 這邊的hanlde_one_connection是mysql連接配接的主要處理函數 */
            |->mysql_thread_create(...handle_one_connection...)

MySQL的VIO

如上圖代碼中，每建立一個連接配接，都随之建立一個vio(mysql_socket_vio_new->vio_init),在vio_init的過程中，初始化了一堆回掉函數,如下圖所示:

我們關注點在vio_read和vio_write上,如上面代碼所示，在筆者所處機器的環境下将MySQL連接配接的socket設定成了非阻塞模式(O_NONBLOCK)模式。是以在vio的代碼裡面采用了nonblock代碼的編寫模式,如下面源碼所示:

vio_read

size_t vio_read(Vio *vio, uchar *buf, size_t size)
{
  while ((ret= mysql_socket_recv(vio->mysql_socket, (SOCKBUF_T *)buf, size, flags)) == -1)
  {
    ......
    // 如果上面擷取的資料為空，則通過select的方式去擷取讀取事件，并設定逾時timeout時間
    if ((ret= vio_socket_io_wait(vio, VIO_IO_EVENT_READ)))
        break;
  }
}

即通過while循環去讀取socket中的資料，如果讀取為空，則通過vio_socket_io_wait去等待(借助于select的逾時機制),其源碼如下所示:

vio_socket_io_wait
    |->vio_io_wait
        |-> (ret= select(fd + 1, &readfds, &writefds, &exceptfds, 
              (timeout >= 0) ? &tm : NULL))

筆者在jdk源碼中看到java的connection time out也是通過這,select(...wait_time)的方式去實作連接配接逾時的。

由上述源碼可以看出,這個mysql的read_timeout是針對每次socket recv(而不是整個packet的)，是以可能出現超過read_timeout MySQL仍舊不會報錯的情況，如下圖所示:

vio_write

vio_write實作模式和vio_read一緻，也是通過select來實作逾時時間的判定,如下面源碼所示:

size_t vio_write(Vio *vio, const uchar* buf, size_t size)
{
  while ((ret= mysql_socket_send(vio->mysql_socket, (SOCKBUF_T *)buf, size, flags)) == -1)
  {
    int error= socket_errno;

    /* The operation would block? */
    // 處理EAGAIN和EWOULDBLOCK傳回，NON_BLOCK模式都必須處理
    if (error != SOCKET_EAGAIN && error != SOCKET_EWOULDBLOCK)
      break;

    /* Wait for the output buffer to become writable.*/
    if ((ret= vio_socket_io_wait(vio, VIO_IO_EVENT_WRITE)))
      break;
  }
}

MySQL的連接配接處理線程

從上面的代碼:

mysql_thread_create(...handle_one_connection...)

可以發現，MySQL每個線程的處理函數為handle_one_connection,其過程如下圖所示:

代碼如下所示:

for(;;){
    // 這邊做了連接配接的handshake和auth的工作
    rc= thd_prepare_connection(thd);
    // 和通常的線程處理一樣，一個無限循環擷取連接配接請求
    while(thd_is_connection_alive(thd))
    {
        if(do_command(thd))
            break;
    }
    // 出循環之後，連接配接已經被clientdu端關閉或者出現異常
    // 這邊做了連接配接的銷毀動作
    end_connection(thd);
end_thread:
    ...
    // 這邊調用end_thread做清理動作，并将目前線程返還給線程池重用
    // end_thread對應為one_thread_per_connection_end
    if (MYSQL_CALLBACK_ELSE(thread_scheduler, end_thread, (thd, 1), 0))
        return;    
    ...
    // 這邊current_thd是個宏定義，其實是current_thd();
    // 主要是從線程上下文中擷取新塞進去的thd
    // my_pthread_getspecific_ptr(THD*,THR_THD);
    thd= current_thd;
    ...
}

mysql的每個woker線程通過無限循環去處理請求。

線程的歸還過程

MySQL通過調用one_thread_per_connection_end(即上面的end_thread)去歸還連接配接。

MYSQL_CALLBACK_ELSE(...end_thread)
    one_thread_per_connection_end
        |->thd->release_resources()
        |->......
        |->block_until_new_connection

線程在新連接配接尚未到來之前，等待在信号量上(下面代碼是C/C++ mutex condition的标準使用模式):

static bool block_until_new_connection()
{    
    mysql_mutex_lock(&LOCK_thread_count);
    ......
    while (!abort_loop && !wake_pthread && !kill_blocked_pthreads_flag)
      mysql_cond_wait(&x1, &LOCK_thread_count);
   ......
   // 從等待清單中擷取需要處理的THD
   thd= waiting_thd_list->front();
   waiting_thd_list->pop_front();
   ......
   // 将thd放入到目前線程上下文中
   // my_pthread_setspecific_ptr(THR_THD,  this)    
   thd->store_globals();
   ......
   mysql_mutex_unlock(&LOCK_thread_count);
   .....
}

整個過程如下圖所示:

由于MySQL的調用棧比較深，是以将thd放入線程上下文中能夠有效的在調用棧中減少傳遞參數的數量。

總結

MySQL的網絡IO模型采用了經典的線程池技術，雖然性能上不及reactor模型，但好在其瓶頸并不在網絡IO上，采用這種方法無疑可以節省大量的精力去專注于處理sql等其它方面的優化。

從MySQL源碼看其網絡IO模型從MySQL源碼看其網絡IO模型總結

從MySQL源碼看其網絡IO模型

前言

MySQL啟動Socket監聽

MySQL建立連接配接處理循環

MySQL的VIO

vio_read

vio_write

MySQL的連接配接處理線程

線程的歸還過程

總結

繼續閱讀

spark/scala關于【資源檔案】加載方法概述外部檔案加載方案測試資源檔案打包入jar包中小結

NOSQL安全攻擊

mybatis_入門程式Mybatis入門

mysql使用source指令導入.sql檔案

線性表之順序表的實作

AOP程式設計_Android優雅權限架構(1)概念基礎，2021金三銀四前言正文大綱正文

登入plsql 報錯 the account is locked --使用者被鎖

sqlServer根據經緯查距離

Effective Java 8:通用程式設計

C++判斷素數、求最大公約數代碼判斷一個數是否為素數求兩個數的最大公約數

SequoiaDB巨杉資料庫C++驅動概述

OOM三種類型

工廠模式-三種類型

【遞歸】高效率求2的n次幂

win10本地scala和spark安裝安裝scala安裝spark

scala (3) Function 和 Method