天天看點

實驗:NAPI模式資料包接收核心思想核心态核心代碼使用者态代碼實作實驗結果

和實驗: 非NAPI模式資料包接收類似,這篇筆記使用vcard虛拟網卡來示範NAPI模式如何和協定棧配合完成資料包的接收,以便加深對這種接收模式的了解。

核心思想

  1. vcard虛拟網卡使用NAPI模式和協定棧配合完成資料包接收;
  2. 使用者态使用AF_PACKET套接字程式設計接收來自vcard虛拟網卡的資料;

核心态核心代碼

網絡裝置的定義需要包含struct napi_struct,是以不能再是簡單的struct net_device了,定義如下:

// 網卡裝置,NAPI模式必須提供一個napi_struct
struct vcard_net_device {
    struct net_device *dev;
    struct napi_struct napi;
};
struct vcard_net_device *vcard_dev = NULL;
           

在網絡裝置注冊過程中,對napi結構進行初始化:

static int install_net_device(void)
{
    int ret;
    struct net_device *dev;

    // 配置設定網卡對象
    dev = alloc_netdev(sizeof(struct vcard_net_device), DEV_NAME, vcard_setup);
    if (!dev) {
        printk(TAG "alloc_netdev failed\n");
        return -ENOMEM;
    }
    vcard_dev = netdev_priv(dev);
    vcard_dev->dev = dev;
	// 調用系統api對napi進行初始化,這裡指定poll()回調為vcard_poll(),配額為5個資料包
    netif_napi_add(dev, &vcard_dev->napi, vcard_poll, 5);

    // 将網卡注冊到系統中
    ret = register_netdev(dev);
    if (ret) {
        printk(TAG "register_netdev failed\n");
        goto free;
    }
    return 0;
free:
    free_netdev(dev);
    vcard_dev = NULL;
    return ret;
}

/**
 *	netif_napi_add - initialize a napi context
 *	@dev:  network device
 *	@napi: napi context
 *	@poll: polling function
 *	@weight: default weight
 *
 * netif_napi_add() must be used to initialize a napi context prior to calling
 * *any* of the other napi related functions.
 */
static inline void netif_napi_add(struct net_device *dev, struct napi_struct *napi,
	int (*poll)(struct napi_struct *, int), int weight)
{
	INIT_LIST_HEAD(&napi->poll_list);
	napi->poll = poll;
	napi->weight = weight;
	// 這裡設定了已排程标記,會影響後面的軟終端激活過程
	set_bit(NAPI_STATE_SCHED, &napi->state);
}
           

初始化回調實作如下:

static int vcard_init(struct net_device *dev)
{
    struct vcard_net_device *vdev = netdev_priv(dev);
    // 因為在netif_napi_add()會設定NAPI_STATE_SCHED标記,
    // 是以這裡必須将該标記清除,否則napi_schedule_prep()
    // 會傳回false,将無法啟動接收軟中斷
    clear_bit(NAPI_STATE_SCHED, &vdev->napi.state);
    return 0;
}
           

和之前的實驗類似,我們使用一個定時器來激活軟中斷:

static void resume_napi(unsigned long data)
{
    // 由于是虛拟裝置,也不涉及關中斷(定時器自己隻啟動一次),
    // 直接嘗試激活軟中斷即可
    if (likely(napi_schedule_prep(&vcard_dev->napi))) {
        __napi_schedule(&vcard_dev->napi);
    }
}
           

vcard_poll()将會被net_rx_action()回調,在其中完成資料包的接收,實作如下:

int vcard_poll(struct napi_struct *napi, int budget)
{
    struct vcard_net_device *vdev = container_of(napi, struct vcard_net_device, napi);
    struct sk_buff *skb;
    int rcv = 0;

    while (rcv < budget && (skb = populate_pkt()) != NULL) {
        ++rcv;
        netif_receive_skb(skb);
    }
    // 如果資料已經全部接收完畢,那麼驅動需要負責将排程停止,
    // 這裡要特别注意,必須是小于,不能是小于等于,因為等于
    // 表示剛好接收了指定配額個資料包,這個傳回值對于NAPI接收
    // 架構是有特殊意義的
    if (rcv < budget)
        napi_complete(&vdev->napi);
    // 傳回實際讀取的資料包個數
    printk(TAG "vcard_poll ret=%d\n", rcv);
    return rcv;
}
           

使用者态代碼實作

// 根據網卡名字查詢到網絡裝置的索引
static int get_if_index(const char *name)
{
    struct if_nameindex *ifni = if_nameindex();
    int i;

    for (i = 0; (ifni[i].if_index != 0 || ifni[i].if_name != NULL); ++i) {
        if (!strcmp(ifni[i].if_name, name)) {
            break;
        }
    }
    if (ifni[i].if_index != 0 || ifni[i].if_name != NULL) {
        return ifni[i].if_index;
    }
    return 0;
}

int main(int argc, char *argv[])
{
    // RAW類型的IP封包
    int fd = socket(AF_PACKET, SOCK_RAW, htons(ETH_P_IP));
    if (fd < 0) {
        printf("socket fail\n");
        return -1;
    }

    int ifindex = get_if_index("vcard");
    if (ifindex <= 0) {
        printf("get_if_index fail\n");
        return -1;
    }

    // 綁定到指定的網絡裝置,這樣隻會接收到來自該資料的包
    struct sockaddr_ll addr = {
        .sll_family = AF_PACKET,
        .sll_protocol = htons(ETH_P_IP),
        .sll_ifindex = ifindex,
    };
    if (bind(fd, (struct sockaddr *)&addr, sizeof(addr)) != 0) {
        printf("bind fail\n");
        return -1;
    }

    char buf[20];
    while (1) {
        int ret = recv(fd, buf, 20, MSG_TRUNC);
        if (ret < 0) {
            printf("recv fail\n");
            return -1;
        } else if (ret == 0) {
            continue;
        } else {
            buf[ret] = 0;
            printf("%s\n", buf);
            if (strcmp(buf, "ZZZZZ") == 0) {
                break;
            }
        }
    }
    return 0;
}
           

實驗結果

核心驅動的輸出如下圖所示:

實驗:NAPI模式資料包接收核心思想核心态核心代碼使用者态代碼實作實驗結果

26個字母,每次接收5個,是以分六次,前5次都是收到5包(配額就是5)然後結束進行下一次輪詢,最後一次接收了1個資料包後,發現接收完畢,停止軟中斷排程。

使用者态輸出如下:

實驗:NAPI模式資料包接收核心思想核心态核心代碼使用者态代碼實作實驗結果

使用者态可以準确的輸出“AAAAA”~“ZZZZZ”的内容。

注意:

  1. 要先将vcard插入核心中;
  2. 執行"ip link set dev vcard up"打開裝置,否則使用者态無法bind到該裝置;
  3. 使用者态程式一定要以root權限執行;

完整的實驗代碼在這裡。

繼續閱讀