天天看點

Linux核心分析 - 網絡[六]:網橋

        看完了路由表,重新回到netif_receive_skb ()函數,在送出給上層協定處理前,會執行下面一句,這就是網橋的相關操作,也是這篇要講解的内容。

skb = handle_bridge(skb, &pt_prev, &ret, orig_dev);
           

        網橋可以簡單了解為交換機,以下圖為例,一台linux機器可以看作網橋和路由的結合,網橋将實體上的兩個區域網路LAN1、LAN2當作一個區域網路處理,路由連接配接了兩個子網1.0和2.0。從eth0和eth1網卡收到的封包在Bridge子產品中會被處理成是由Bridge收到的,是以Bridge也相當于一個虛拟網卡。

Linux核心分析 - 網絡[六]:網橋

STP五種狀态

        DISABLED

        BLOCKING

        LISTENING

        LEARNING

        FORWARDING

建立新的網橋br_add_bridge [net\bridge\br_if.c]

當使用SIOCBRADDBR調用ioctl時,會建立新的網橋br_add_bridge。

        首先是建立新的網橋:

dev = new_bridge_dev(net, name);
           

        然後設定dev->dev.type為br_type,而br_type是個全局變量,隻初始化了一個名字變量

SET_NETDEV_DEVTYPE(dev, &br_type);
static struct device_type br_type = {
 .name = "bridge",
};
           

        然後注冊新建立的裝置dev,網橋就相當一個虛拟網卡裝置,注冊過的裝置用ifconfig就可檢視到:

ret = register_netdevice(dev);
           

        最後在sysfs檔案系統中也建立相應項,便于檢視和管理:

ret = br_sysfs_addbr(dev);
           

将端口加入網橋br_add_if() [net\bridge\br_if.c]

當使用SIOCBRADDIF調用ioctl時,會向網卡加入新的端口br_add_if。

        建立新的net_bridge_port p,會從br->port_list中配置設定一個未用的port_no,p->br會指向br,p->state設為BR_STATE_DISABLED。這裡的p實際代表的就是網卡裝置。

p = new_nbp(br, dev);
           

        将新建立的p加入CAM表中,CAM表是用來記錄mac位址與實體端口的對應關系;而剛剛建立了p,是以也要加入CAM表中,并且該表項應是local的[關系如下圖],可以看到,CAM表在實作中作為net_bridge的hash表,以addr作為hash值,鍊入net_bridge_fdb_entry,再由它的dst指向net_bridge_port。

err = br_fdb_insert(br, p, dev->dev_addr); 
           
Linux核心分析 - 網絡[六]:網橋

        裝置的br_port指向p。這裡要明白的是,net_bridge可以看作全局量,是網橋,而net_bridge_port則是與網卡相對應的端口,是以每個裝置dev有個指針br_port指向該端口。

rcu_assign_pointer(dev->br_port, p);
           

        将新建立的net_bridge_port加入br的連結清單port_list中,在建立新的net_bridge_port時,會配置設定一個未用的port_no,而這個port_no就是根據br->port_list中的已經添加的net_bridge_port來找到未用的port_no的[具體如下圖]。 

list_add_rcu(&p->list, &br->port_list);
           
Linux核心分析 - 網絡[六]:網橋

        重新計算網橋的ID,這裡根據br->port_list連結清單中的net_bridge_port的最小的addr來作為網橋的ID。

br_stp_recalculate_bridge_id(br);
           

        網卡裝置的删除br_del_bridge()與端口的移除add_del_if()與添加差不多,不再詳述。

熟悉了網橋的建立與添加,再來看下網橋是如何工作的。

        當收到資料包,通過netif_receive_skb()->handle_bridge()處理網橋:

static inline struct sk_buff *handle_bridge(struct sk_buff *skb,
         struct packet_type **pt_prev, int *ret,
         struct net_device *orig_dev)
{
 struct net_bridge_port *port;

 if (skb->pkt_type == PACKET_LOOPBACK ||
     (port = rcu_dereference(skb->dev->br_port)) == NULL)
  return skb;

 if (*pt_prev) {
  *ret = deliver_skb(skb, *pt_prev, orig_dev);
  *pt_prev = NULL;
 }

 return br_handle_frame_hook(port, skb);
}
           

        1. 如果封包來自lo裝置,或者dev->br_port為空(skb->dev是收到封包的網卡裝置,而在向網橋添加端口時,dev->br_port被賦予了建立的與網卡相對應的端口p),此時不需要網橋處理,直接傳回封包;

        2. 如果封包比對了之前的ptype_all中的協定,則pt_prev不為空,此時要先進行ptype_all中協定的處理,再進行網橋的處理;

        3. br_handle_frame_hook是網橋處理鈎子函數,在br_init() [net\bridge\br.c]中

             br_handle_frame_hook = br_handle_frame;

             br_handle_frame() [net\bridge\br_input.c]是真正的網橋處理函數,

        下面進入br_handle_frame()開始網橋部分的處理:

        與前面802.1q講的一樣,首先檢查users來決定是否複制封包:

skb = skb_share_check(skb, GFP_ATOMIC);
           

        如果封包的目的位址是01:80:c2:00:00:0X,則是發往STP的多點傳播位址,此時調用br_handle_local_finish()來完成封包的進一步處理:

if (unlikely(is_link_local(dest))){
……
if (NF_HOOK(PF_BRIDGE, NF_BR_LOCAL_IN, skb, skb->dev,
   NULL, br_handle_local_finish))
  return NULL; /* frame consumed by filter */
 else
  return skb;
}
           

        而br_handle_local_finish()所做的内容很簡單,因為是多點傳播封包,主機要做的僅僅是更新封包的源mac與接收端口的關系(在CAM表中)。

static int br_handle_local_finish(struct sk_buff *skb)
{
 struct net_bridge_port *p = rcu_dereference(skb->dev->br_port);

 if (p)
  br_fdb_update(p->br, p, eth_hdr(skb)->h_source);
 return 0;  /* process further */
}
           

        接着br_handle_frame()繼續往下看,然後根據端口的狀态來處理封包,如果端口state= BR_STATE_FORWARDING且設定了br_should_route_hook,則轉發後傳回skb;否則繼續往下執行state=BR_STATE_LEARNING段的代碼:

rhook = rcu_dereference(br_should_route_hook);
if (rhook != NULL) {
 if (rhook(skb))
  return skb;
 dest = eth_hdr(skb)->h_dest;
}
           

        如果端口state= BR_STATE_LEARNING,如果是發往本機的封包,則設定pkt_type為PACKET_HOST,然後執行br_handle_frame_finish來完成封包的進一步處理。要注意的是,這裡将封包發往本機的封包設為PACKET_HOST,實作了經過網橋處理後,再次進入netif_receive_skb()時,不會再被網橋處理(結果進入網橋的條件了解):

if (!compare_ether_addr(p->br->dev->dev_addr, dest))
  skb->pkt_type = PACKET_HOST;
NF_HOOK(PF_BRIDGE, NF_BR_PRE_ROUTING, skb, skb->dev, NULL,
  br_handle_frame_finish);
           

        除此之外,端口處于不可用狀态,此時丢棄掉封包:

kfree_skb(skb);
           

        下面來詳細看下br_handle_frame_finish()函數。

        首先還是會根據收到封包的源mac和端口更新CAM表,這是交換機差別于hub的重要特征:

br_fdb_update(br, p, eth_hdr(skb)->h_source);
           

        然後如果端口處于LEARNING狀态,則隻是學習到CAM表中,而不對封包作任何處理,是以丢棄掉封包:

if (p->state == BR_STATE_LEARNING)
  goto drop;
           

        否則端口已處于FORWARDING狀态,此時分情況:

            1. 如果封包是多點傳播的,則br_flood_forward(br, skb, skb2);

            2. 如果封包是單點傳播的,但不在網橋的CAM表中,則br_flood_forward(br, skb, skb2);

            3. 如果封包是單點傳播的,在網橋的CAM表中,但不是發往本機,則br_forward(dst->dst, skb, skb2);

            4. 如果封包是單點傳播的,在網橋的CAM表中,且是發往本機,則br_pass_frame_upbr_pass_frame_up(skb2);

        br_handle_frame_finish()處理完後,順着最後一種情況繼續往下走,br_pass_frame_up()。

        該函數比較簡單,我們知道,在底層封包的向上傳遞就是通過裝置的更換來進行的(參考802.1q),這裡将skb的裝置換成網橋裝置,使上層協定不知道封包來自網卡,而是認為封包來自于網橋;然後調用netif_receive_skb()再次進入接收棧:

skb->dev = brdev;
return NF_HOOK(PF_BRIDGE, NF_BR_LOCAL_IN, skb, indev, NULL,
         netif_receive_skb);
           

        經過網橋處理後,再次進入netif_receive_skb()->handle_bridge(),此時skb->dev已經不是網卡裝置了,而是網橋裝置,注意到在向網橋添加端口時,是相應網卡dev->br_port指派為建立的端口,網橋裝置是沒有的,是以其br_port為空,在這一句會直接傳回,進入正常的協定棧流程:

if (skb->pkt_type == PACKET_LOOPBACK ||
     (port = rcu_dereference(skb->dev->br_port)) == NULL)
  return skb;
           

        當發送資料封包時,會調用br_dev_xmit()[net\bridge\br_device.c],大緻會根據目的位址調用br_multicast_deliver()或br_flood_deliver()或br_deliver(),在其過程中會将skb->dev由原來的網橋裝置brdev換面網卡裝置dev,然後通過網卡變更向下傳遞封包;

        核心協定棧中,發送與接收是分離的,接收像是封包脫殼的過程,發送則是函數的嵌套調用。有關發送的流程,稍後專門詳述。

繼續閱讀