一、什麼是多路徑
普通的電腦主機都是一個硬碟挂接到一個總線上,這裡是一對一的關系。而到了有光纖組成的SAN環境,或者由iSCSI組成的IPSAN環境,由于主機和存儲通過了光纖交換機或者多塊網卡及IP來連接配接,這樣的話,就構成了多對多的關系。也就是說,主機到存儲可以有多條路徑可以選擇。主機到存儲之間的IO由多條路徑可以選擇。每個主機到所對應的存儲可以經過幾條不同的路徑,如果是同時使用的話,I/O流量如何配置設定?其中一條路徑壞掉了,如何處理?還有在作業系統的角度來看,每條路徑,作業系統會認為是一個實際存在的實體盤,但實際上隻是通向同一個實體盤的不同路徑而已,這樣是在使用的時候,就給使用者帶來了困惑。多路徑軟體就是為了解決上面的問題應運而生的。
多路徑的主要功能就是和儲存設備一起配合實作如下功能:
1.故障的切換和恢複
2.IO流量的負載均衡
3.磁盤的虛拟化
由于多路徑軟體是需要和存儲在一起配合使用的,不同的廠商基于不同的作業系統,都提供了不同的版本。并且有的廠商,軟體和硬體也不是一起賣的,如果要使用多路徑軟體的話,可能還需要向廠商購買license才行。比如EMC公司基于linux下的多路徑軟體,就需要單獨的購買license。好在, RedHat和Suse的2.6的核心中都自帶了免費的多路徑軟體包,并且可以免費使用,同時也是一個比較通用的包,可以支援大多數存儲廠商的裝置,即使是一些不是出名的廠商,通過對配置檔案進行稍作修改,也是可以支援并運作的很好的。
二、Linux下multipath介紹,需要以下工具包:
在Redhat 5中,檢視multipath是否安裝如下:
device-mapper-1.02.39-1.el5
device-mapper-multipath-0.4.7-34.el5
device-mapper-event-1.02.39-1.el5
1、device-mapper-multipath:即multipath-tools。主要提供multipathd和multipath等工具和 multipath.conf等配置檔案。這些工具通過device mapper的ioctr的接口建立和配置multipath裝置(調用device-mapper的使用者空間庫。建立的多路徑裝置會在/dev/mapper中)。
2、 device-mapper:主要包括兩大部分:核心部分和使用者部分。核心部分主要由device mapper核心(dm.ko)和一些target driver(md-multipath.ko)。核心完成裝置的映射,而target根據映射關系和自身特點具體處理從mappered device 下來的i/o。同時,在核心部分,提供了一個接口,使用者通過ioctr可和核心部分通信,以指導核心驅動的行為,比如如何建立mappered device,這些divece的屬性等。linux device mapper的使用者空間部分主要包括device-mapper這個包。其中包括dmsetup工具和一些幫助建立和配置mappered device的庫。這些庫主要抽象,封裝了與ioctr通信的接口,以便友善建立和配置mappered device。multipath-tool的程式中就需要調用這些庫。
3、dm-multipath.ko和dm.ko:dm.ko是device mapper驅動。它是實作multipath的基礎。dm-multipath其實是dm的一個target驅動。
4、scsi_id:包含在udev程式包中,可以在multipath.conf中配置該程式來擷取scsi裝置的序号。通過序号,便可以判斷多個路徑對應了同一裝置。這個是多路徑實作的關鍵。scsi_id是通過sg驅動,向裝置發送EVPD page80或page83 的inquery指令來查詢scsi裝置的辨別。但一些裝置并不支援EVPD 的inquery指令,是以他們無法被用來生成multipath裝置。但可以改寫scsi_id,為不能提供scsi裝置辨別的裝置虛拟一個辨別符,并輸出到标準輸出。multipath程式在建立multipath裝置時,會調用scsi_id,從其标準輸出中獲得該裝置的scsi id。在改寫時,需要修改scsi_id程式的傳回值為0。因為在multipath程式中,會檢查該直來确定scsi id是否已經成功得到。
三、multipath在Redhat 5 中的基本配置過程:
1、安裝和加載多路徑軟體包
# rpm -ivh device-mapper-1.02.39-1.el5.rpm #安裝映射包
# rpm -ivh device-mapper-multipath-0.4.7-34.el5.rpm #安裝多路徑包
# chkconfig –level 2345 multipathd on #設定成開機自啟動multipathd
# lsmod |grep dm_multipath #來檢查安裝是否正常
<a href="http://photo.blog.sina.com.cn/showpic.html#blogid=548668f10100obn9&url=http://s2.sinaimg.cn/orignal/71341ca6g984d56acbeb1" target="_blank"></a>
如果子產品沒有加載成功請使用下列命初始化DM,或重新開機系統
---Use the following commands to initialize and start DM for the first time:
# modprobe dm-multipath
# modprobe dm-round-robin
# service multipathd start
# multipath –v2
2、配置multipath:
Multipath的配置檔案是/etc/multipath.conf , 如需要multipath正常工作隻需要如下配置即可:(如果需要更加詳細的配置,請看本文後續的介紹)
# on the default devices.
blacklist {
devnode "^(ram|raw|loop|fd|md|dm-|sr|sr|scd|st)[0-9]*"
devnode "^hd[a-z]"
}
devices {
device {
vendor "EMC"
path_grouping_policy multibus
features "1 queue_if_no_path"
path_checker readsector()
failback immediate
3、multipath基本操作指令
mpathconf --enable --with_multipathd y 啟動守護程序
# /etc/init.d/multipathd start #開啟mulitipath服務
# multipath -F #删除現有沒有使用的路徑
# multipath -v2 #格式化路徑,檢測路徑,合并路徑
# multipath -ll #檢視多路徑狀态
<a href="http://photo.blog.sina.com.cn/showpic.html#blogid=548668f10100obn9&url=http://s7.sinaimg.cn/orignal/71341ca6g984d5a692fb6" target="_blank"></a>
如果配置正确的話就會在/dev/mapper/目錄下多出mpath0、mpath1等之類裝置。通常不一定顯示完全,需要重新開機系統。
<a href="http://photo.blog.sina.com.cn/showpic.html#blogid=548668f10100obn9&url=http://s3.sinaimg.cn/orignal/71341ca6g75a1560e1362" target="_blank"></a>
用fdisk -l指令可以看到多路徑軟體建立的磁盤,如下圖中的/dev/dm-[0-3]
#vxfs01 fdisk -l
255 heads, 63 sectors/track, 652 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes
Device Boot Start End Blocks Id System
[root@vxfs01 ~]#
4、multipath磁盤的基本操作
要對多路徑軟體生成的磁盤進行操作直接操作/dev/mapper/目錄下的磁盤就行.
在對多路徑軟體生成的磁盤進行分區之前最好運作一下pvcreate指令:
# pvcreate /dev/mapper/mpath0
# fdisk /dev/mapper/mpath0
<a href="http://photo.blog.sina.com.cn/showpic.html#blogid=548668f10100obn9&url=http://s4.sinaimg.cn/orignal/71341ca6g984d60f6fa63" target="_blank"></a>
用fdisk對多路徑軟體生成的磁盤進行分區儲存時會有一個報錯,此報錯不用理會。
fdisk對多路徑軟體生成的磁盤進行分區之後,所生成的磁盤分區并沒有馬上添加到/dev/目錄下,此時我們要重新開機IPSAN或者FCSAN的驅動,如果是用iscsi-initiator來連接配接IPSAN的重新開機ISCSI服務就可以發現所生成的磁盤分區了
# service iscsi restart
# ls -l /dev/mapper/
<a href="http://photo.blog.sina.com.cn/showpic.html#blogid=548668f10100obn9&url=http://s7.sinaimg.cn/orignal/71341ca6gdf305d41c8a6" target="_blank"></a>
如上圖中的mpath0p1和mpath1p1就是我們對multipath磁盤進行的分區
# mkfs.ext3 /dev/mapper/mpath0p1 #對mpath0p1分區格式化成ext3檔案系統
# mount /dev/mapper/mpath0p1 /ipsan/ #挂載mpath0p1分區
<a href="http://photo.blog.sina.com.cn/showpic.html#blogid=548668f10100obn9&url=http://s14.sinaimg.cn/orignal/71341ca6g984d6b22fd9d" target="_blank"></a>
# mkfs.ext3 /dev/mapper/mpath1p1 #對mpath1p1分區格式化成ext3檔案系統
# mount /dev/mapper/mpath1p1 /ipsan/ #挂載mpath1p1分區
2個都要格式化,2個路徑都挂在一個挂載點,可能是這樣!!!這個還需要弄清楚。。
四、multipath的進階配置
以上都是用multipath的預設配置來完成multipath的配置,比如映射裝置的名稱,multipath負載均衡的方法都是預設設定。那有沒有按照我們自己定義的方法來配置multipath呢,當可以。
1、multipath.conf檔案的配置
接下來的工作就是要編輯/etc/multipath.conf的配置檔案
multipath.conf主要包括blacklist、multipaths、devices三部份的配置
blacklist配置
devnode "^sda"
}
Multipaths部配置設定置multipaths和devices兩部份的配置。
multipaths {
multipath {
wwid **************** #此值multipath -v3可以看到
alias iscsi-dm0 #映射後的别名,可以随便取
path_grouping_policy multibus #路徑組政策
path_checker tur #決定路徑狀态的方法
path_selector "round-robin 0" #選擇那條路徑進行下一個IO操作的方法
}
}
Devices部配置設定置
device {
vendor "iSCSI-Enterprise" #廠商名稱
product "Virtual disk" #産品型号
path_grouping_policy multibus #預設的路徑組政策
getuid_callout "/sbin/scsi_id -g -u -s /block/%n" #獲得唯一裝置号使用的預設程式
prio_callout "/sbin/acs_prio_alua %d" #擷取有限級數值使用的預設程式
path_checker readsector0 #決定路徑狀态的方法
path_selector "round-robin 0" #選擇那條路徑進行下一個IO操作的方法
failback immediate #故障恢複的模式
no_path_retry queue #在disable queue之前系統嘗試使用失效路徑的次數的數值
rr_min_io 100 #在目前的使用者組中,在切換到另外一條路徑之前的IO請求的數目
如下是一個完整的配置檔案
defaults {
user_friendly_names no
wwid 14945540000000000a67854c6270b4359c66c272e2f356321
alias iscsi-dm0
path_grouping_policy multibus
path_checker tur
path_selector "round-robin 0"
wwid 14945540000000000dcca2eda91d70b81edbcfce2357f99ee
alias iscsi-dm1
wwid 1494554000000000020f763489c165561101813333957ed96
alias iscsi-dm2
wwid 14945540000000000919ca813020a195422ba3663e1f03cc3
alias iscsi-dm3
vendor "iSCSI-Enterprise"
product "Virtual disk"
path_grouping_policy multibus
getuid_callout "/sbin/scsi_id -g -u -s /block/%n"
path_checker readsector0
path_selector "round-robin 0"
擷取wwid的方法:
(1)預設情況下,将使用/var/lib/multipath/bindings 内的配置設定具體每個多路徑裝置名,如果在/etc/multipath.conf中有設定各wwid 别名,别名會覆寫此設定。
[root@vxfs01 ~]# cat /var/lib/multipath/bindings
# Multipath bindings, Version : 1.0
# NOTE: this file is automatically maintained by the multipath program.
# You should not need to edit this file in normal circumstances.
#
# Format:
# alias wwid
mpath0 36006016051d50e0035744871c912de11
mpath1 36006016051d50e0034744871c912de11
mpath2 36006016051d50e0032744871c912de11
mpath3 36006016051d50e0039744871c912de11
mpath4 36006016051d50e003a744871c912de11
(2)# multipath -v3指令查找
sdb: uid = 36006016051d50e003a744871c912de11 (callout)
sdc: uid = 36006016051d50e003a744871c912de11 (callout)
sdd: uid = 36006016051d50e003a744871c912de11 (callout)
sde: uid = 36006016051d50e003a744871c912de11 (callout)
36006016051d50e003a744871c912de11 1:0:0:0 sdb 8:16 0 [undef][ready] DGC,RAI
36006016051d50e003a744871c912de11 1:0:1:0 sdc 8:32 1 [undef][ready] DGC,RAI
36006016051d50e003a744871c912de11 2:0:0:0 sdd 8:48 1 [undef][ready] DGC,RAI
36006016051d50e003a744871c912de11 2:0:1:0 sde 8:64 0 [undef][ready] DGC,RAI
Found matching wwid [36006016051d50e003a744871c912de11] in bindings file.
Linux 下如何不重新開機伺服器掃描 FC 裝置的變化?
Linux 下的裝置管理功能做得不是很好,這方面 Unix 就很好,基本上在 OS 層面就能夠掃描裝置改動,不用重新開機伺服器。
相反,如果不重新開機伺服器,Linux OS 層面是不能夠偵測到裝置改動的,除非重新開機,或者安裝 HBA 廠商提供的工具才能不重新開機去偵測裝置變化。
#####
# 一個通用的方法
##############################
RHEL5 或者 SUSE10 使用如下腳本:
echo “- – -” > /sys/class/scsi_host/host0/scan # 看看有幾個 /sys/class/scsi_host/ 下面有幾個 host 就掃描幾次
RHEL4 或者 SUSE9 使用如下腳本:
echo 1 >> /sys/class/scsi_host/host0/issue_lip # 看看有幾個 /sys/class/scsi_host/ 下面有幾個 host 就執行幾次
echo “- – -“ >> /sys/class/scsi_host/host0/scan
2015-9-17
黑名單記得對應指定,最好别用通配符,要不然可能因為黑名單而給屏蔽
檢視伺服器HBA卡WWN号
cat /sys/class/fc_host/host*/port_name
本文轉自 天樂 51CTO部落格,原文連結:http://blog.51cto.com/tianlegg/1435904,如需轉載請自行聯系原作者