1、啟用客戶機作業系統和遠端控制台之間的複制和粘貼操作
解決方法:要在客戶機作業系統和遠端控制台之間進行複制和粘貼,必須使用 vSphere Client 啟用複制和粘貼操作。 步驟 a、使用 vSphere Client 登入到 vCenter Server 系統并選擇虛拟機。 b、在摘要頁籤中,單擊編輯設定。 c、選擇選項 > 進階 > 正常,然後單擊配置參數。 d、單擊添加行,并在“名稱”和“值”列中鍵入以下值。
名稱值 isolation.tools.copy.disable false isolation.tools.paste.disable false 注意這些選項将替代在客戶機作業系統的 VMware Tools 控制台中做出的任何設定。 e、單擊确定以關閉“配置參數”對話框,然後再次單擊确定以關閉“虛拟機屬性”對話框。 f、重新啟動虛拟機。 2、sco系統遷移過去之後找不到啟動清單 解決方法:目前解決方法:使用軟驅制作應急盤,通過應急盤來找到啟動清單,如果不行的話,隻能使用,現成的虛拟鏡像導入 vmware中,但是這種方法,要自己設定與自己相關的應用。 3、linux做遷移時手動添加的邏輯分區(LVM卷),遷移過去之後找不到這些分區 解決方法::給虛拟機額外添加硬碟後融合,然後将資料重新拷入加入的硬碟中。 4、安裝esxi的時候找不到萬兆網卡 解決方法:解決方法:安裝各個廠商 OEM的 esxi版本。 5、遷移時提示vss原卷不能克隆 解決方法:解決方法:檢視是否有額外的裝置插在伺服器上,如 usb裝置。 6、Windows遷移之後,配置網卡的時候,會提示“IP已經被配置設定給其他的擴充卡” 解決方法:打開指令行視窗(運作 cmd),輸入:
( 1)、 set DEVMGR_SHOW_NONPRESENT_DEVICES=1 ( 2)、 devmgmt.msc 在彈出的“裝置管理器”視窗。選擇“檢視( V)” —“顯示隐藏的裝置( W)”,然後展開“網絡擴充卡”子項,可以看到一些透明圖示顯示的網卡資訊,這些資訊是源伺服器的實體網卡資訊。然後選擇透明的裝置解除安裝, RAS同步擴充卡為系統正常裝置,不需要将其解除安裝。 7、Asianux3.0遷移之後不能顯示圖形化界面 解決方法:解決方法: cp /etc/X11/xorg.conf /etc/X11/xorg.conf.bak vi /etc/X11/xorg.conf 将 xorg.conf檔案中的 selection “Devices”字段中 Driver對應的值修改為“ vmware”即可,修改完成後通過 startx啟動圖形化界面。 8、遷移域控主機後發生當虛拟機開啟後,實體機就斷網 解決方法:單點傳播和多點傳播的問題 9、在VC中虛拟機的滑鼠全屏之後,不能控制整個螢幕 解決方法:當時安裝的是 esxi 4.1,将 esxi4.1更新到 esxi4.1upd01 ,同時要将 VC client也更新到對應的版本。 10、遷移過去的win2003的系統,隔段時間之後會藍屏或重新開機 解決方法:檢視系統日志,有可能是防毒軟體的原因,将防毒軟體解除安裝重裝。 11、使用FT功能需同時具備以下條件 解決方法: 1 所有 ESX必須為 4.0以上, Build版本相同,以及在同一個 HA Cluster中 2 伺服器的 CPU要求是同一系列 (并且要求是 AMD Barcelona+, Intel Penryn+的 CPU) 3 BIOS中要啟用 VT及禁用 Hyperthreading(超線程) ,最好同時禁用電源管理 4 每個 VM隻能配置設定 1顆 vCPU 5 要有專門的千兆網絡負責 FT 6 VM要放在共享存儲上 7 VM的配置檔案必須為版本 7 8 Guest OS不要啟用 Paravirtualized 9 啟用 FT的 VM不支援自動 DRS 10 啟用 FT的 VM不支援 Snapshot 11 啟用 FT的 VM不支援 MS Cluster 12 啟用 FT的 VM不支援實體 RDM Mapping 13 啟用 FT的 VM的虛拟 CD-ROM最好斷開 14 啟用 FT的 VM不支援 NPIV (N-Port ID Virtualization) 15 啟用 FT的 VM不支援 Device HotAdd/HotPlug 大型虛拟機可能會阻止使用容錯 如果虛拟機太大(大于 15GB)或記憶體的變化速率大于 VMotion 通過網絡進行複制的速率, 則啟用容錯或使用 VMotion 遷移正在運作的容錯虛拟機時可能會失敗。 12、如何确認克隆後的系統SID是否更新
解決方法: Windows2003/2008 、 windows 7可使用本地賬戶登入系統,輸入“ whoami /user”檢視 Windows xp沒有 whoami指令,可通過系統資料庫檢視 13、vSphere所需要開放的端口 解決方法: 80 vCenter Server需要端口80用于直接HTTP連接配接。端口80會将請求重定向到HTTPS端口 443。如果意外使用了http://server而不是https://server,此端口将非常有用。 389 此端口在vCenter Server的本地和所有遠端執行個體上必須處于打開狀态。這是vCenter Server組的目錄服務的LDAP端口号。vCenter Server系統需要綁定端口389,即使沒有将此 vCenter Server執行個體加入到 連結模式組。如果此端口上正在運作另一服務,則最好移除該服務,或将其端口更改為其他端口。可以在從1025到65535的任一端口上運作LDAP服務。如果此執行個體充當Microsoft Windows活動目錄,請将端口号從389 、更改為從 1025 到 65535 的任一可用端口。 443 vCenter Server系統用于偵聽來自vSphere Client的連接配接的預設端口。要使vCenter Server從vSphere Client接收資料,請在防火牆中打開443端口。vCenter Server系統還使用端口443偵聽從vSphere Web Access Client和其他SDK用戶端傳輸的資料。如果對HTTPS使用另一個端口号,則登入vCenter Server系統時必須使用<ip-address>:<port>。 636 對于vCenter連結模式,這是本地執行個體的 SSL端口。如果此端口上正在運作另一服務,則最好移除該服務,或将其端口更改為其他端口。可以在從1025到65535的任一端口上運作 SSL服務。 902 vCenter Server系統用于将資料發送到受管主機的預設端口。受管主機也會通過UDP端口902定期向vCenter Server系統發送檢測信号。伺服器和主機之間或各個主機之間的防火牆不得阻止此端口。 902/903 不得在vSphere Client和主機之間阻塞端口902和903。這些端口由vSphere Client 使用以顯示虛拟機控制台。 8080 Web服務HTTP。用于VMware VirtualCenter Management Webservices。 8443 Web服務HTTPS。用于VMware VirtualCenter Management Webservices。 60099 Web服務更改服務通知端口 如果希望vCenter Serve 系統使用不同的端口接收vSphere Client資料,請參見《VMware vSphere 資料中心管理指南 14、虛拟機檔案有哪些 解決方法: .vmx vmname.vmx 虛拟機配置檔案 .vmxf vmname.vmxf 其他虛拟機配置檔案 .vmdk vmname.vmdk 虛拟磁盤特性 -flat.vmdk vmname-flat.vmdk 預配置設定虛拟磁盤 .nvram vmname.nvram 或 nvram 虛拟機 BIOS .vmsd vmname.vmsd 虛拟機快照 .vmsn vmname.vmsn 虛拟機快照資料檔案 .vswp vmname.vswp 虛拟機交換檔案 .vmss vmname.vmss 虛拟機挂起檔案 .log vmware.log 目前虛拟機日志檔案 -#.log vmware-#.log(其中 # 表示從 1 開始的編号) 舊的虛拟機日志條目 15、如何更改vSphere Center的生成日志 解決方法: 修改“vpxd.cfg”檔案,然後添加如下内容: <directory>D:VMwareLogs</directory> 調整日志檔案的大小: <maxFileSize>10485760</maxFileSize> <maxFileNum>10</maxFileNum> 儲存之後,重新開機 vCenter Server之後,即可生效 16、windows遷移必須在遷移機上開啟的服務 解決方法: 需要注意 5個服務不能被禁用 1) windows installer 2) volume shadow 3) TCP/IP netBIOS 4) server 5) workstation 如果 Converter Standalone 連接配接遠端 Windows XP 計算機失敗,并發出 bad username/password 的錯誤消息, 請確定 Windows 防火牆沒有阻止檔案和列印機共享。步驟 1 選擇開始 > 設定 > 控制台 > 管理工具 > 本地安全政策。 2 在左側的安全設定清單中,選擇本地政策 > 安全選項。 VMware vCenter Converter Standalone 使用者指南 3 在右側的政策清單中,選擇網絡通路:本地帳戶的共享和安全模式。 4 確定選中經典 – 本地使用者以自己的身份驗證。 Windows Server 2008(確定啟用了 Computer Browser Windows Service) Windows XP(需要打開簡單檔案共享,啟用檔案和列印機共享 ) 17、Linux遷移注意事項 1)關閉防火牆( service etcinit.diptables stop) 2) SSH 必須打開 (sshd start) 3)遷移時需要在 help address時為虛拟機設定一個 IP位址 redflag 遷移之後沒有圖形化界面,通過 Xconfigurator來重新配置。 redhat 遷移之後沒有圖形化界面,通過 system-config-display來重新配置。 4)遷移後的系統不帶 IP,需要手動設定 5)資料庫或域需要關閉 6)建議冷遷 18、ESXi不能解析主機名 解決方法: 1) Login to ESXi host 2) vi /etc/hosts 3) Key in every ESXi host in Cluster as the following format IP Address ESXi hostname 192.168.10.10 esx01 192.168.10.11 esx02 … … 192.168.10.9 vCenter01 4) Repeat all the above editing in all ESXi hosts 5) Login in to vCenter 6) Edit /Windows/System32/drive/etc/hosts 19、SCO遷移後添加網卡不能使用 解決方法: 遷移完成之後,通過netconfig來把原來的網卡删除掉,(如果進入的是圖形界面,選tool-unix進入指令視窗)不要把上面的HW SCO TCP/IP Loopback driver 這個網卡删掉。 删除下面的那個網卡,删除完成之後,後提示你重新配置核心,然後重新啟動。選擇sco虛拟機—編譯–添加網卡。重新開機之後,通過netconfig來添加網卡,添加的是AMD PCNet-PCI Adapter Compatiable……的網卡,然後配置IP。 注意配置IP的時候那個broadcast address不要改,這個是廣播位址。網關不需要配置。 20、Linux下安裝VMware-tools出現“/etc/vmware-tools/locations”錯誤 故障内容: A previous installation of VMware software has been detected. The previous installation was made by the tar installer (version 3). Keeping the tar3 installer database format. Error: Unable to find the binary installation directory (answer BINDIR) in the installer database file “/etc/vmware-tools/locations”. 解決方法: 1、删除etc/vmware-tools目錄rm -rf vmware-tools 2. 删除/tmp/vm* rm -rf vm*(注意不要把 VMwa*的也删除) 3、然後用tar –zxvf解壓 21、所有的虛拟機開啟或VMotion出現“檔案<unspecified filename>被鎖定,無法通路” 故障内容:環境的所有VM運作出現異常緩慢,關機後的虛拟機開機或VMotion出現“檔案<unspecified filename>被鎖定,無法通路” 解決方法:檢查日志,特别是存儲上LUN的占用情況,如果有存儲使用空間接近預警狀态,請登陸存儲檢視,一般這種情況,是存儲空間已經沒有空餘導緻,由于vSpherer4的BUG,有時候在沒有報警的情況下,存儲空間就已經滿了情況。請增加存儲或移除部分虛拟機。 22、Windows系統的虛拟機無法進入安全模式 解決方法:選中虛拟機右鍵“編輯設定” —“選項” –—“引導選項”,在“啟動引導延遲”填上“ 1000”( 1秒 =1000毫秒,數字可以随便填,稍大一點即可)。然後啟動按 F8即可進入安全模式。
本文出自 “今夜燦爛” 部落格,請務必保留此出處http://saturn.blog.51cto.com/184463/667895
23、vSpherer4.1中32位win2003會不定時的關機,關機後無法再次登入
故障現象:客戶的X86 Windows2003VM系統在使用中會不定時的關機。關機時間不确定,幾個小時到幾天,關機瞬間就像實體機斷電一樣,關機後的VM能再次開啟,但隻要輸入賬号和密碼就立即關機,連安全模式也一樣狀況。其他X64VM系統沒有任何問題。
解決方法:通過兩個月的煎熬,排除了網絡病毒、實體硬體和系統版本的原因,通過不斷的分析 ESXi和主機日志,發現有類似如下日志 Sep 07 01:45:03.709: mks| SOCKET 10 (91) recv error 104: Connection reset by peer Sep 07 01:45:03.709: mks| SOCKET 10 (91) destroying VNC backend on socket error: 1 Sep 07 03:26:42.676: vmx| Vix: [10666095 mainDispatch.c:907]: VMAutomation_PowerOff: Powering off. (VM Powering off) 通過400長期的周旋,發現這是7月底發現的BUG,通過在ESXi主機下輸入指令: /etc/init.d/sfcbd-watchdog stop chkconfig sfcbd-watchdog off chkconfig sfcbd off 問題解決,但 VC上插件和監控狀态失效,去官網( http://kb.vmware.com/selfservice/microsites/search.do?cmd=displayKC&docType=kc&docTypeID=DT_KB_1_1&externalId=2000609)下載下傳最新更新檔,安裝,一切 OK。 24、VM(windows2003)全屏最大化後,滑鼠移動緩慢或錯位 解決方法: 1、檢視是否安裝 VMware-tools 2、檢視系統内硬體加速是否開啟(完全) 3、将虛拟機分辨率調整為: 800×600 4、到控制台中打開,上面菜單欄中à視圖à自動比對視窗勾去掉
5、檢視虛拟機中的顯示卡驅動是否為: VMware SVGA II 一般情況下,這 5點中,滿足 1、 2、 3基本可以解決問題,如果全部滿足還不行那你隻能阿彌陀佛了。當然前提是你已經排除 VM OS本身的問題如 CPU或記憶體占用比較大,存儲讀寫延時等等。(注:附件中有圖檔)
24、用VDR備份無法建立靜默快照,因為建立快照操作超過了拖延已當機虛拟機中 I/O 的時限。
解決方法:停止服務 VMware Tools Services,打開 Vmware Tools安裝程式,選擇 Modify。不要安裝 Volume Shadow Copy Services Support,完成後重新開機 VM. 25、如何從本地上傳下載下傳檔案到ESXi主機 解決方法: 1、可以通過 ESXi的指令 SCP上傳和下載下傳,在沒有三方工具的情況下這個指令需要需要通過另外一台 Linux中轉才能把需要的檔案上傳和下載下傳要需要的檔案下。 2、由于 Client登陸 VC後,可以在上面看到共享的存儲空間和本地硬碟,這說明 ESXi主機内一定有一個檔案同樣也可以看到這些空間。經過分析發現 /vmfs/volumes/目錄就是存儲和本地硬碟的存放點。可以通過這個目錄上傳和下載下傳 ESXi主機中的檔案。 26、在 vCenter Server 更新到 5.0 版本後,ESX 4.0 Update 2 主機可能崩潰 解決方法:發生崩潰時,同時在紫色螢幕上顯示以下消息:NOT_IMPLEMENTED bora/vmkernel/filesystems/visorfs/visorfsObj.c:3391。 解決辦法:更新到 vCenter Server 5.0 之前,将由 vCenter Server 管理的所有 ESX 4.0 Update 2主機更新到 ESX 4.0 Update 3。 27、HA配置到90%時失敗,提示:Internal AAM Error-agent could not start 故障狀态: 1、第一台主機加入到 Cluster沒問題,但是第二台主機加入到 cluster時,走到 90%出錯,提示如下錯誤: Internal AAM Errors-agent could not start 複制代碼 2、在 aam_config_util_addnode.log檔案裡有類似如下錯誤資訊: 01.01/23/10 16:20:49 [myexit ] Failure location: 02.01/23/10 16:20:49 [myexit ] function main::myexit called from line 2199 03.01/23/10 16:20:49 [myexit ] function main::start_agent called from line 1168 04.01/23/10 16:20:49 [myexit ] function main::add_aam_node called from line 171 05.01/23/10 16:20:49 [myexit ] VMwareresult=failure 故障分析: 這種故障一般和 UDP 8043端口無法通路有一定關系; 解決方案: 確定 UDP 8043端口暢通無阻,比如: 執行如下指令: tcpdump -i vswif0 -s 900 -n udp port 8043 -w ${主機名 }.pcap 28、查閱和重裝VirtualCenter Server agents(vpxa)服務 故障狀态: ·配置 VMware High Availability (HA) 失敗; ·重新配置 VMware HA時,提示如下錯誤: Could not Enable aam firewall ruleset :vim.fault.HostConfigFault ·無法将 ESX添加到 VirtualCenter; ·嘗試重新将 ESX添加到 VirtualCenter時,提示如下錯誤: unable to access the specified host, either it doesn’t exist, the server software is not responding, or there is a network problem ·在 hostd.log檔案中有如下内容: [2010-05-24 10:45:51.463 ‘Vmomi’ 15752112 info] Throw vim.fault.AlreadyExists [2008-05-26 10:45:51.463 ‘Vmomi’ 15752112 info] Result: (vim.fault.AlreadyExists) { name = “vpxuser” msg = “” } 解決方案 ; 備注:當看到如下錯誤時,請在 ESX主機上重裝 vpxa: unable to access the specified host, either it doesn’t exist, the server software is not responding, or there is a network problem. 檢視安裝在 ESX/ESXi伺服器上的 VirtualCenter agent(vpxa)版本号的方法如下: 1.首先确定 VirtualCenter的版本号:點選 Help按鈕,點選 About可查閱; 指令檢視 VMware-vpxa的指令: rpm -V VMware-vpxa 29、使用IBM伺服器可能導緻ESXi/ESX 4.1伺服器HBA卡和PCI裝置停止響應 故障狀态: 當使用 IBM x3650 M3或 BladeCenter HS22V伺服器時,可能會在 ESXi/ESX 4.1上遇到下面的問題: 1、 HBA卡停止響應; 2、某些 PCI裝置無響應; 3、可以在 ALT+F12界面和日志資訊裡看到這樣的資訊: vmkernel: 6:01:34:46.970 cpu0:4120)ALERT: APIC: 1823: APICID 0x00000000 – ESR = 0x40 4、 HBA卡停止響應,例如: vmkernel: 6:01:42:36.189 cpu15:4274)<6>qla2xxx0000:1a:00.0: qla2x00_abort_isp: **** FAILED **** vmkernel: 6:01:47:36.383cpu14:4274)<4>qla2xxx 0000:1a:00.0: Failed mailbox send register test 5、 HBA卡可能進入離線狀态,例如: vmkernel: 6:01:47:36.383 cpu14:4274)<4>qla2xxx 0000:1a:00.0: ISP error recovery failed – board disabled 故障分析: 具體問題還不太清楚,期待 VMware官方能夠給出解釋并放出相關更新檔; 解決方案: 在 ESXi/ESX 4.1裡面雀聖啟用了中斷重映射代碼,而這個代碼和部分 IBM伺服器不相容,可以通過禁止掉這個代碼預設啟動的方式來臨時解決這個問題: 1、進入到指令行界面,執行如下指令: #esxcfg-advcfg -k TRUE ioDisableIR #init 6 2、重新開機後檢查這個選項是否依然預設啟動: #esxcfg-info -c iovDisableIR=TRUE 備注:這就表示預設沒有啟動; 也可以利用 vSphere Client登入到伺服器的 GUI進行修改 30、虛拟機無法關閉停止在95%左右的解決辦法 一次做虛拟機回收工作,由于目标虛拟機當時防毒軟體正在運作, CPU占用很高,本來想登陸關閉虛拟機,但是遠端連接配接根本沒反映,打開 VC帶的控制台,滑鼠點選進去,操作也是在是慢,總歸到底,最後,直接将虛拟機電源關閉。之後,就看着任務開始執行,但進度條走到 95%的時候,咋都不動了。 解決思路: 這個問題,屬于一個“溝通”問題,應該從兩方面入手: 1、一個是 vCenter端是否已經将此指令順利傳送到 ESX; 2、然後是, ESXi/ESX端是否順利接到指令,以及是否執行了此指令。 解決過程: 1、 SSH連接配接 ESX; 2、 vmware-cmd <path.vmx> getstate 确定虛拟機狀态; <path.vmx> 為完全路徑(空格等前别忘了加上轉義符 /);vmware-cmd -l指令可檢視虛拟機路 3、官方文檔說若為 On,可繼續執行其他指令來結束虛拟機; 但是我走到這裡,顯示的為 Off;這就說明, ESX已經将虛拟機關閉了,那這問題就是一個溝通問題 4、登陸 VC,我想先從 VC端将此問題虛拟機所在的主機斷開連接配接,之後再重新連接配接,這樣就會進行一次新的對話,但是,由于前一個未關閉虛拟機的任務未執行完畢,之後的任務好像都成隊列似的在等待,沒有反應。 5、任務無法執行,重新開機相關 VC和 ESX服務 VC:在 Vitual Center的 WIN機器上的,在服務管理器重新開機 VC服務。 ESX:在 SSH登陸後對兩個伺服器執行重新開機。(注:虛拟機服務會短暫中斷) 指令如下: service mgmt-vmware restart service vmware-vpxa restart 6、在這溝通中的三個服務都已經重新開機完畢,此時再執行步驟 2時,發現傳回的結果為 On–那台虛拟機正在運作,發現這個,那麼按照官方的文檔,後續的幾個指令就可以有用武之地了。 7、 kill -9 xxxx ps -auxwww |grep -i <VMNAME>.vmx 可以看到虛拟機的 PID 8、執行步驟 2,現在已為 Off 9、登陸 VC檢視,重新整理下,如果狀态還未改變,再重新開機下 VC伺服器,即可。
31、為主機應用Host Profiles提示compliance錯誤
故障狀态:
為主機應用Host Profiles失敗,提示如下錯誤:
01.Specification state absent from host: device ‘<datastore>’ state needs to be set to ‘on’
02.Host state doesn’t match specification: device ‘<datastore>’ needs to be reset
03.Specification state absent from host: device ‘<datastore>’ Path Selection Policy needs to be set to ‘VMW_PSP_FIXED’
04.Host state doesn’t match specification: device ‘<datastore>’ Path Selection Policy needs to be set to default for claiming SATP
故障分析:
這是由于PSA元件導緻的;
解決方案:
1、右擊Host Profiles後點選Enable/Disable Profiles配置選項;
2、展開“Storage Configuration”選項,展開“Pluggable Storage Architecture”這個uxanxiang;
3、去掉“PSA Device Configuration”;
4、展開“Native Muti-Pathing(NMP)”這個選項後,接着展開“PSP and SATP configuration for NMP devi”選項;
5、去掉“PSP configuration for”這個選項後點選OK即可。
33、分析、解決IOPS導緻的虛拟機/存儲性能下降和虛拟機磁盤延時較大的問題
故障狀态:
1、虛拟機性能較低;
2、在執行備份時磁盤延時很厲害;
3、虛拟磁盤vmdk延時較大;
故障分析:
這種問題基本都是由于虛拟機沒有足夠的IO Per Second(IOPS),或者IOPS低于30;
解決方案:
在解決問題前,首先要解決以下兩個問題:
問題1:什麼是IOPS?
IOPS全稱為Input/Output Per Second,它是衡量一個磁盤(虛拟磁盤和實體磁盤)、存儲的基本也是十分重要的标準。不同的磁盤、存儲有着不同的IOPS。IOPS的高低直接會影響着系統的性能。目前,VMware虛拟化環境中最大的瓶頸也就在于這個IOPS。針對資料密集型業務的資料庫業務和流媒體業務,由于它們的IOPS很大,是以在虛拟化環境中部署它們一定要充分考量它們的負載,也就是IOPS大小,結合實際的存儲性能來檢視是否符合業務标準。
問題2:如何計算IOPS?
如何計算每台虛拟機的IOPS?
要想計算每個虛拟機的總的IOPS數量,首先就要确認磁盤類型以及它們的IOPS是多少。處于RAID陣列裡面的每個盤的IO有利于增長整體存儲的可用IOPS。而位于這個存儲上面的單台虛拟機的IOPS,則可以通過将這個存儲的總IOPS除掉虛拟機數量即可基本得到單台虛拟機的IOPS。
現實案例:
假定有6顆10000RPM的磁盤,那麼它們的總的可用IOPS大約為150×6=900。如果LUN上面運作的虛拟機數量為50個,則單台虛拟機的IOPS為900/50=18 IOPS。如果以這個為标準,則意味着虛拟機的性能相對底下。如果想要滿足虛拟機的基本IOPS需求,那麼應該為900/30=30,也就是說同一個Volume裡IOPS為30(最低要求)虛拟機需要數量控制在30台以下。
備注:備份存儲會消耗更多的IOPS,同時也會給Volume帶來更多額外的符合。如果是這樣,則需要用額外手段解決備份時的額外資源消耗(可以通過I/O meter軟體來測試IOPS)
34、丢失或鎖定文檔導緻虛拟機無法Power On
故障狀态:
1、虛拟機無法開啟;
2、嘗試開啟虛拟機時,看到類似如下錯誤資訊:
- Unable to open Swap File;
- Unable to access a file since it is locked;
- Unable to access Virtual machine configuration;
3、在/var/log/vmkernel檔案裡可以看到類似如下資訊:
WARNING: World: VM xxxx: xxx: Failed to open swap file <path>ock was not free
WARNING: World: VM xxxx: xxx: Failed to initialize swap file <path>
4、當嘗試開啟虛拟機的console控制台時,可能會收到如下錯誤資訊:
Error connecting to <path><virtual machine>.vmx because the VMX is not started
5、在開啟虛拟機時,卡在95%位置無響應;
6、從模闆部署一台新的VM之後無法開啟虛拟機;
7、虛拟機在vCenter Server和ESXi/ESX主機之間報告控制台電源狀态沖突;
故障分析:
導緻這個問題的因素可能很多,但是衆多問題中,都穿插或包含着檔案損壞或檔案被鎖定等問題的可能。虛拟機常用的檔案包括:
- *.vswp
- *-flat.vmdk
- *-delta.vmdk
- *.vmx
- *.log
解決方案:
首先需要确認哪些檔案處于鎖定狀态:
1、利用vSphere Client登入ESXi/ESX主機、vCenter Server主機;
2、在Datastore裡找到想要開啟但是無法開啟的虛拟機所在位置;
3、嘗試開啟虛拟機,如果無法開啟且console顯示錯誤,先查閱vmware.log日志檔案的相關資訊來确認問題;
4、利用SSH或COS選用root權限登入到ESXi/ESX主機之後執行下面的指令檢視虛拟機的完整路徑:
#vmware-cmd -l
系統将輸出類似如下資訊來顯示注冊到ESXi/ESX主機的虛拟機:
/vmfs/volumes/<UUID>/<虛拟機目錄>/<虛拟機名>.vmx
5、執行下列指令切入到這個虛拟機所在的目錄:
#cd /vmfs/voluems/<UUID>/<虛拟機目錄>
6、然後查閱vmware.log日志,在檔案的尾部檢視什麼原因導緻這個問題後再針對性的分析。
準确定位并删除掉鎖定檔案
由于虛拟機可以在主機之間移動,如果虛拟機注冊到的主機保持對檔案的鎖定狀态,那麼,這個鎖定檔案可以有效保障ESXi/ESX主機對虛拟機檔案的控制權和有效保護虛拟系統。主機由Service Console接口的MAC來确定。lock由VMkernel或Service Console負責維護;
備注:ESXi伺服器沒有Service Console是以,lock由VMkernel單獨負責維護;
首先要确定VMkernel可能鎖定的檔案:
1、執行下面的指令來報告鎖定目錄所在的MAC位址:
#vmkfstools -D /vmfs/volumes/<UUID>/<虛拟機目錄>/<鎖定狀态檔案>
2、由于負責鎖定.vmdk檔案的主機會将MAC位址寫入到vmkernel日志裡面,那麼可以用下面的指令查閱:
#tail /var/log/vmkernel
35、Storage vMotion失敗:looking for lines staring with “CBTMotion”
故障狀态:
1、執行Storage vMotion失敗;
2、系統提示如下錯誤資訊:
01.A general system error occurred: Storage VMotion failed to copy one or more of the VM’s disks. Please consult the VM’s log for more details, looking for lines starting with “CBTMotion-“.
複制代碼3、/var/log/vmware/hostd.log檔案裡有類似如下資訊:
01.Failed with error 340983807: Storage VMotion failed to copy one or more of the VM’s disks. Please consult the VM’s log for more details, looking for lines starting with “CBTMotion”.
複制代碼故障分析
可能由于虛拟機的硬體版本号過老導緻;
解決方案:
關掉虛拟機後右擊uxniji選擇Upgrade Virtual Machine Hardware即可。
36、添加LUN時提示HostDatastoreSystem.QueryVmfsDatastoreCreateOptions
故障狀态:
系統能夠掃描到Devices LUN,但是在添加過程中卻提示如下錯誤資訊:HostDatastoreSystem.QueryVmfsDatastoreCreateOptions ,如圖所示:
故障分析:
這樣的問題一般都是由于LUN的尺寸過大導緻,一般來說,VMware ESXi/ESX Server标準支援最大的LUN尺寸為2TB-512Byte,但是由于國内很多技術人員對這個-512Byte并不太在意,是以習慣型的講成2TB,這就導緻很多使用者在使用時,直接配置設定了2TB的空間,這就可能導緻了上述問題;
解決方案:
針對這樣的問題,建議如下:
1、如果已經分好了2TB的LUN,建議調整為1.88TB左右後再嘗試添加;
2、新LUN規劃使用者則請嚴格參照官方文檔的參數設計,建議是1.88TB左右為一個LUN生成Datastore
37、vCenter Converter推送Agent出錯:Converter Agent installer/uninstaller Failed
故障狀态:
1、利用vCenter Converter推送Agent到Windows Server 2003伺服器上時,失敗;
2、系統提示類是如下錯誤資訊:
01.Converter Agent installer/uninstaller failed on ‘xxxxxxxxx’.
3、VMware vCenter Converter的日志檔案converter-server.log裡面有類似如下錯誤提示:
01.[#6] [2011-01-21 10:50:55.976 04080 info ‘App’] [agentManager,83] [AgentManager] Install Agent on 192.168.10.10
02.[#6] [2011-01-21 10:51:16.976 04080 error ‘App’] [agentManager,95] [AgentManager] Install Agent failed: converter.fault.AgentDeploymentFault
03.[#7] [2011-01-21 11:18:37.289 03976 info ‘App’] Reusing existing VIM connection to 192.168.30.150
04.[#7] [2011-01-21 11:18:37.476 03976 error ‘App’] Found dangling SSL error: [0] error:00000001:lib(0):func(0):reason(1)
05.[#7] [2011-01-21 11:19:00.945 02756 info ‘App’] [agentManager,83] [AgentManager] Install Agent on 192.168.10.10
06.[#7] [2011-01-21 11:19:21.961 02756 error ‘App’] [agentManager,95] [AgentManager] Install Agent failed: converter.fault.AgentDeploymentFault
7.[#7] [2011-01-21 11:19:32.445 03976 info ‘App’] [diagnosticManager,357] Generating Converter.Server log bundle.
故障分析:
以下幾種情況可能導緻這樣的問題:
1、445端口沒能打開;
2、曾經手動安裝過Agent後解除安裝;
3、Windows服務管理其中的server服務沒有啟動導緻的IPC$連接配接失敗;
4、防火牆阻絕;
解決方案
1、确認445端口或NetBIOS協定能正常使用;
2、建議在Converter時關閉防火牆;
3、如果依然有問題,嘗試用Converter Standardalone版本遷移或采用ConverterCD進行冷克隆。
38、解決在vSphere 5.0裡開啟HA時,提示:Datastore Heartbeating不足的問題
故障狀态:
為ESXi 5.0+vCenter 5.0配置HA時,提示如下資訊:
故障分析:
這是由于vSphere 5.0裡的HA部分已經重寫,并且新增了Datastore Heartbeating用于網絡Partition心跳檢測支援;
解決方案:
有2個選擇,一個是加多存儲用于心跳檢測,這也是正确的選擇,就不多講,另一個就是忽略掉這個問題,方法如下:
1、vSphere Client登入到vCenter Server 5.0後,右擊HA Cluster,點選Edit,然後找到進階選項設定:
2、再如上圖所示的内容中,添加下參數:
das.ignoreinsufficienthbdatastore
備注:預設情況下,這個參數的值是false的。
39、通過vSphere Client登陸ESXi主機提示“正在更新”的問題
故障狀态:
通過vSphere Client登陸VCenter Server4.1正常,登陸ESXi主機提示如下圖:
故障分析:
需要通過‘vSphereclient.vmware.com’來更新Client說明用戶端存在問題,由于登陸VCenter Server4.1不存在任何問題,是以基本确定版本的問題。檢視ESXi版本和vSphere Client,發現Client的版本低于ESXi版本。
解決方案:
由于Client所在網絡無法上Internet,是以無法更新Client用戶端,可以通過安裝高版本的Client來解決此問題。
40、紅旗32位Linux進入系統時提示”udevu”無法繼續進入系統的問題
故障狀态:進入系統後,出現下圖的界面,之後無法向下運作,必須按Ctrl+C才能繼續向下運作
故障分析:由于系統安裝時候是完整的,CD光牒鏡像包是完整的,安裝的時候不存在任何問題。考慮到實體機上不存在這種問題,懷疑虛拟機虛拟驅動的問題,安裝新的VMware-tools問題依舊。
解決方案:考慮到紅旗Linux比較新,去官方下載下傳11月份最新的VMware-tools,問題解決 (下載下傳位址:http://packages.vmware.com/tools/esx)
50、虛拟機檔案被鎖,無法正常 power on
故障狀态:
啟動虛拟機時95%,停頓并且程序中斷,提示:ubable to access files since it is locked。
禍根:HA
解決方法:
1.首先将cluster中的HA功能關閉。如果該功能不關閉,容易造成死鎖,,VM不斷跳動,,不斷再不同的ESX内循環被鎖,徒勞而無功。
2.磁盤檔案被鎖,要解決,必須要知道到底是哪台ESX把他給鎖住了,這是關鍵。
方法:看/var/log/vmkernel但是,在做這些前, 再準備些别的工作。
3.在VC中,把被鎖的VM從Inventory中remove掉。原因很簡單,這是一個 unregister的過程。
4.根據/var/log/vmkernel,搜尋owner,可以找到類似以下的語句:
Oct 19 04:23:33 esx-hostname vmkernel: 3:06:29:47.992 cpu6:1656)FS3: 1975: Checking if lock
holders are live for lock [type 10c00001 offset 52008960 v 380, hb offset 3554304
Oct 19 04:23:33 esx-hostname vmkernel: gen 17, mode 1, owner
48f5f637-462688bc-fd28-0e1a6434b6f8 mtime 38112]
OK,owner後面的48f5f637-462688bc-fd28-0e1a6434b6f8就是你的target了。 因為他就是鎖住VM 的宿主.。
5.根據以下指令,,找出到底哪台ESX的UUID是 48f5f637-462688bc-fd28-0e1a6434b6f8
[[email protected] root]# esxcfg-info |grep -i ‘system uuid’
6.找到目标主機後,當然是殺死他鎖住VM的程序。之是以會被鎖,原因就是HA 把VM從别的HOST遷移過來,但是又沒有unregister和register的過程,是以在第3步的時候,你檢視VM的Summary的時候,host ip還是屬于出問題的 host。 但是VM又被新的host霸王硬上功的power on,注冊都沒注冊, 又怎麼啟動呢。找到 PID 用下面的指令:
ps -efwww|grep virtualmachine.vmx
找到 PID 後, kill -9 PID
7.這時候,還要确定一件事情, .vswp檔案的事情。這個是給台客處理問題時吸取的經驗。就因為忽略了這個,是以在殺掉迚程後,重新注冊VM,還說沒有 SWAP檔案,啟動還是失敗。
在 VM 啟動時會自動生成SWAP,沒有SWAP檔案,其實就是因為 SWAP 存在了, 因為重名而導緻無法正常生成。
進入到/vmfs/volumes/lunid/vm_path/下,vmkfs -d virtual_machine.vswp
或者進入Datastore Browser,在裡面把SWAP檔案删除也可。
8.完全之策,你還可以進入到VM的SETTINGS–OPTIONS–SWAPFILE LOCATION, 對該儲存的位置做下設定。
9.重新注冊VM。進入Datastore Browser,找到VM.vmx,add to inventory。
10.啟動 VM. Good Luck。
51、忽視掉ESXi/vCenter Server提示SSH事件的方法
| |
52、嘗試遷移一台帶USB裝置的VM失敗
故障狀态:
在執行虛拟機遷移向導時,如果系統檢測到不相容的USB裝置存在,則系統會提示如下錯誤資訊:
Currently connecteddevice ‘USB 1’ uses backing ‘path:1/7/1’,which is not accessible.
故障分析:
這種問題通常發生在為主機開啟了VMDirectPath I/O支援下的USB Passthrough Devices功能,然後為特定的VMs配置設定了USB裝置,比如:加密狗;
解決方案:
1、确認USB裝置能夠被虛拟機識别和支援,并確定在添加USB裝置到VMs時,勾選了with vMotion選項;
2、在執行vMotion動作之前,重新嘗試将USB裝置添加到VMs;
3、确認ESXi主機沒被重新開機過,因為,ESXi主機重新開機之後,原本支援的vMotion WithvMotion功能将會失效。
53、Convert Linux系統的Troublshooting過程
(1)、确認源轉換Linux機器的OS在官方的支援清單中;
(2)、擁有root權限;
(3)、确認DNS的設定有沒有問題,注意:應該同時在Linux和Windows都加上;
(4)、确認源Linux能夠ping同ESX或vCenter的IP。如果在2%時失敗,最大的可能就是權限問題或防火牆阻隔問題;
(5)、确認Linux允許SSH登陸進去。這個,可以幫助我們在converting的時候登入到Linux系統;
(6)、确認是給helper virtual machine設定的靜待IP,而不是DHCP擷取的(如果網内沒有DHCP伺服器);
(7)、确認源和目标都在同一子網。如果通過路由連結的不同子網可能會出錯;
(8)、注意,converter不支援做了軟陣列的Linux系統。可以用冷克隆CD光牒來做,它會把軟陣列的設定為/dev/md0。
(9)、VMware Converter Standalone的日志目錄:C:Documents and SettingsAll UsersApplication DataVMwareVMware vCenter Converter Standalone,用于排錯時用。
54、vCenter Service Status頁面故障:Unable to retrieve health status
故障狀态:
vCenter Server Status頁面提示如下錯誤資訊:
Unable to retrieve health status for vCenter inventory service
Unable to retrieve health status for VMware vSphere Profile-Driven storage service
執行vCenter Server的搜尋動作時,提示如下錯誤提示:
Unable to connect to webservices to perform query.
Verify that the “VMware VirtualCenter Management WebServices” service running onhttps://<vcenter-host-name>:10443
故障分析:
這個問題一般都由于當vCenter Server服務發生了變更或全新安裝了一台vCenter Server,但是資料庫依然是原來的資料庫導緻;
解決方案:
替換掉vws.jar、jointool.jar和ds.jar檔案即可,步驟如下:
下載下傳本文附件中的vws.zip

檔案然後解壓縮vws.jar、jointool.jar和ds.jar檔案;
停止掉VirtualCenter Server服務以及VirtualCenter Management Webservices服務;拷貝vws.jar和jointool.jar到C:ProgramFilesVMwareInfrastructuretomcatwebappsWEB-INFlib覆寫掉原來的檔案;拷貝ds.jar檔案到C:Program FilesVMwareInfrastructureInventory Servicelib覆寫掉原來的檔案;重新啟動相關服務或vCenter Server伺服器即可。
55、VMRC 控制台的連接配接已斷開…正在嘗試重新連接配接
故障狀态:
用vSphere Client連接配接到ESXi 5.0的主機,啟動其中的虛拟機後,無法連接配接控制台,打開控制台之後,視窗上方提示一行“VMRC 控制台的連接配接已斷開…正在嘗試重新連接配接。”
故障分析:
從情況看,類似于Windows系統的DEP政策處于開啟狀态導緻的問題一樣。但這個情況是所有虛拟機都提示這個錯誤,排錯DEP的問題,用本地vSphere Client登入一個VC平台,問題仍舊一樣。為了排除問題,換了一台筆記本登入VC,突然發現問題不見了。原來是本地的vSphere Client出了問題,再三思索,發現出現問題前我對本地WIN7用360安全衛士更新了更新檔,是否是更新檔破壞了vSphere Client某個檔案呢
解決方案:
重制安裝vSphere Client,問題解決。
56、端口 80 的 vCenter Server 和 IIS 之間的沖突
故障狀态:
vCenter Server 和 Microsoft Internet Information Service (IIS) 都将端口 80 用作直接 HTTP 連接配接的預設端口。該沖突會導緻安裝 vSphere Authentication Proxy 後 vCenter Server 無法重新啟動。 在 vSphere Authentication Proxy 安裝完成後, vCenter Server 無法重新啟動。
故障分析:
如果安裝 vSphere Authentication Proxy 時未安裝 IIS ,則安裝程式會提示您安裝 IIS 。因為 IIS 使用端口 80 ,這是用于 vCenter Server 直接 HTTP 連接配接的預設端口, 是以 vCenter Server 在 vSphere Authentication Proxy。安裝完成後無法重新啟動。請參見第 32 頁,“ vCenter Server 所需的端口” 。
解決方案:
要為端口 80 解決 IIS 和 vCenter Server 之間的沖突,請執行以下操作之一。
如果在安裝 vCenter Server 之前已安裝 IIS 将 vCenter Server 直接 HTTP 連接配接的端口由 80 更改為其他值。 如果在安裝 IIS 之前已安裝 vCenter
Server 重新啟動 vCenter Server 之前, 将 IIS 預設網站的綁定端口由 80 更改為其他。
57、在 UEFI 模式下安裝 ESXi 後主機無法引導
故障狀态:
在 UEFI 模式下, 在主機上安裝 ESXi 後重新開機時, 重新開機可能失敗。 出現此問題的同時, 還顯示一條類似于以下内容的錯誤消息: 發生異常網絡錯誤。無可用的引導裝置 (Unexpected network error. No boot device available)。
故障分析:
主機系統無法識别作為引導磁盤在其上安裝 ESXi 的磁盤。
解決方案:
1 螢幕上顯示錯誤消息時,按 F11 顯示引導選項。
2 選擇一個類似于添加引導選項的選項。該選項的文字可能有所不同,具體取決于您的系統。
3 在安裝 ESXi 的磁盤上選擇檔案 EFIBOOTBOOTx64.EFI 。
4 更改引導順序,以便主機從添加的選項引導。
58、将 Microsoft SQL 資料庫設定為不受支援的相容模式會導緻 vCenter Server 安裝或更新失敗
當資料庫設定為不支援的版本的相容性模式時,使用 Microsoft SQL 資料庫的 vCenter Server 安裝會失敗。
故障狀态:
将顯示以下錯誤消息: 輸入的資料庫使用者沒有使用標明資料庫安裝和配置 vCenter Server 所需的必要權限。 請更正以下錯誤 : %s
故障分析:
資料庫版本必須是 vCenter Server 支援的版本。 對于 SQL , 即使資料庫是受支援的版本, 但如果将其設定為以不支援的版本的相容性模式運作, 仍會發生此錯誤。 例如, 如果将 SQL 2008 設定為以 SQL 2000 相容性模式運
行,就會發生此錯誤。
解決方案:
u 請確定 vCenter Server 資料庫是受支援的版本, 并且沒有設定為以不支援的版本的相容性模式運作。
59、誤删運作中的虛拟機,通過xx-flat.vmdk恢複方法
故障狀态:誤删了運作中的虛拟機,進入目錄檢視,隻剩下xx-flat.vmdk檔案,從檔案的類型看,隻是File格式,不是Virtual Disk格式,建立虛拟,選擇添加已存在磁盤,提示不存在
解決方案:
1. 建立一虛拟機,不要建立硬碟
2. 用ssh的方式登入host,查找xx-flat.vmdk檔案所在位置及目錄,
3. 在上面這個檔案相同目錄下建立新xxx.vmdk檔案,大小要和xx-flat.vmdk檔案一樣大,
用ls -la檢視xx-flat.vmdk檔案大小,
用vmkfstools -c 檔案大小 -a lsilogic xxx.vmdk 來建立新磁盤檔案
4. 将這個磁盤檔案添加到建立的虛拟機中;
5. 用原檔案xx-flat.vmdk覆寫建立的xxx-flat.vmdk(注意一定是-flat.vmdk),使用mv指令
6. 完成後開啟虛拟機就可以了
60、在view桌面中,Win7下安裝出現軟體出現“系統管理者設定了系統政策,禁止進行此安裝”的提示
解決方案:
1、打開“開始->控制台->管理工具->本地安全政策”->點選“軟體限制政策”,如果提示“沒有定義軟體限制政策”,那麼就右鍵“建立軟體限制政策”->建立後,輕按兩下右側“強制”,選擇“除本地管理者以外的所有使用者”,确定
2、windows開始菜單,運作裡面輸入gpedit.msc打開組政策,
在“計算機配置”→管理模闆→windows元件→windows installer,右邊 第一項就是禁用windows installer。把它改成 “未配置”後者“已禁用”就可以了。
3、删除HKEY_CLASSES_ROOTInstallerProducts4080110900063D11C8EF10054038389C系統資料庫項目。(建議使用此法,能解決大多數你出現的情況,在運作欄裡輸入regedit進入系統資料庫,按照以上路徑找到項目删除就可以了)
61、持續較高的 CPU 使用情況的解決方案
故障狀态:
CPU 使用情況中的臨時高峰表示 CPU 資源的使用情況最佳。持續較高的 CPU 使用情況可能表示存在問題。 您可以使用 vSphere Client CPU 性能圖表監控主機、群集、資源池、虛拟機和 vApp 的 CPU 使用情況。
問題 n 主機 CPU 使用情況一直很高。 CPU 使用情況值較高時會增加主機上虛拟機的就緒時間和處理器列隊。
n 虛拟機 CPU 使用情況超過 90% ,且 CPU 就緒值超過 20% 。應用程式性能将受到影響。
原因
主機可能缺少滿足要求所需的 CPU 資源。
解決方案: n 驗證是否在主機的每台虛拟機上均安裝了 VMware Tools 。
n 将主機上或資源池中其他虛拟機的 CPU 使用情況與此虛拟機的 CPU 使用情況值進行比較。 主機的虛拟機 視圖上的堆棧條形圖顯示主機上所有虛拟機的 CPU 使用情況。 n 确定虛拟機就緒時間過長是否由其 CPU 使用情況時間達到 CPU 限制設定所緻。 如果出現這種情況, 請增
加虛拟機上的 CPU 限制。 n 增加 CPU 份額以給予虛拟機更多機會運作。 如果主機系統受到 CPU 限制, 則主機上的總就緒時間可能仍 維持在相同級别。如果主機就緒時間沒有減少,則為高優先級虛拟機設定 CPU 預留,保證它們收到所需 要的 CPU 周期。 n 增加配置設定給虛拟機的記憶體量。此操作會減少所緩存應用程式的磁盤和 / 或網絡活動。這可能會降低磁盤
I/O ,并減少主機對虛拟化硬體的需求。具有較少資源配置設定的虛拟機通常可累積更多的 CPU 就緒時間。 n 将虛拟機上的虛拟 CPU 數量減少到執行工作負載所需要的數量。例如,四路虛拟機上的單線程應用程式
隻能從單個 vCPU 中受益。 而管理程式還需維護三個空閑 vCPU , 占用本可用來處理其他工作的 CPU 周期。 n 如果主機不在 DRS 群集中,則将它添加到一個群集中。如果主機在 DRS 群集中,則增加主機數,并将一 個或多個虛拟機遷移到新主機上。 n 如有必要,請在主機上更新實體 CPU 或核心。
n 使用最新版本的管理程式軟體并啟用 CPU 節省功能(例如 TCP 分段解除安裝、較大記憶體頁面和巨型幀)。
63、vMotion虛拟機失敗:A general system error occurred:Failed to flush checkpoint
故障狀态:
1、嘗試vMotion一台虛拟機失敗,提示如下錯誤資訊:
A general system error occurred:Failed to flush checkpointt data!
2、此時故障虛拟機的設定如下:
- 分辨率大于 1280×1024或小于第二個螢幕的分辨率;
- 顯示卡驅動選用了WDDM;
- 虛拟機的硬體版本号為8;
3、vCenter的Task & Events裡的詳細錯誤描述如下:
- An I/O error occurred while saving the checkpont:0(Resource temporarily unavailable);
- Failed to write checkpoint data(offset xxxxxxxx,size xxxxx):Failed to resum VM;
4、在虛拟機的vmware.log日志檔案裡有類似如下資訊:
.vmx| MigrateSetState: Transitioning from state 9 to 11.
.vmx| Migrate_SetFailure: Failed waiting for data. Error bad0006. Limit exceeded.
.vmx|
.vmx| Migrate: cleaning up migration state.
.vmx| MigrateSetState: Transitioning from state 11 to 0.
.vmx| Msg_Post: Error
.vmx| [vob.vmotion.chkpt.toobig] vMotion migration [XXXXXXXX:xxxxxxxxxxxxxxxx] failed. The checkpoint data length (xxxxx bytes) or the offset (xxxxxxxx bytes) exceeds the maximum checkpoint data length (xxxxxxxx byte).
.vmx| [msg.moduletable.powerOnFailed] Module Migrate power on failed. 故障分析:
這種情況可能是由于虛拟機的硬體版本号為8,WDDM驅動以及虛拟機的顯存等問題導緻;
解決方案:
由于問題可能不是由于單一原因導緻,是以,可根據如下方式分别進行故障排查處理:
1、将螢幕的分辨率調整一下,小于1280×1024或和第二塊螢幕的分辨率相等;
2、不要将虛拟機的硬體版本号更新為8;
3、增加checkpoint cache size,将它從8MB更新到16MB,方法如下:
- 關閉虛拟機後右擊虛拟機點選Edit Settings;
- 在彈出的對話框中找到Options頁标簽後選擇Advanced選項,在General下選擇Configuration Parameters;
- 點選Add Row後輸入如下參數:migrate.baseCptCacheSize值設定為後點選Ok應用更改;
4、将mks.enable3d的值設定為TRUE,步驟如下:
- 關閉虛拟機後右擊虛拟機點選Edit Settings;
- 在彈出的對話框中找到Options頁标簽後選擇Advanced選項,在General下選擇 Configuration Parameters;
- 點選Add Row後輸入,将值設定為True後點選Ok儲存關閉。
64、遷移完成vCenter Server資料庫到新主機後,VirtualCenter Management WebServices不對
故障狀态:
1、vCenter Server資料庫遷移到一個擁有新主機名和IP位址的系統上時,VirtualCenter Management WebServices服務異常;
2、vSphere Client登入伺服器時,看到Performance Overview Charts報錯如下:
General report generation exception
Perf Charts service experienced an internal error.
Message: Report application initialization is not completed successfully. Retry in 60 seconds.
3、vSphere Client登入到vCenter Server後搜尋之類的功能都無法使用;
4、vCenter Service Status顯示VirtualCenter WebServices和很多其它服務都處于離線狀态, 報如下錯誤資訊:
Unable to retrieve health data from https://localhost:8443
Service initialization failed.
故障分析:
當vCenter Server的資料庫被遷移到新位置後,必須要更改DSN的資訊,然而,Tomcat Server的設定卻不會随之變化,是以,我們需要對Tomcat Server進行修改之後才能正常,Tomcat Server被用于支援VirtualCenter Management Webservices服務運作;
解決方案:
解決方案就是進入到Tomcat Server的配置檔案裡,找到database_name.propeties,通常位置如下:
- W2K3 – C:Documents and UsersAll UsersApplication DataVMwareVMware VirtualCenter
- W2K8 – C:ProgramDataVMwareVMware VirtualCenter
修改Tomcat Server的資料庫位置方法如下:
1、文本檔案打開database_name.properties,找到如下内容:
url=jdbc:sqlserver:/DB_hostname\DB_instance;databaseName=database_name;integratedSecurity=true
2、修改上述文檔中對應位置的資料庫的對應主機名或IP位址;
3、重新開機VMware VirtualCenter Management Webservices服務或重新開機vCenter Server伺服器後,理論上即可恢複正常。
65、在ESXi 5.0裡,無法将管理網路遷移到vDS
故障狀态:
1、無法将管理網路遷移到ESXi 5.0所在的vDS上,提示如下錯誤資訊:
A specified parameter was not correct
2、vCenter Server上有類似如下的錯誤消息:
Call “HostNetworkSystem.UpdateNetworkConfig” for object “networkSystem-121” on vCenter Server “vCenter in vmanager.local” failed.
3、在hostd.log日志檔案裡,可以看到類似如下的日志資訊:
2012-02-10T15:54:09.649Z [FFE92A90 error ‘NetworkProvider’ opID=DA1DFDC2-00001B02-41] Unknown port type [0]: convert to UNKNOWN.
2012-02-10T15:54:09.721Z [FFE92A90 info ‘NetworkVmkSimulator’ opID=DA1DFDC2-00001B02-41] Portgroup Management Network has 1 client[s] connected to it
2012-02-10T15:54:09.721Z [FFE92A90 info ‘HostsvcPlugin’ opID=DA1DFDC2-00001B02-41] Simulate failed
故障分析:
這個問題一般都是由于網路的coredump功能有問題導緻的; 解決方案:
确認這個coredump功能處于enabled狀态,方法如下:
#esxcli system coredump network get
Enabled: true
Host VNic: vmk0
Network Server IP: XXX.XXX.XXX.XXX
Network Server Port: 6500
也可以利用esxcfg-vswitch -l的輸出結果來确認:
PortGroup Name VLAN ID Used Ports Uplinks
Management Network 10 2 vmnic0
例如,如果要在上述的網路卡上關閉coredump的話,可以執行如下指令:
#esxcli system coredump network set –enable false
66、克隆虛拟機失敗:Invalid configuration for device ‘0’
故障狀态:
1、無法克隆虛拟機,克隆是出錯:
Failed to clone a VM,error:Invalid configuration for device “0”
2、克隆到99%時失敗;
故障分析:
這種問題可能是由于UTC時鐘不同步的緣故;
解決方案:
1、vSphere Client連接配接到vCenter Server,點選Configuration頁标簽;
2、點選Software面闆下的Time Configuration選項,點選Properties;
3、确認時間是否有問題,如果有問題,做好時間同步:
- 點選Software面闆 -> NTP Configuration -> Options -> NTP Settings;
4、OK,重新開機下服務。
67、如何生成ESXi的新證書
通常,隻有當更改主機名稱或意外删除證書時,才要生成新證書。在某些情況下,可能需要強制主機生成新的證書。 a、登入 ESXi Shell 并擷取 root 特權。 b、在 /etc/vmware/ssl 目錄中,備份現有證書,方法是使用以下指令對其進行重命名。 mv rui.crt orig.rui.crt mv rui.key orig.rui.key 注意 如果由于删除了證書而需要重新生成這些證書,則不必執行此步驟。 c、運作指令 /sbin/generate-certificates 生成新的證書。 d、運作指令 /etc/init.d/hostd restart 重新啟動 hostd 程序。 e、通過執行以下指令并将新證書檔案的時間戳與 orig.rui.crt 和 orig.rui.key 進行比較,來确認主機是否已成功生成新證書。 ls -la
68、如何删除vCenter中無用的插件
69、冷遷虛拟機到ESXi主機後,它會自動遷移到另一台ESXi主機上
故障狀态: 冷遷虛拟機虛拟機到一台ESXi主機後,Power On時它自動跑到另一台ESXi主機上了; 故障分析: 這個事情,其實不算事情,隻是由于DRS的Automation級别標明了Fully Automated導緻; 解決方案: 1、點選指定的虛拟機的Tasks and Events頁标簽; 2、點選Events,裡面可以看到:DRS migrated xxxx from hostxx to host xxx; 3、找到DRS Cluster,右擊Edit Settings,在DRS Settings下點選Virtual Machine Options; 4、更改自動化級别為Disabled或Manual,即可。
70、清除vSphere Client的登入記錄
使用vSphere Client連接配接多了,下拉清單裡有很多的曆史記錄,看着有點煩.
搜尋了下,找到了E文的操作辦法
定位系統資料庫到
HKEY_CURRENT_USERSoftwareVMwareVMware Infrastructure ClientPreferences
清除
RecentConnections 的記錄即可
71、Linux系統VMXNET3虛拟網路卡時UDP包被Drop掉
故障狀态:
ESXi 5.x系統上的Linux虛拟機,虛拟網路卡選擇為VMXNET3時,UDP包被Drop掉了;
故障分析:
這是一個技術bug,VMware正在着手解決;
解決方案:
作為變通手段,隻需要将VMXNET3改為E1000這個虛拟網路卡類型即可。
72、恢複孤立的虛拟機
故障狀态:
虛拟機顯示在 vSphere Client 清單清單中,其中 (orphaned) 附加到其名稱。
故障分析:
在極少數情況下,位于由 vCenter Server 管理的 ESXi 主機上的虛拟機可能會變為孤立狀态。 vCenter Server 資料庫中存在這些虛拟機,但 ESXi 主機不再能識别出它們。 故障原因:
如果主機故障切換失敗,或直接在主機上取消對虛拟機的注冊時,虛拟機可能會變為孤立狀态。如果發生這種情況, 請将孤立的虛拟機移動到資料中心( 該資料中心可通路其中存儲着虛拟機檔案的資料存儲) 中的其他主機。
解決方案:
1 在 vSphere Client 清單清單中,右鍵單擊虛拟機,然後選擇重定位。此時将顯示可用主機清單。
2 選擇要在其中放置虛拟機的主機。如果沒有可用主機,請添加可通路其中存儲着虛拟機檔案的資料存儲的主機。
3 單擊确定儲存更改。虛拟機已連接配接到新的主機,并顯示在清單清單中。
73、從模闆克隆或部署後未打開虛拟機電源
故障狀态:
當從模闆中克隆或部署虛拟機時,可以在“即将完成”頁面上選中建立後打開此虛拟機電源複選框。但虛拟機在建立後可能不會自動打開電源。
故障分析:
建立虛拟機磁盤時,未預留交換檔案大小。
解決方案:
n 減小虛拟機所需的交換檔案的大小。可以通過增加虛拟機記憶體預留白間來實作。
a 在 vSphere Client 清單中,右鍵單擊虛拟機并選擇編輯設定。
b 選擇資源頁籤,然後單擊記憶體。
c 使用“預留”滑塊增加配置設定給虛拟機的記憶體量。
d 單擊确定。 |
n 或者,可以通過将其他虛拟機磁盤從交換檔案正在使用的資料存儲中移出來增加交換檔案的可用空間量。
a 在 vSphere Client 清單中,選擇一個資料存儲,然後單擊虛拟機頁籤。
b 對于每個要移動的虛拟機,右鍵單擊虛拟機,然後選擇遷移。
c 選擇更改資料存儲。
d 繼續完成遷移虛拟機向導。
n 另外,可以通過将交換檔案位置更改為具有足夠空間的資料存儲來增加交換檔案的可用空間量。
a 在 vSphere Client 清單中,選擇主機,然後單擊配置頁籤。
b 在“軟體”下,選擇虛拟機交換檔案位置。
c 單擊編輯。
注意 如果主機屬于指定虛拟機交換檔案與虛拟機存儲在同一目錄的群集,則無法單擊 編輯。您必須使用“群集設定”對話框更改群集的交換檔案位置政策。
d 從清單中選擇資料存儲,然後單擊确定。
74、通過NAT連接配接的vCenter和ESXi主機每隔30~60秒左右自動斷開
故障狀态:
通過NAT位址轉換後的vCenter和ESXi主機之間的通信每30~60秒左右會中斷;
故障分析:
這個問題一般都是由于在vCenter和ESXi主機之間無法通過NAT進行正常通信導緻;
解決方案:
導緻上述問題的原因是UDP 902端口适用于心跳的,而這個端口打開之後,2008伺服器的防火牆可能會鎖掉Edge Traversal,是以需要激活Allow Edge Traversal選項,步驟如下:
1、進入到2008系統的管理工具面闆裡;
2、點選Windows Firewall with Advanced Security後點選Inbound Rules;
3、找到VMware vCenter Server – Host heartbeat規則,點選Advanced頁标簽;
4、點選Allow Edge Traversal選項後,點選OK;
5、然後重新開機相關服務後重新删除/添加ESXi主機到vCenter Server即可。
75、為虛拟機添加PCI裝置
步驟如下:
1、利用vSphere Client登入系統之後,找到要添加PCI裝置的虛拟機;
2、右擊Virtual Machine->Edit Settings;
3、在Hardware頁标簽點選Add;
4、選擇PCI Device然後點選Next進入下一步,懸着passthrough裝置,然後點選Next進入下一步;
5、如果确認沒啥問題則點選Finish完成。
76、資料庫sa密碼變更後修改vCenter Server的sa通路密碼方法
出于安全等方面考慮,SQL資料庫的sa密碼發生了變更,那麼,這時它關聯的vCenter Server這邊也應該相應調整,那麼,不重裝就可以調整的方式如下:
1、管理者權限登入到vCenter Server所在Windows 作業系統;
2、進入入到如下目錄:C:Program FilesVMwareInfrastructureVirtualCenter Server,執行如下指令:
vpxd -P <new_Password>
3、重新開機VirtualCenter Server services相關服務即可。
77、“虛拟裝置的數目超過給定控制器的最大值”的錯誤
故障狀态:
克隆虛拟機的時候出現如下的報錯:
“虛拟裝置的數目超過給定控制器的最大值”
故障分析:
這個問題一般都是由于在克隆虛拟機的時候,對源虛拟機做了虛拟硬體的操作導緻
解決方案:
重新克隆虛拟機,在克隆的時候不要對源虛拟機進行虛假硬體的操作。
78、vCenter Operations Manager 5.0自動鎖定了admin賬戶的解決方案
故障狀态:
密碼重試次數過多,導緻了admin賬戶被鎖定,無法再登入,解決思路如下:
解決方案:
首先,确認admin賬戶是否真的被鎖定:
1、用root賬戶登入,然後執行如下指令:
su admin
如果該賬戶被鎖定,則系統将會顯示類似如下資訊:
Account locked due to XX failed login….
2、然後再在Analytics虛拟機上重複上述步驟;
當确認admin賬戶被鎖定後,解除鎖定步驟如下:
1、root賬戶登入,然後執行如下指令:
pam_tally –user admin –reset
2、再在Analytics虛拟機上重複這個步驟即可。
備注:
如果想要一勞永逸的禁止掉自動鎖定賬戶的功能則可以參考如下步驟:
1、root賬戶登入,然後執行如下指令:
/etc/pam.d/common-auth:auth requisite pam_tally.so deny=3
2、再在Analytics虛拟機上重複上述步驟即可。
79、 解決由于esx.conf檔案鎖定導緻ESXi從vCenter Server斷開連接配接的問題
故障狀态:
1、ESXi 5.0主機莫名其妙無響應從vCenter Server斷開;
2、SSH或DCUI登入ESXi主機失敗;
3、vmkernel.log檔案裡沒有任何問題,執行esxtop指令是可以看到CPU消耗率為100%;
4、在hostd.log日志檔案裡有類似如下資訊:
1. 2012-07-07 T10:10:32.170Q [2D2D7B90 verbose ‘ThreadPool’] usage : total=19 max=62 workrun=18
iorun=1 workQ=933 ioQ=0 maxrun=24 maxQ=934 cur=I 2012-07-07 T19:17:25.641Z [2CA47B90 verbose
‘ThreadPool’] usage : total=20 max=62 workrun=18 iorun=2 workQ=933 ioQ=0 maxrun=24 maxQ=934 cur=I
2012-07-07 T10:10:32.442Q [2CA47B90 verbose ‘SoapAdapter’] Responded to service state request
故障分析:
這個問題可能由于esx.conf檔案被鎖定導緻;
解決方案:
解除esx.conf檔案的鎖定狀态,方法如下:
1、登入到ESXi主機的本地指令行界面後執行如下指令:
1. #ls -l /etc/vmware/esx.conf.LOCK
2、執行如下指令删除掉該檔案:
1. #rm /etc/vmware/esx.conf.LOCK
3、執行如下指令重新開機管理服務:
1. $/sbin/services.sh restart
80、配置 Qlogic BIOS 實作 Boot from SAN
如果需要将ESXi/ESX伺服器配置為Qlogic BIOS實作SAN Boot,有很幾個地方需要配置。 首先需要激活 HBA BIOS,然後設定和激活標明的、用于啟動ESX的LUN,具體步驟如下:
1 、啟動伺服器時,按 Ctrl + Q 組合鍵進入到 Fast!UTIL 配置界面;
2 、進入之後執行下列步驟:
o 如果隻有一塊 HBA 卡, 則它會自動被標明,同時 Fast!UTIL 選項會出現;
o 如果有多塊 HBA 卡,則需要手動炫動需要設定的對象, 在 Select Host Adapter 螢幕上上下移動選
定需要設定的 HBA 卡後回車;
備注: SAN BOOT 建議盡可能使用較小的 HBA 卡 LUN 序号;
3 、 在 Fast!UTIL Options 界面選擇 Configuration Settings 後回車;
4 、在 Configratoin Settings 界面選擇 Host Adapter Settings 後回車;
5 、在 Host Adapter Settings 界面選擇 Host Adapter BIOS 後回車, 将值調整為 Enabled 模式, 這意味着為 HBA 卡激活 BIOS ;
6 、按 ESC 退出, 然後選擇 Selectable Boot Settings 後回車;
7 、在 Selectable Boot Settings 界面,選擇 Selectable Boot 後回車将值調整為 Enabled ;
8 、選擇在清單的中 Storage Processor ,標明第一個後回車打開 Select Fibre Channel Device 界面;
9 、選擇一個 Storage Processor ( SP ) 後回車;
備注: SAN BOOT 要求 SP 後面的 LUN 的 Target ID 盡可能小。 同時需要确認 SP 和 LUN 能夠最快被掃描到 .wwpn 順序不一定對應 Target ID 順序。如果存儲陣列處于 Active/Passive 模式, 則選擇的 SP 必須為 Active 路徑所在的 LUN 。 如果無法确認那個 SP 的 Target ID 更小, 則可以用存儲管理軟體确認一下;
10a 、如果 SP 後隻挂了一個 LUN 則它将會自動成為 BOOT LUN ,是以不用再進入到下一步;
10b 、如果 SP 後跟了 2 個以上的 LUN , 則需要在 Select LUN 界面裡選擇一個用于 SAN BOOT 後回車;
11 、 如果在清單裡還有其它存儲擴充卡, 則按 C 按鈕清除掉然後 ESC 二次後回車儲存設定, 完成設定。
81、Windows 7虛拟機無法通過RDP通路單可以用vSphere Client通路
故障狀态
無法通過RDP連接配接到Win7但是,可以通過vSphere Client連進去,通過Console查閱;
故障分析
這個問題一般都是由于Win7的休眠元件導緻;
解決方案
更改電源狀态設定,步驟如下:
1、打開虛拟機,進入到裡面,找到控制台,然後點Power Options選項;
2、點選Change when the computer sleeps,然後将Turn Off the display選項設為Never之後将Put the computer to sleep選項設為Never即可。
82、解決vSphere Client登入linux版vCenter失敗:cannot complete login due to an inc…
故障狀态
學生在做試驗時,用vSphere Client結合普通的AD User登入到系統提示如下錯誤資訊:
cannot complete login due to an incorrect user name or password
故障分析
這種問題,僅僅在選用Linux版本的vCenter時才會出現,Windows版本的問題不會出現這個問題,是由于過多的錯誤登入導緻vCenter Server鎖掉了這個賬戶;
解決方案
1、root權限登入到Linux版本vCenter伺服器;
2、在系統下執行如下指令:
/sbin/pam_tally –user [email protected] –reset
83、如何解決系統提示紅色警報但Alarms & Events裡看不到任何資訊
故障狀态
系統提示紅色感歎号的報警,可是在Alarms & Events裡看不到任何問題
解決方案
1、vSphere Client登入到vCenter Server,點選Hosts And Clusters選項;
2、點選Alarms頁标簽後點選Definitions.Note,選擇所有的Alarms,點選Remove;
方法二:
利用PowerCLI指令來完成,這就簡單多啰:
Get-AlarmDefinition | %{$_.ExtensionData.RemoveAlarm()}
方法三:
初始化vCenter Server Alarms,步驟如下:
1、vSphere Client登入到vCenter Server然後點選Administration -> vCenter Server Settings;
2、點選Advanced Settings,将alarm.version的值設為0;
3、将alarms.upgraded的值設為false,然後重新開機VMware VirtualCenter Server服務。
84、利用Web Client登入vCenter失敗:unable to connect to vCenter Inventory Service
故障狀态
從vCenter Server 4.1更新到5.0後,遇到如下類型的錯誤:
1、無法利用Web Client登入到到vCenter,系統提示如下錯誤資訊:
unable to connect to vCenter Inventory Service – https://xxxx:10443
2、好不容易登陸上去之後,vCenter Server裡的Health Status不顯示任何錯誤但是無法通路;
3、在C:ProgramDataVMwareInstrastructureInventory ServiceLogs目錄下的ds.log檔案下有類似如下錯誤:
Error connecting to peer:https://xxxx:10443 reason:
org.apache.http.conn.HttpHostConnectException:Connection to https://xxxx:10443 refused.
故障分析
這個問題一般都由于vCenter Inventory資料庫導緻;
解決方案
更新vCenter Inventory資料庫,步驟如下:
1、進入到Windows服務管理器找到vCenter Inventory Service服務,右擊,選擇Stop;
2、進入到指令行界面,删除掉所有Inventory Service目錄下的相關資料,預設位置:
C:Program FilesVMwareInfrastructureInventory Servicedata.
3、進入到如下目錄:C:Program FilesVMwareInfrastructureInventory Servicescripts;
4、執行如下指令重置vCenter Inventory Service資料庫:
、在服務管理器裡重新開機vCenter Inventory Service即可解決這個問題。
85、更改vSphere 5中虛拟機的快照delta檔案位置
預設情況下,快照産生的delta檔案都是和虛拟機的工作目錄放在一起的,有時候,我們出于性能和空間等多方面的因素考慮,不希望兩者同在,是以,可以通過如下步驟自行調整delta檔案的位置:
1、關閉虛拟機後右擊虛拟機點選Edit Settings;
2、點選Options頁标簽然後在Advanced Options選項裡點選General按鈕;
3、點選Configuration Parameters,點選Add Row;
4、在Name欄輸入snapshot.redoNotWithParent,在Value欄輸入true;
5、此時,重新開機即可。
備注:在快照管理中workingDir是一個比較重要的參數,在5.0以前,這個參數決定了所有快照檔案的工作目錄,預設是虛拟機的目前目錄,而在5.0以後雖然這個workingDir依然存在,不過,它隻能決定*.vmsn的檔案存放點,其它的檔案可以通過我們上面的snapshot.redoNotWithParent參數來在*.vmx檔案裡指定。
86、安裝vCenter Server 5.0失敗:JDBC connectivity to the database using the gener…
故障狀态
1、無法安裝vCenter Server 5.0;
2、安裝失敗後系統提示如下錯誤:
JDBC connectivity to the database using the generated JDBC URL failed.Please enter the URL to ensure that it connects to the desired database.
3、在VIMTOOL.Log檔案裡有類似如下錯誤資訊INFO] Invoking testdbprops “C:Userswpvb1AppDataLocalTemp2{1FBCB62E-6178-455F-ADE2-07957D81A7D4}VM4273.tmp”Testing DB connection from C:Userswpvb1AppDataLocalTemp2{1FBCB62E-6178-455F-ADE2-07957D81A7D4}VM4273.tmp: [2012-07-26 11:12:50 INFO] Config name=dummy
INFO] Property file=null
INFO] Loaded url from props=<not set>
INFO] Overrides=
INFO] prop:dbtype
INFO] prop:url
INFO] prop:password
INFO] prop:password.encrypted
INFO] prop:driver
INFO] prop:username
Error: The TCP/IP connection to the host VMhost, port 1433 has failed. Error: “Connection refused: connect. Verify the connection properties, check that an instance of SQL Server is running on the host and accepting TCP/IP connections at the port, and that no firewall is blocking TCP connections to the port.”.
[2012-07-26 11:13:05 SEVERE] Error in invocation of testdbprops
com.microsoft.sqlserver.jdbc.SQLServerException: The TCP/IP connection to the host VMhost, port 1433 has failed. Error: “Connection refused: connect. Verify the connection properties, check that an instance of SQL Server is running on the host and accepting TCP/IP connections at the port, and that no firewall is blocking TCP connections to the port.”.
at com.microsoft.sqlserver.jdbc.SQLServerException.makeFromDriverError(SQLServerException.java:170)
at com.microsoft.sqlserver.jdbc.SQLServerConnection.connectHelper(SQLServerConnection.java:1049)
at com.microsoft.sqlserver.jdbc.SQLServerConnection.login(SQLServerConnection.java:833)
at com.microsoft.sqlserver.jdbc.SQLServerConnection.connect(SQLServerConnection.java:716)
at com.microsoft.sqlserver.jdbc.SQLServerDriver.connect(SQLServerDriver.java:841)
at java.sql.DriverManager.getConnection(DriverManager.java:582)
at java.sql.DriverManager.getConnection(DriverManager.java:185)
at com.vmware.vim.common.vdb.VdbDataSource.getConnection(VdbDataSource.java:84)
at com.vmware.vim.vimtool.dbprops.TestDbProperties.testConnection(TestDbProperties.java:70)
at com.vmware.vim.vimtool.dbprops.TestDbProperties.invoke(TestDbProperties.java:53)
at com.vmware.vim.vimtool.VimTool.invokeTool(VimTool.java:156)
at com.vmware.vim.vimtool.VimTool.main(VimTool.java:94)
Error in invocation of testdbprops: com.microsoft.sqlserver.jdbc.SQLServerException: The TCP/IP connection to the host VMhost, port 1433 has failed. Error: “Connection refused: connect. Verify the connection properties, check that an instance of SQL Server is running on the host and accepting TCP/IP connections at the port, and that no firewall is blocking TCP connections to the port.”.
故障分析
主要發生在SQL伺服器的預設端口不是1443導緻的;
解決方案
安裝vCenter Server的過程中會生成和驗證JDBC URL,由于預設走的是1443端口,當變更了端口之後,安裝時,就可以輸入正确的JDBC位址,例如:
jdbc:sqlserver://xxxx:port;databaseName=vcdb
如果選用的是Local Express版本的DB時,則采用如下配置:
jdbc:sqlserver://localhost\SQLEXP_VIM;databaseName=VIM_VCDB;integratedSecurity=true
87、 啟動RHEL Linux虛拟機提示:Cannot setup NMI watchdog on CPU
故障狀态
啟動RHEL的Linux虛拟機時,Console提示如下資訊:
Cannot setup NMI watchdog on CPU 0
Cannot setup NMI watchdog on CPU 1
Cannot setup NMI watchdog on CPU 2
Cannot setup NMI watchdog on CPU 3
故障分析
主要時部分Linux作業系統卻更新活了支援Non Maskable Interrupt(NMI),而它會依賴硬體watchdog服務來監控系統是否由于硬體故障導緻的異常;
不是所有硬體都支援NMI的,是以,當虛拟機選擇最新的8和7這個虛拟機硬體版本時,容易出現這個問題;
解決方案
關閉掉這個Non Maskable Interrupt(NMI)功能,步驟如下:
1、進入到這台Linux虛拟機的指令行界面,然後運作如下指令:
#vi /boot/grub/menu.lst
2、在打開的檔案裡,更改nmi_watchdog的值,從1改為0,例如:
t itle Red Hat Enterprise Linux Server (2.6.18-128.el5)
root (hd0,0)
kernel /vmlinuz-2.6.18-128.el5 ro root=/dev/sda nmi_watchdog=0
initrd /initrd-2.6.18-128.el5.img
3、儲存退出後重新開機虛拟機再觀察是否正常。
88、vCenter更新到5.0後隻剩Real time的Performance資料可用
故障狀态
1、更新到vCenter Server 5.0後,Performance資料不再能收集并存存放了;
2、在vCenter Server的Real Time performance裡面隻能看到實時資料;
3、過去的一些統計資料依然可以在Overview和Advanced Charts裡看到;
4、在vCenter Server的vpxd日志檔案裡,有類似如下錯誤資訊:
Hint ‘noexpand’ on object ‘VPXV_counter_device’ is invalid.failed to execute process_temptable[0-2]
故障分析
這個問題是由于VPXV_DEVICE_COUNTER這種資料表的索引資訊丢失導緻,驗證這些Index是否有問題,可以通過如下步驟來完成:1、利用SQL Management Studio打開vCenter Server的資料庫表;
2、找到對應的表後,找到VPXV_DEVICE_COUNTER然後可以看到類似如下的索引資訊:
VPXI_DEVICE_COUNTER_ENTITY
VPXI_DEVICE_COUNTER_INDEX
VPXI_DEVICE_COUNTER_NAME
VPXI_DEVICE_STAT_ID_IDX
3、如果有,則表示正常,如果沒有則需要按照如下方式解決;
解決方案
如果沒有上述幾個索引資訊,則按照如下步驟處理:
1、連接配接到vCenter Server之後進入到如下目錄:C:Program FilesVMwareInfrastructureVirtualCenter Server,找到VCDB_mssql.sql這個安裝腳本,利用文本打開,建立缺失的索引:
create uOUNTER_NAME_IDX on VPXV_DEVICE_COUNTER(device_name)
;
CREATE INDEX VPXI_DEVICE_STAT_ID_IDX on VPXV_DEVICE_COUNTER(stat_id)
;
2、利用SQL Management Studio打開vCenter Server的資料庫,然後執行第二步中的那個VCDB_mssql.sql腳本,點選Execute,然後在VPXV_DEVICE_COUNTER驗證是否索引正常。
89、重定向VUM的日志到Syslog伺服器後掃描ESXi 5.0失敗
故障狀态 1、将VMware Update Manager日志重定向到Syslog伺服器後掃描ESXi 5.0失敗; 2、系統提示如下錯誤資訊:VMware vSphere Update Manager had an unknow error 3、在VMware Update Manager的日志資訊裡包含類似如下錯誤資訊: [2012-02-27 16:07:48:406 ‘scanHost20’ 3348 ERROR] [hostUpdateBase, 695] Platform Configuration Error: /usr/sbin/esxupdate returned no results, exit status: 1 [2012-02-27 16:07:48:469 ‘VcTaskMonitor’ 3348 DEBUG] [vcTaskMonitor, 60] VcTaskMonitor destroyed for session[522d9d1d-5e88-7f2b-d7fa-5f3d650e1f9a]5237c999-7888-49dd-f065-0191254e9fbb [2012-02-27 16:07:48:469 ‘SingleHostScanTask.SingleHostScanTask{9}’ 3348 ERROR] [singleHostScanTask, 399] SingleHostScan caught exception: Platform Configuration Error: /usr/sbin/esxupdate returned no results, exit status: 1 with code: -1 [2012-02-27 16:07:48:484 ‘SingleHostScanTask.SingleHostScanTask{9}’ 3348 ERROR] [vciTaskBase, 564] Task execution has failed: Platform Configuration Error: /usr/sbin/esxupdate returned no results, exit status: 1 故障分析 這個問題一般都是由于vmsyslogd服務沒有正常運作導緻; 解決方案 确認vmsyslog服務正常運作,步驟如下: 1、執行如下指令确認vmsyslogd服務是否正常運作: #ps | grep vmsyslogd 備注:如果沒有任何輸出資訊,則表示服務沒有運作; 2、如果沒有運作,則執行如下指令啟動這個服務: 3、可以執行如下指令重新載入vmsyslogd服務: #esxcli system reload 4、再次驗證vmsyslogd服務的運作狀态是否正常: #ps | grep vmsyslogd 90、 檢視ESXi主機的管理服務的運作狀态方式 1、打開DUCI的Local ESXi Shell,然後Alt+F1進入到指令界面; 2、執行如下指令檢視hostd服務是否正常運作: /etc/init.d/hostd status 輸出類似如下結果: hostd is running 3、如果ESXi主機有連接配接到vCenter Server則還可以檢視vCenter Server位于ESXi主機上的Agent是否正常: /etc/init.d/vpxa status 輸出類似如下結果: vpxa is running 91、 vCenter Server 5.0 Update1的Service Status頁标簽顯示License Services警報 故障狀态 1、vCenter Service Status頁标簽顯示License Services警報; 2、系統提示如下錯誤警報: Threshold Usage Tracking service Alert Cannot obtain user-defined license thresholds Asset properties History service Alert Cannot store hosts’ MAC addresses in the vCenter Server database Assignments Feeding service Alert Cannot obtain license assignments for VRAM usage License Usage History service Alert Cannot store license usage in vCenter Server database 故障分析 這個問題一般都是由于當更新vCenter Server到U1時VirtualCenter Management Webservices運作在AD賬戶下,這就可能導緻Update之後的賬戶比對關聯丢失,進而導緻服務無法啟動; 解決方案 1、進入到Windows的服務管理器,然後打開VMware VirtualCenter Management Webservices的Properties選項; 2、點選Log On的頁标簽,更改賬戶關聯,然後重新開機服務即可。 92、 位于ESXi 5.0上的Solaris的虛拟機上安裝VMware Tools并更改MTU為9000 更改MTU值為9000的目的是激活支援Jumbo Frames,好處在于可以加大機關時間的最大傳輸單元,步驟如下: 1、首先确認為Solaris虛拟機添加了VMXNET3網路卡和VMware Tools; 2、接着在Solaris指令行下面執行如下指令: #ndd -set /dev/vmxnet3s0 accept-jumbo 1 3、然後将MTU值設定為9000,可以執行如下指令: #ifconfig vmxnet3s0 mtu 9000 4、然後可以執行如下指令測試是成功為其配置了MTU: ping -s 9000 solaris_ip 或 ping -s xxxx 9000 4 備注:如果想關閉MTU則執行如下指令: #ndd -set /dev/vmxnet3s0 accept-jumbo 0 ifconfig vmxnet3s0 mtu 1500 93、解決系統提示: Virtual machine disks consolidation is needed 提示 在 vSphere 5 環境中,有可能出現一種情況,虛拟機存在快照,但是,在虛拟機的快照管理器裡卻看不到任何快照資訊,而在虛拟機的目錄裡,卻可以看到虛拟機的快照 delta 檔案,提示如下錯誤資訊: 系統會彈出是否确實要做 Consolidate ,如果确認,點選 Yes 按鈕即可, 完成之後, 可以通過進入到虛拟機所在的 Datastore 裡,就可以看到所有的 delta.vmdk 檔案都已經被整合處理。 如果想要快速找到所有有需要做 Consolidate 的虛拟機,可以用如下 PowerCLI 指令: Get-VM | Where {$_.ExtensionData.Runtime.consolidationNeeded} | Select Name 95、如何手動備份Windows 2008系統vCenter Server的ADAM資料庫
96、安裝SRM提示“系統管理者設定了系統政策,禁止進行此安裝” 故障狀态 解決方法 1、打開“開始->控制台->管理工具->本地安全政策” 2、點選“軟體限制政策”,如果提示“沒有定義軟體限制政策”,那麼就右鍵“建立軟體限制政策” 3、建立後,輕按兩下右側“強制”,選擇“除本地管理者以外的所有使用者”,确定。 97、主機從vCenter Server随機斷開連接配接,但又立即重新連接配接到vCenter Server 故障狀态: 主機從vCenter Server上随機斷開進入無響應狀态,但又立即重新連接配接到vCenter Server 故障分析: 這很有可能是由于網絡不是特别穩定或網絡流量太大導緻,另一方面也可能是由于vCenter Server時間同步導緻。 解決方案: 1、用ping指令一直跟蹤主機,檢視是否資料包有延時或丢包的現象。 2、如果 vCenter Server 上的系統時間調快了一分鐘以上(如由于 vCenter Server 計算機上安裝的時間同步軟體的調整),那麼主機可能在很短的一段時間内顯示為從 vCenter Server 斷開連接配接,但又立即重新連接配接回 vCenter Server。VMware vSphere4.1和5.0均存在此情況,請盡快更新到5.0.1. 98、嘗試檢視虛拟機存儲配置檔案時,vSphere Client 顯示一條錯誤消息 故障狀态: 當vSphere Client連接配接到vCenter Server并嘗試檢視虛拟機的存儲配置檔案時,可能顯示以下錯誤消息:VC 無法連接配接到 http:///sps/sdk 位置處的Profile-Driven Storage Service (VC is unable to connect to Profile-driven storage service at http:///sps/sdk)。當存儲配置檔案服務和另一服務都配置為使用端口 31000 時,會發生端口沖突。vSphere Web Client 和 vCenter Orchestrator 可導緻此沖突。 解決方案: 重新啟動 vSphere Web Client 服務和 vCenter Orchestrator 配置服務。當重新啟動這些服務時,它們将選擇下一個可用端口。如果計算機上隻存在或運作其中一個服務,您隻需重新啟動該服務。 99、vCenter Server 5.0 虛拟機可能會在清單中顯示紅色警告圖示 故障狀态: 在 vCenter Server 5.0 中,一些虛拟機可能會在清單中顯示紅色警告圖示,然而虛拟機的 [警報] 頁籤卻并未訓示已觸發任何警報。在打開和關閉虛拟機電源時會出現此情況。 解決方案: 在受影響的 ESX/ESXi 主機上重新啟動管理代理。 重新啟動 vCenter Server 服務。 從清單中移除 ESX/ESXi 主機,然後通過 vCenter 重新注冊該主機。 移除并重新注冊受影響的虛拟機。 上述都是臨時的解決方式,VMware暫時未修正此BUG。 100、vCenter Server 更新失敗并顯示以下錯誤: 系統管理者已設定政策以阻止此安裝(和96類似) 故障狀态: vCenter Server 更新失敗并顯示以下錯誤: 系統管理者已設定政策以阻止此安裝 (The system administrator has set policies to prevent this installation) 如果計算機沒有足夠的連續記憶體供 Windows Server 2003 或 Windows XP 驗證 .msi包或 .msp包具有正确的簽名,就會發生此問題。 解決方案: 從 Windows 的 [開始] 菜單中,選擇 [運作],鍵入 [control admintools] 并單擊 [确定]。 輕按兩下 [本地安全政策]。 選擇 [軟體限制政策]。 如果沒有列出軟體限制,則右鍵單擊 [軟體限制政策] 并選擇 [建立政策]。 在 [對象類型] 下,輕按兩下 [強制]。 選擇 [除本地管理者以外的所有使用者],并單擊 [确定]。 重新啟動計算機,然後重試 vCenter Server 更新。 101、ESXi/ESX 主機上檢測不到實體網卡的故障排查方式 故障狀态: 1 、 ESXi/ESX 主機無法識别實體網卡; 2 、執行如下指令也看不到網卡清單: 1. #esxcfg-nics -l 故障分析: 這種問題可能有很多種原因, 可能是不在 HCL 裡面, 可能是驅動版本不對, 也可能是其它因素, 下面簡單 介紹處理方式; 解決方案: 1 、執行如下指令看看能不能看到實體網卡: 1. #lspci -v | less 看看網卡有沒有出現在輸出清單裡,如果有,記錄下 PCI slot 和 bus 号,格式為: xx:xx ; 2 、根據第 1 步輸出的資訊執行如下指令來确認網卡的生産 ID 和裝置 ID ( VID 和 DID ): 1. #lspci -n | grep xx:xx 2. 3. 備注:這裡的 xx:xx 是第一步指令所得的結果; 3 、根據上面的輸出結果确認網卡是否在官方的 HCL 支援清單裡,如果在清單裡則繼續,如果不在, 則到 此為止,更換網卡; 4 、确認是否裝載了合适的驅動: For ESXi : 1. #vmkload_mod -l | grep < 驅動名稱 > For ESX : 1. #rpm -qa | grep < 驅動名稱 > 5 、如果驅動沒有加載,則需要安裝一下, 首先是需要到官網下載下傳合适的驅動版本,然後執行如下指令更 新: 1. #esxupdate –bundle=xxx.zip update 6 、完成後重新開機主機即可 ; 7 、如果網卡還是沒有檢測到,則要收集日志檔案來分析了: ESXi 的日志檔案路徑為: 1. /var/log/messages 2. /var/log/vmware/hostd-0.log ESX 的日志檔案路徑為: 1. /var/log/vmkernel 102、vCenter Server Heartbeat必須禁止TCP Offload Engine 故障狀态 當為網卡激活TOE時安裝完成的vCenter Server Heartbeat可能存在以下問題: 1、作業系統啟動失敗表現形式可能為藍屏; 2、安裝了包過濾但是并沒有任何作用且在網絡中伺服器并不可見; 故障分析 這個問題一般都是由于vCenter Server Heartbeat不支援TCP Offload Engine的原因導緻; 解決方案 vCenter Server Heartbeat和TOE并不相容,是以需要盡緻TOE子產品: a.Offload IP Security b.Offload TCP Segmentation c.Offload TCP/IP Checksum 禁止的方法如下: 1、在計算機裝置管理裡面找到網卡屬性的進階選項; 2、解除安裝掉Packet Filter: a.停止掉vCenter Server Heartbeat服務和NFserverR2服務; b.如果有利用軟體做網卡綁定,則接觸綁定; c.如果是在備機上解除安裝,則最好拔掉網線; d.指令行切換到C:VMwarevCenter Server Heartbeatr2bin執行下列面命: nfpktfltr uninstall “VMwarevCenter Server Heartbeatr2driversnfpktfltr” e.删除掉system32driversnfpktfltr.sys和所有nfpktfltr開頭的檔案; f.進入系統資料庫确認下列鍵值被成功删除掉: HKLMSYSTEMCurrentControlSetEnumRootnfpktfltr_mp HKLMSYSTEMCurrentControlSetServicesnfpkfltr 安裝Packet Filter: 1、停止掉vCenter Server Heartbeat和NFserverR2服務; 2、指令行切換到VMwarevCenter Server Heartbeatr2bin執行下列指令: nfpktfltr install “VMwarevCenter Server Heartbeatr2bin” 3、打散網卡的Team(如果有),然後重建Team; 4、重新開機服務或伺服器。 103、在ESXi5.0上安裝第三方provider(可檢視RAID健康狀态等) 自從VMware釋出ESXi有了免費授權以後,公司裡還有自己手裡的測試機裝了不少VMware ESXi,在不配盤櫃不使用外部存儲的情況下,在ESXi4.x版本上均不支援本地磁盤超過2T,其實原因是因為4.x對本地磁盤分區使用MBR,而MBR限制在2T。 而我手裡的N台ESXi主機,都很無奈的建立了若幹個2T的VD來使用,用起來有點不爽。 在VMware釋出ESXi5.0後,發現它已經支援GPT分區,可以建立超過2T的資料存儲,于是考慮順便攢台裝ESXi5.0的主機,經過一番搜尋,發現目前最便宜的支援ESXi的RAID是Dell PERC 5I,在taobao上買了2塊,因為是自己折騰用,是以沒有配電池,最近硬碟瘋狂漲價,隻好把手裡的一台nas伺服器的4塊2T硬碟拆下來用。 一切都準備好,開始裝系統,由于5.0原生就支援将ESXi安裝到U盤,是以就把ESXi裝到了U盤上,4塊2T硬碟組了個6T的raid5,安裝都很順利,不過登陸到vSphere Client上發現,原來在健康狀況-傳感器裡可以看到的raid卡狀态,在5.0上消失了,經過一番搜尋得出結論,vmware官方取消了所有第三方的provider,如果需要的話,得自己安裝自己raid卡對應的cim provider。以下是幾個參考連結(都是英文的) http://communities.vmware.com/thread/327238 http://tinkertry.com/lsi92658iesxi5/ 需要手動安裝的vib檔案在這裡下載下傳 http://downloads.vmware.com/d/details/dt_esxi50_lsi_2108_v534/dHRAYnRqZWRiZHAlZA== http://www.lsi.com/Search/Pages/downloads.aspx?k=vib&r=os%3D%22AQ5WTVdhcmUgRVNYIDUueAJvcwECXiICIiQ%3D%22 安裝方法比較簡單,稍微懂點Linux的就可以操作,以下是流水賬 将下載下傳下來的兩個檔案解壓縮,其實就需要裡面的兩個vib檔案 scsi-megaraid-sas-5.34-1vmw.500.0.0.406165.x86_64.vib vmware-esx-provider-LSIProvider.vib 在ESXi上開啟SSH,用Winscp将這兩個檔案拷貝到/tmp,再用putty或者其他的終端連入ESXi,輸入以下指令即可 esxcli software vib install -v /tmp/scsi-megaraid-sas-5.34-1vmw.500.0.0.406165.x86_64.vib esxcli software vib install -v /tmp/vmware-esx-provider-LSIProvider.vib 安裝完以後重新啟動ESXi以後,就可以在健康狀況裡看到RAID卡的各種狀态 104、分析、 解決 IOPS 導緻的虛拟機/存儲性能下降和虛拟機磁盤延時較大的問題 故障狀态: 1 、虛拟機性能較低; 2 、在執行備份時磁盤延時很厲害; 3 、虛拟磁盤 vmdk 延時較大; 故障分析: 這種問題基本都是由于虛拟機沒有足夠的IO Per Second(IOPS),或者IOPS低于30; 解決方案: 在解決問題前, 首先要解決以下兩個問題: 問題 1 :什麼是 IOPS ? IOPS 全稱為 Input/Output Per Second , 它是衡量一個磁盤(虛拟磁盤和實體磁盤)、存儲的基本也是十分重要的标準。不同的磁盤、 存儲有着不同的 IOPS 。 IOPS 的高低直接會影響着系統的性能。 目前, VMware 虛拟化環境中最大的瓶頸也就在于這個 IOPS 。針對資料密集型業務的資料庫業務和流媒體業務,由于它們的 IOPS 很大, 是以在虛拟化環境中部署它們一定要充分考量它們的負載, 也就是 IOPS 大小,結合實際的存儲性能來檢視是否符合業務标準。 問題 2 :如何計算 IOPS ? 目前的儲存設備都有自己的基本 IOPS 标準,主流接口單盤的 IOPS 如下:
在伺服器領域,這列( RAID ) 是最常見的一種基本裝置, 基本所有伺服器都會做陣列, 而服務的陣列通常會有多個磁盤構成,這些磁盤自身的 IOPS 組合在一起, 根據陣列卡的性能和磁盤本身的轉數、 接口更新檔, 基本可以起到 IOPS 的疊加效果, 就拿 7200RPM 的磁盤而言, 假設 10 個 7200RPM 的磁盤做 RAID0 陣列, 那麼, IOPS 理論上的 IOPS 值至少可達 100×10=1000 。 如何計算每台虛拟機的 IOPS ? 要想計算每個虛拟機的總的 IOPS 數量, 首先就要确認磁盤類型以及它們的 IOPS 是多少。 處于 RAID 陣列裡面的每個盤的 IO 有利于增長整體存儲的可用 IOPS 。 而位于這個存儲上面的單台虛拟機的 IOPS ,則可以通過将這個存儲的總 IOPS 除掉虛拟機數量即可基本得到單台虛拟機的 IOPS 。 現實案例: 假定有 6 顆 10000RPM 的磁盤,那麼它們的總的可用 IOPS 大約為 150×6=900 。如果 LUN 上面運作的虛拟機數量為 50 個, 則單台虛拟機的 IOPS 為 900/50=18 IOPS 。如果以這個為标準,則意味着虛拟機的性能相對底下。 如果想要滿足虛拟機的基本 IOPS 需求, 那麼應該為 900/30=30 , 也就是說同一個 Volume 裡 IOPS 為 30 (最低要求) 虛拟機需要數量控制在 30 台以下。 備注:備份存儲會消耗更多的 IOPS , 同時也會給 Volume 帶來更多額外的符合。如果是這樣, 則需要用額外手段解決備份時的額外資源消耗; 105、vSphere 5.0 裡指令行操作 ESXi 主機的詳細資料 檢視ESXi主機版本号:#esxcli system version get 設定系統時間:#esxcli system time set –hour 00 –min00 –sec00 設定Banner消息:#esxcli system welcomemsg set –message content> 配置遠端Log主機:#esxcli system syslog config set –loghost=x.x.x.x #esxcli system syslog reload 将主機加入到 Active Directory ( vCLI ): #vicfg-authconfig –server x.x.x.x –username <username –password –authscheme AD –joindomain <domain_name –adusername –adpassword 驗證 AD 域資訊( vCLI ):#vicfg-authconfig –server x.x.x.x –authscheme AD -c ESXi 進入 / 退出維護模式( vCLI ):#vicfg-hostops –operation [enter|info|exit] 關閉 / 重新開機單一 ESXi 主機( vCLI ): #vicfg-hostops –operation [shutdown|reboot] 備份主機配置檔案( vCLI ):#vicfg-cfgbackup -s /path/filename 恢複主機配置檔案( vCLI ):#vicfg-cfgbackup -r /path/filename 列出主機目前所加載的 Module:#esxcli system module list –enable=true 106、開啟FT顯示硬體虛拟化未啟用HV 使用 vSphere Fault Tolerance 之前,必須啟用硬體虛拟化 (HV) 。 故障狀态: 嘗試打開啟用了 Fault Tolerance 的虛拟機的電源時,如果未啟用 HV ,則可能會顯示一條錯誤消息。 故障分析: 通常情況下, 出現此錯誤的原因是: 對于您嘗試在其上打開虛拟機電源的 ESXi 伺服器, HV 在其上不可用。 硬體虛拟化不可用的原因可能是其不受 ESXi 伺服器硬體支援或未在 BIOS 中啟用。 解決方法: 如果 ESXi 伺服器硬體支援硬體虛拟化,但目前未啟用硬體虛拟化,請在該伺服器的 BIOS 中将其啟用。各種 BIOS 中啟用硬體虛拟化的過程不同。請參見主機的 BIOS 文檔以擷取有關如何啟用硬體虛拟化的詳細資訊。如果 ESXi 伺服器硬體不支援硬體虛拟化,請切換到使用支援 Fault Tolerance 的處理器的硬體。 107、開啟FT顯示無相容主機可用于輔助虛拟機 故障狀态: 如果打開啟用了 Fault Tolerance 的虛拟機的電源, 但沒有為輔助虛拟機提供任何相容主機, 可能會顯示一條錯誤消息。 “近期任務”窗格中可能會顯示以下錯誤消息: 輔助虛拟機無法打開電源,因為沒有相容主機可以容納該虛拟機。 故障分析: 這可能是由多種原因造成的,包括群集内沒有其他主機、沒有其他已啟用硬體虛拟化的主機、資料存儲不可通路、可用容量不足或主機正處于維護模式中。 解決方法: 如果主機數量不足,請向群集内添加更多主機。如果群集内有多台主機,請確定它們支援硬體虛拟化且硬體虛拟化已啟用。各種 BIOS 中啟用硬體虛拟化的過程不同。請參見主機的 BIOS 文檔以擷取有關如何啟用硬體虛拟化的詳細資訊。檢查主機是否有足夠容量,并确認它們未處于維護模式中。 108、開啟FT過載主機上的輔助虛拟機降低主虛拟機的性能 如果主虛拟機的執行速度似乎緩慢,即便它所在主機上的負載較輕且有空閑 CPU 時間,也請檢查運作輔助虛拟機的主機是否負載較重。 故障狀态: 當輔助虛拟機所在的主機負載過重時,這會影響主虛拟機的性能。 此問題的症狀是主虛拟機“ Fault Tolerance ”面闆上的“ vLockstep 時間間隔”訓示器為黃色或紅色。這表示輔助虛拟機比主虛拟機的運作慢數秒。 在這種情況下, Fault Tolerance 将減慢主虛拟機的速度。 如果“ vLockstep 時間間隔”訓示器長時間保持為黃色或紅色,則充分表明輔助虛拟機未能擷取足夠的 CPU 資源,是以跟不上主虛拟機的速度。 故障分析: 在 CPU 資源過載的主機上運作的輔助虛拟機擷取的 CPU 資源與主虛拟機擷取的 CPU 資源數量可能不同。當出現此情況時,主虛拟機必須減速以使輔助虛拟機跟進,将主虛拟機的執行速度大大降低至輔助虛拟機的較慢速度。 解決方法: 要解決此問題, 請為主虛拟機設定明确的 CPU 預留( 以 MHz 為機關), 該預留應足以在所需性能級别上運作負載。此預留對于主虛拟機和輔助虛拟機均适用,能夠確定兩者均能以指定的速率執行。有關設定此預留的指導,請在啟用 Fault Tolerance 前檢視虛拟機的性能圖表以檢視在正常條件下使用的 CPU 資源量。 109、Fault Tolerant 虛拟機故障切換 即使主虛拟機或輔助虛拟機的 ESXi 主機未崩潰,主虛拟機或輔助虛拟機也可進行故障切換。在這種情況下,虛拟機執行不會中斷, 但會臨時失去備援。 要避免此類故障切換, 請了解可能會出現此類故障切換的一些情況,并采取措施進行避免。 與存儲器有關的部分硬體故障 當存儲器通路緩慢或無法通路某台主機時,可能出現此問題。此問題發生時, VMkernel 日志中将列出許多存儲器錯誤。要解決此問題,必須解決與存儲器有關的問題。 與網絡有關的部分硬體故障 如果日志記錄網卡不能正常工作或通過該網卡與其他主機的連接配接斷開,将觸發容錯虛拟機進行故障切換,進而重建立立備援。要避免此問題,請将每個獨立網卡專門用于 vMotion 和 FT 日志記錄通信,并僅在虛拟機活動較少時執行 vMotion 遷移。 日志記錄網卡網絡上的帶寬不足 如果主機上有過多的容錯虛拟機, 則會發生此問題。 要解決此問題, 請将容錯虛拟機對分布到更多的不同主機上。 由虛拟機活動級别引起的 vMotion 故障 如果通過 vMotion 遷移容錯虛拟機失敗, 則虛拟機可能需要進行故障切換。 此問題通常在虛拟機過于活躍( 因而無法在對其造成最小損壞的情況下完成遷移) 時發生。 要避免此問題, 請隻在虛拟機活動較少時執行 vMotion 遷移。 VMFS 卷上活動過多可能會導緻虛拟機故障切換 在單一 VMFS 卷上執行大量檔案系統鎖定操作、虛拟機打開電源 / 關閉電源或 vMotion 遷移時,可能會觸發容錯虛拟機進行故障切換。可能發生此現象的症狀為在 VMkernel 日志中收到許多有關 SCSI 預留的警告。要解決此問題, 請減少檔案系統操作的數量, 或確定容錯虛拟機位于 VMFS 卷上, 而且該卷上沒有大量定期打開電源 / 關閉電源或使用 vMotion 進行遷移的其他虛拟機。 檔案系統空間不足導緻無法啟動輔助虛拟機 請檢查 /(root) 或 /vmfs/ datasource 檔案系統中是否有可用空間。這些檔案系統可能會因多種原因而變得空間已滿,空間不足會導緻您無法啟動新輔助虛拟機。 110、嘗試使用附加的 USB 裝置遷移虛拟機時的錯誤消息 将多個 USB 裝置從 ESXi 主機連接配接到虛拟機且一個或多個裝置未啟用 vMotion 功能時,通過 vMotion 進行遷移将無法繼續并會發出一條并不十分明确的錯誤消息。 故障狀态: 遷移虛拟機向導會在遷移操作開始之前運作相容性檢查。如果檢測到不受支援的 USB 裝置,相容性檢查會失敗,并顯示一條與以下類似的錯誤消息: 目前已連接配接的裝置“ USB 1 ”使用不可通路的備用“ path:1/7/1 ” 。 故障分析: 将 USB 裝置從主機連接配接到虛拟機時,必須選擇虛拟機上的所有 USB 裝置, vMotion 遷移才能成功。如果一個或多個裝置未啟用 vMotion 功能,遷移将失敗。 解決方法: 1 請先確定裝置未處在傳輸資料的程序中,然後再删除裝置。 2 對每個受影響的 USB 裝置重新添加和啟用 vMotion 。 111、USB 直通裝置不響應 可能有多種原因導緻 USB 裝置不響應, 包括非安全地中斷資料傳輸, 或客戶機作業系統驅動程式向裝置發送不受支援的指令。 故障狀态: USB 裝置不響應。 故障分析: 資料傳輸被中斷或使用了不支援的裝置。例如,如果客戶機驅動程式向某些不受支援的 USB 閃存驅動器發送 SCSI REPORT LUNS 指令,裝置會停止響應所有指令。 解決方法: 1 從 ESXi 主機以實體方式分離 USB 裝置并重新附加該裝置。 2 完全關閉主機(并非重置)并保持關閉狀态至少 30 秒,以確定主機 USB 總線電源完全關閉。 112、從模闆中完成克隆或部署後,虛拟機不會打開電源 故障狀态: 當從模闆中克隆或部署虛拟機時,可以在“即将完成”頁面上選中建立後打開此虛拟機電源複選框。但虛拟機在建立後可能不會自動打開電源。 故障分析: 建立虛拟機磁盤時,未預留交換檔案大小。 解決方法 n 減小虛拟機所需的交換檔案的大小。可以通過增加虛拟機記憶體預留白間來實作。 a 在 vSphere Client 清單中,右鍵單擊虛拟機并選擇編輯設定。 b 選擇資源頁籤,然後單擊記憶體。 c 使用“預留”滑塊增加配置設定給虛拟機的記憶體量。 d 單擊确定。 n 或者,可以通過将其他虛拟機磁盤從交換檔案正在使用的資料存儲中移出來增加交換檔案的可用空間量。 a 在 vSphere Client 清單中,選擇一個資料存儲,然後單擊虛拟機頁籤。 b 對于每個要移動的虛拟機,右鍵單擊虛拟機,然後選擇遷移。 c 選擇更改資料存儲。 d 繼續完成遷移虛拟機向導。 n 另外,可以通過将交換檔案位置更改為具有足夠空間的資料存儲來增加交換檔案的可用空間量。 a 在 vSphere Client 清單中,選擇主機,然後單擊配置頁籤。 b 在“軟體”下,選擇虛拟機交換檔案位置。 c 單擊編輯。 注意 如果主機屬于指定虛拟機交換檔案與虛拟機存儲在同一目錄的群集,則無法單擊編輯。您必須 使用“群集設定”對話框更改群集的交換檔案位置政策。 d 從清單中選擇資料存儲,然後單擊确定。 113、排除 vCenter Server 插件故障 對于 vCenter Server 插件未正常運作的情況,有多種方法可更正問題。 在 Tomcat 伺服器上運作的 vCenter Server 插件擁有一些 extension.xml 檔案, 其中包含可通路相應的 Web 應用程式的 URL 。這些檔案位于 C:Program FilesVMwareInfrastructureVirtualCenterServerextensions 中。擴充安裝程式使用計算機的 DNS 名稱填充這些 XML 檔案。 來自統計資訊 extension.xml 檔案的示例: https://www.xxx.com:8443/statsreport/vicr.do 。 使用這些檔案的 vCenter Server 、插件伺服器和 vSphere Client 必須位于同一域下的系統中。如果它們不在同一域下,或插件伺服器的 DNS 發生了更改,則插件用戶端将無法通路 URL ,且插件将不能正常工作。通過使用 IP 位址替換 DNS 名稱,可以手動編輯 XML 檔案。在編輯插件的 extension.xml 檔案後,重新注冊該插件。 114、連結模式故障排除 如果在使用連結模式組時遇到問題,請考慮以下幾點。 當有多個 vCenter Server 執行個體時,每個執行個體都必須與域控制器存在工作關系且與域中的另一個計算機不沖突。 例如, 當對正在虛拟機中運作的 vCenter Server 執行個體進行克隆時, 如果沒有使用 sysprep 或類似實用程式確定克隆的 vCenter Server 執行個體擁有全球唯一辨別符 (GUID) ,就會發生沖突。如果域控制器無法通路, vCenter Server 可能無法啟動。您可能無法更改受影響的 vCenter Server 系統的連結模式配置。如果發生此情況,請在域控制器中解決該問題,并重新啟動 vCenter Server 。如果無法在域控制器中解決該問題,可以通過從域中移除 vCenter Server 系統并将該系統與其目前的連結模式組隔離,來重新啟 動 vCenter Server 。 計算機的 DNS 名稱必須與計算機的實際名稱相比對。 計算機名稱與 DNS 名稱不比對的症狀為出現資料複制問題、嘗試搜尋時票據錯誤和丢失遠端執行個體的搜尋結果。 注意 確定 Windows 和基于網絡的防火牆配置為允許連結模式。 加傳入連結接模式組 以下操作順序為加傳入連結接模式組的正确順序。 步驟 1 驗證 vCenter Server 域名是否與計算機名稱相比對。 如果不比對, 則需更改一個名稱或同時更改兩個名稱使它們相比對。 2 更新 URL 以使它們與新域名和計算機名稱相容。如果不更新 URL , vCenter Server 的遠端執行個體将無法通路 vCenter Server 系統,因為預設的 URL 條目已不再準确。 3 将 vCenter Server 系統加傳入連結接模式組。如果 vCenter Server 的遠端執行個體無法再通路某個 vCenter Server 執行個體,可能會出現以下症狀: n 登入組中其他 vCenter Server 系統的用戶端無法檢視屬于對其更改域名的 vCenter Server 系統的資訊,因為使用者無法登入該系統。 n 目前登入 vCenter Server 系統的所有使用者都可能會斷開連接配接。 n 搜尋查詢無法傳回 vCenter Server 系統的結果。 要解決這些問題,請確定 Virtualcenter.VimApiUrl 項指向 vSphere Client 和 SDK 用戶端可以通路 vCenter Server 系統的位置, 而 Virtualcenter.VimWebServicesUrl 項則指向 vCenter Server Webservices 的安裝位置。對于 Virtualcenter.Instancename 項,更改值以便修改後的名稱顯示在 vCenter Server 清單視圖中。 下一步 如果無法連接配接 vCenter Server 執行個體,可以使用以下操作解決問題: n 確定計算機已分組至對應域控制器中的正确組織單元。 n 在安裝 vCenter Server 時,確定登入的使用者帳戶在計算機上擁有管理者特權。 n 要解決計算機和域控制器之間的信任問題,請将計算機從域中移除,然後重新将其加入到域中。 n 要確定 Windows 政策緩存已更新, 請從 Windows 指令行運作 gpupdate /force 指令。 此指令将執行組政策更新。 如果本地主機在加入操作期間無法通路遠端主機,請驗證以下情況: n 遠端 vCenter Server IP 位址或完全限定域名是否正确。 n 遠端 vCenter Server 上的 LDAP 端口是否正确。 n VMwareVCMSDS 服務是否正在運作。 115、由于故障切換資源不足而無法打開虛拟機電源 故障狀态: 當嘗試打開 vSphere HA 群集中某個虛拟機的電源時,可能會出現 故障切換資源不足 (not enough failover resources) 錯誤。 如果選擇“群集允許的主機故障數目”接入控制政策且出現某些問題,則可能由于資源不足而無法打開虛拟機電源。 故障分析: 出現該問題可能存在多種原因。 n 群集中的主機已斷開連接配接、處于維護模式、無響應或出現 vSphere HA 錯誤。 若主機處于斷開連接配接狀态或處于維護模式下,則通常是由使用者操作導緻的。若主機無響應或存在錯誤,則 通常是由更為嚴重的問題引起的,例如,主機或代理出現故障或存在網絡問題。 n 群集包含比其他虛拟機具有更大記憶體或 CPU 預留的虛拟機。 “群集允許的主機故障數目” 接入控制政策基于對插槽大小( 由虛拟機的 CPU 和記憶體預留兩部分組成) 的 計算。如果對插槽大小的計算由于離群虛拟機而發生偏離,則接入控制政策可能會變得過于嚴格并導緻無 法打開虛拟機電源。 n 群集中沒有可用的插槽。 當群集中沒有可用的插槽,或打開虛拟機電源導緻插槽大小增加(因為該虛拟機的預留大于現有虛拟機的 預留)時,會出現問題。無論是哪種情況,都應使用 vSphere HA 進階選項來減小插槽大小,使用不同的 接入控制政策或修改政策以允許較少的主機故障。 解決方法: 在 vSphere Client 中, 單擊顯示在群集的摘要頁籤的 vSphere HA 區域中的進階運作時資訊連結。該資訊框顯示了插槽大小以及群集中的可用插槽數。如果插槽大小過大,請單擊群集的資源配置設定頁籤,根據預留對虛拟機進行排序以确定哪個虛拟機具有最大的 CPU 和記憶體預留。如果存在比其他虛拟機具有更大預留的離群虛拟機,請考慮使用其他 vSphere HA 接入控制政策(如“預留的群集資源的百分比”接入控制政策)或使用 vSphere HA 進階選項設定插槽大小的絕對上限。但這兩個選項都增加了出現資源碎片的風險。 116、存儲 DRS 無法在資料存儲上執行操作 存儲 DRS 生成一個警報,表明其無法在資料存儲上運作。 故障問題: 存儲 DRS 生成一個事件和一個警報,且存儲 DRS 無法運作。 故障分析: 以下情形可能導緻 vCenter Server 禁用資料存儲的存儲 DRS 。 n 資料存儲在多個資料中心之間進行共享。 在多個資料中心之間共享的資料存儲上不支援存儲 DRS 。 某個資料中心内的主機挂載另一資料中心内的資料存儲時,或将使用資料存儲的主機移動到其他資料中心時,可能會出現此配置。當某個資料存儲在多個資料中心之間進行共享時, 将對整個資料存儲群集禁用存儲 DRS I/O 負載平衡。 不過, 對于資料存儲群集中所有未在多個資料中心之間進行共享的資料存儲而言,存儲 DRS 空間平衡仍處于啟用狀态。 n 資料存儲連接配接到不受支援的主機。 存儲 DRS 在 ESX/ESXi 4.1 及更低版本的主機上不受支援。 n 資料存儲連接配接到未運作 Storage I/O Control 的主機。 解決方法: n 資料存儲必須隻顯示在一個資料中心内。将主機移動到同一資料中心内,或者從駐留在其他資料中心的主 機上解除安裝資料存儲。 n 確定與資料存儲群集關聯的所有主機都是 ESXi 5.0 或更高版本。 n 確定與資料存儲群集關聯的所有主機都已啟用 Storage I/O Control 。 117、建立虛拟機過程中,存儲 DRS 出錯 故障問題: 在資料存儲群集上建立或克隆虛拟機時,存儲 DRS 可能會出錯。 嘗試在資料存儲群集上建立或克隆虛拟機時,可能會收到以下錯誤消息: 目前狀态下不允許此操作 (Operation Not Allowed in the Current State) 。 故障分析在啟用了存儲 DRS 的資料存儲上建立虛拟機時, 存儲 DRS 會檢查是否存在違反規則的情況。 如果存儲 DRS 無法建立符合規則的新虛拟機的磁盤, 則将出錯。 出錯的原因是存儲 DRS 無法引用正在建立中的尚不存在的虛拟機。 解決方法: 修改或移除規則,然後重試建立或克隆虛拟機的操作。 118、Converter5.0遷移Windows系統異常慢的問題 這主要由SSL問題引起。處理如下: Locate the converter-worker.xml file. By default, it is located at: 1、Windows7 and Windows2008 Server – C:ProgramDataVMwareVMware vCenter Converter Standalone 2、Windows Vista, Windows XP and Windows 2003 – %ALLUSERSPROFILE%VMwareVMware vCenter Converter Standalone 3、In older Windows version s– %ALLUSERSPROFILE%Application DataVMwareVMware vCenter Converter Standalone Take a backup of the converter-worker.xml file. Open the file in a text editor and locate the tag pair <useSsl></useSsl>. It is located inside the <nfc> tag and has a value of true. Change the value to false. Save and close the file. Restart the VMware vCenter Converter Standalone Worker service on the machine. 119、如何打開vSphere5.0标準交換機的Cisco發現協定(CDP) 在VMware vSphere5.0的環境下,預設的CDP協定是關閉的 a、Down(停用)–既不發送也不接受CDP資訊 b、Listen(偵聽)–接受來自實體交換機的CDP資訊 c、Advertise(通告)–将CDP資訊發至實體交換機 d、Both(二者)–将CDP資訊發至實體交換機并接受來自實體交換機的CDP資訊 指令如下: esxcfg-cswitch -b vSwitch0 esxcfg-cswitch -B both vSwitch0 esxcfg-cswitch -b vSwitch0 both |
-
有木有
記憶碎片(綠茶坊) 自豪地采用WordPress。