天天看點

一個讓人郁悶的項目實施經曆

最近剛做了群集的項目,是做MSCS加sql server 2000,做的很是郁悶,首先我還是來介紹一下環境吧!

硬體環境:

                 伺服器:HP DL380 G7兩台+FC HBA卡兩塊

                 存儲:   HP P2000 G3 FC Dual Controller LFF

軟體環境:

windows server 2003 R2 x86   SQL Server 2000 Enterprise

網絡環境中已有兩台DC,是以做cluster的時候隻需要加入域即可。我的任務就是把存儲劃好,系統裝好,群集做好,資料庫安裝好,就可以了。

實施的步驟如下:

  1. 用HP的smartstart安裝作業系統,并安裝好HBA卡驅動和HP的多路徑軟體。
  2. 劃好存儲,這裡我隻劃了兩個LUN,一個用作仲裁一個用于資料存儲,把兩個LUN都映射到兩台伺服器上。
  3. 設定網絡加域 ,并檢查共享磁盤。
  4. 建立群集,添加第二個節點。在添加第二個節點的時候出現了一個歎号,錯誤消息是"0x00138f 群集資源未找到"微軟的說法可以檢視下面的連結http://support.microsoft.com/kb/909968。我沒有理會,一切繼續。測試下來一切正常。
  5. 安裝sql server 2000 ,在安裝之前建立MSDTC資源。在群集上安裝sql server 2000 和在本地安裝沒有什麼太多特别的地方,隻是在選擇安裝的不是本地伺服器安裝而要選擇虛拟伺服器,再接下來就是安裝sp4的更新檔。
  6. 安裝完sql server 2000 sp4接下來就是分離附加資料,把原來老的伺服器的資料轉移到新的群集伺服器上來。

當這之前的事情做好以後,郁悶的事情從現在就開始了。使用者用之前的ERP用戶端程式來連接配接SQL SERVER的客戶機有的隻能用IP連接配接,有的隻能用sql server的虛拟名稱連接配接。就為這個問題客戶一會兒懷疑我的群集有問題,一會兒懷疑我安裝sql server有問題,搞得我頭都大了。還要我改sql server的虛拟名字和虛拟ip,這個改名字我沒改過,以為就是直接在參數裡面更改就行了,沒想到一改,sql server 的服務都起不來了。本來是裝的沒什麼問題的,現在搞出問題來了。sql server 想解除安裝但是卸不掉,隻得重裝系統裝群集裝SQLSERVER,這樣又做了一遍,又測試還是老樣子。之前的操作都是在星期六星期天做的,不行可以重來,但是明天就是工作時間了,隻能把舊的系統恢複了。因為不能占用原來老的伺服器的IP及計算機名,這就意味着我又得重新解除安裝sql server了,真是崩潰了,第一次解除安裝的時候就是因為解除安裝sqlserver沒卸好是以要重新裝系統,我可不想再次重裝系統,這次一定要把sql 解除安裝掉。一開始想在控制台裡找到sql server 2000 來解除安裝,沒找到,最後隻能重新運作安裝程式來解除安裝,但是這樣運作了以後還是有一部分沒有解除安裝,但是我發現再次運作安裝程式的時候已找不到虛拟的伺服器名稱了,我就試着選擇節點的名字來進行本地解除安裝,這樣在兩個節點都運作了一次再重新開機就完全解除安裝了。再安裝SQLSERVER的時候沒有報任何的錯誤。最後改虛拟伺服器名稱和IP又得裝了一遍SQLSERVER。最近真是沒法了,星期一客戶請來了做ERP開發的技術人員來了,我把我們遇到的問題和他說了一遍,他測試了一下資料庫,得出的結論是資料庫沒問題,ERP用戶端的版本不一樣,更新一下動态庫檔案就行了,真是讓人郁悶的事情呀

   通過這次這樣一個事情,我學到了兩點:第一,當你覺得你是對的的時候一定要堅持,當時就是因為自己不堅持,總在自己伺服器上找原因,結果裝了兩遍浪費時間 。

第二,一定要找對的人來做對的事。你不要一個搞開發的人來搞網絡,也不要一個做系統管理的人來做開發的事情,這樣是做不好事情的。

繼續閱讀