天天看點

去了 Oracle,難道真是省了許可費、花了運維錢嗎?

雲栖号資訊:【 點選檢視更多行業資訊

在這裡您可以找到不同行業的第一手的上雲資訊,還在等什麼,快來!

前段時間,InfoQ 釋出了一篇《獨家揭秘陸金所去 Oracle 全過程:18 個月将 90% 資料庫業務換到 MySQL 》的文章,引發了大家關于去 Oracle 的讨論,有很多讀者提到了将 Oracle 替換之後,看似授權成本下降,但其實運維成本增加了,并不能減少支出。

那麼,實際情況到底如何呢?我們常說的運維成本到底有哪些?運維成本在去 Oracle 實踐中占總成本多大的比重?去 Oracle 之後,運維成本會發生哪些變化呢?如果去 Oracle 之後,運維成本增加了,那是否有降低成本的方式呢?… 為了弄清楚這些問題,InfoQ 采訪了陸金所全站去 Oracle 負責人王英傑、 PingCAP 聯合創始人兼 CTO 黃東旭。

我們常說的運維成本都有哪些?

“運維成本”是我們常挂在嘴邊的詞,但是運維成本到底包含哪些東西,有很多人是模糊的,是以本文先為大家梳理一下運維成本都包含哪些内容。

黃東旭表示,運維成本一般可以從固定資産性成本和營運成本兩方面來考慮。

固定資産性成本

資料庫遷移的固定資産性成本主要由軟硬體購置成本和硬體服務維保成本組成。應用生産環境的硬體包括伺服器、存儲和資料備份環境,配套軟體包括作業系統、保證資料庫運作的安全類軟體、運維軟體如備份恢複、監控告警等。

如果更具體來講的話,包括以下幾個方面:

  • 資料庫伺服器:Oracle 通常部署在 Unix RISC 小型機上,一般一個資料庫服務會由至少 2 台(主備)或 4 台 (Oracle RAC) 組成。如果 Oracle 資料庫是應用于關鍵業務場景中,單台伺服器硬體采購成本基本上都是 200-300 萬起。
  • 高性能的磁盤存儲:通常 Oracle 資料庫會采用獨立的 FC SAN 光纖磁盤陣列櫃作為伺服器上資料庫存儲的支撐手段。同樣,如果是應用于關鍵業務場景中,此類儲存設備及裝置中配置的大量光纖硬碟(易耗品)的初次采購成本也是在百萬元上下起步。
  • 除了初次購置成本,還要考慮 3-5 年伺服器的硬體維保成本和備援備件的采購成本。一般來說,一年的維保成本會占到初次采購成本的 10%-20%。
  • 軟體許可費用,如果是使用 Oracle 資料庫的話,它是根據 RISC Unix 的處理器核心數量計算許可費用,Oracle DG ( 高可用) 或者 Oracle RAC (叢集) 需要支付額外的軟體許可費用。如果是一個中大型企業的關鍵資料庫應用,上述軟體許可的初次購置費用也會在百萬元起步。
  • 如果企業有災備容災要求,那麼,還需要采購專門的資料備份軟體,例如常見的 NBU 企業級獨立備份系統,如果是要做異地容災,那麼需要在異地機房搭建同等或配置略低的容災叢集,同時還要采購確定兩地主備叢集安全同步的軟體工具,如 Oracle ADG 容災複制系統或者采購 Oracle GoldenGate 來實施。通常,為了容災采購的硬體和配套軟體的成本支出也要接近大幾百萬。

    黃東旭表示:“在不考慮企業的硬體采購實際折扣和合規完成度的前提下,隻考慮 Oracle 資料庫的總體建設工作,企業在關鍵業務場景中的固定資産性成本支出很容易就可以達到千萬級别。”

營運成本

營運成本一般是指資料庫遷移的應用遷移适配成本、資料遷移成本、遷移測試成本、運作維護人員的招募成本、教育訓練成本及日常運維的一般性系統維護人力成本。

“人力成本在 Oracle 遷移前後的變化不大”,王英傑表示,“陸金所是将 Oracle 資料庫遷移到 MySQL,從招聘成本來看,Oracle 工程師和 MySQL 工程師差别不大。另外,通常在企業去 Oracle 實踐開始之前,公司 Oracle 工程師就已經開始向其它資料庫工程師轉型,通過 1-2 年的時間,他們足以成長為一名合格的其它資料庫工程師。”

通常情況下,去 Oracle 之後,之前單套 IOE 資料庫支援的業務量會被安裝替換資料庫的多套 X86 伺服器接管,資料庫伺服器和執行個體數量的整體規模會迎來一個數倍的增長。對此,有實際去 Oracle 經驗的王英傑表示這部分成本其實也是可以抵消的,“這類規模的增長如果依靠一套完善的資料庫自動化運維系統支援,就無需通過堆人來增加成本。”

隐形成本

除了固定資産性成本和營運成本,還有很多不可實際衡量的隐形成本。

技術綁架造成的隐形成本,如果嚴重依賴某個廠商的技術來支援核心資料庫,廠商可能會根據客戶系統的重要性和對它的依賴程度靈活調整價格,合同到期之後,也可能會提高續簽費用。

另外,當資料庫的容量和并發量達到一定規模的時候,系統規模的提升可能會造成硬體成本的倍數提升。

在整個去 Oracle 過程中,運維成本占總成本的多少?

在 Oracle 遷移過程中,運維成本主要包括人力成本、遷移後的配套軟硬體成本和一般性運維成本。如果抛開購置配套軟硬體的直接成本,運維成本大緻會來自以下三個方面:

  • 遷移技術驗證方面的投入;
  • 單次遷移過程中的人力成本;
  • 遷移後的一般性運維成本。

“總體來說,運維成本不會占到去 Oracle 成本的大頭,粗略估計的話,可能會在總成本投入的 10%-15% 之間。”黃東旭表示:“目前,越來越多企業會嘗試在局部業務系統中驗證性地進行去 Oracle 工作,總結經驗,降低遷移過程中的運維成本占比,進而才會在企業内大規模推動去 Oracle 工作。”

以實際經曆了去 Oracle 實踐的陸金所為例,其在遷移過程中的運維成本主要包括:

  • 去 Oracle 之後,X86 伺服器的采購費用,這部分費用不會很高,遠低于之前 IOE 架構的費用;
  • 研發全套去 Oracle 工具平台的費用,這部分主要是由陸金所現有資料庫團隊完成的,沒有因為去 Oracle 項目增加人力成本;
  • 去 Oracle 過程中,開發和測試部門投入的人力成本。不過,這些人力成本是一次性的,項目完成即結束。

在王英傑看來,“如果以去 Oracle 項目的一次性架構改造成本來看,運維成本大概會占到總人力成本的 30%-40%,其中人力成本主要是針對全套去 Oracle 工具的研發。”

去 Oracle 完成之後,運維成本會發生什麼變化?

通常情況下,完成去 Oracle 工作之後,軟硬體固定成本會大幅度降低。如果是從 Oracle 遷移到開源資料庫,運維人員的學習成本會在短期内升高,但是随着新的資料庫納入企業管理體系和運維人員技能的提高,這個成本也會随之降低。如果是從 Oracle 遷移到雲資料庫,後期運維管理成本可能會更低。

一般來說,随着新資料庫規模的擴大,成本降低的效果會愈發顯著。舉個例子,當花了 1000 萬購買的小機和存儲的計算和 IO 能力與 100 萬購買的 X86 服務相當的時候,花一個億購買的小機和存儲的計算和 IO 能力,花費不到 1000 萬的 X86 伺服器就能滿足相同的容量。

以陸金所為例,去 Oracle 之後,IOE 裝置的軟硬體費用幾乎全部消失,僅采購廉價的 X86 伺服器即可支撐起全站的核心資料庫系統。

一旦運維成本上升,企業還會接着去 Oracle 嗎?

雖然說在大多數情況下,去 Oracle 之後的運維成本是下降的,但凡事都有例外。如果運維成本上升了,企業還會接着去 Oracle 嗎?

對此,黃東旭是分多種不同的情況進行分析的:

  • 如果是超大型商業公司,它們的 IT 基礎設施體量龐大,資料庫應用規模也很大,那麼即使遷移後運維成本上升,企業也會因為遷移工作帶來的中長期降本增效而接着進行。另外,運維成本中的一般性成本在納入企業的管控體系後,也會得到控制,是以這類企業大機率會接着推動去 Oracle 工作;
  • 如果是中小型企業,資料庫應用規模本身不大,單次更換資料庫在固定成本上的降低不明顯,如果遷移後運維成本上升,它們可能會選擇上雲或者使用雲端資料庫的方式來控制成本;
  • 如果是金融、國防、電力、通信、能源等領域的企業,它們除了承擔着企業經營使命之外,還承擔着國家運作基礎設施支柱的作用。是以,它們在選擇是否去 Oracle 時,運維成本可能是個考慮名額,但不會是主要名額。

    如果按照既定遷移路線評估之後,發現運維成本有上升的可能,其實我們也可以采取其它方式來降低成本,例如上雲部署、雲原生資料庫服務、運維自動化等等。

寫在最後

作為去 Oracle 的親身實踐者,王英傑表示:“去 Oracle 的成本說到底主要是開發、測試和運維的人力成本。作為一個龐大的系統改造項目,這部分人力成本在項目推進期間一次性投入,項目結束後,就無需投入了。”

“我們也觀察到,對于越龐大的 IOE 系統,去 Oracle 改造後在成本減免上的收益也越大。因為這些 IOE 系統用于采購技術廠商提供的軟硬體、維保、技術支援等費用上的成本,相較于在自身技術團隊人力支出上的成本,占比會更大,而且資料庫系統越龐大,占比會越大。如果我們通過投入一定的人力成本落地去 Oracle,讓公司在資料庫技術上有完全的自主性和選擇權,對于擁有龐大 IOE 系統的公司來說,是非常值得的!”

【雲栖号線上課堂】每天都有産品技術專家分享!

課程位址:

https://yqh.aliyun.com/zhibo

立即加入社群,與專家面對面,及時了解課程最新動态!

【雲栖号線上課堂 社群】

https://c.tb.cn/F3.Z8gvnK

原文釋出時間:2020-03-20

本文作者: 田曉旭

本文來自:“InfoQ”,了解相關資訊可以關注“

InfoQ