提到資料庫排名,此時腦海裡浮現出的是什麼?是 DB-Engines,還是墨天輪資料庫排行?兩者間有什麼差別?下面來聊一下業内這兩個知名資料庫排名平台。
本篇文章約有 3000 字,預計閱讀時間 7 分鐘,如閱讀時間有限,請直接閱讀文章末尾的對比表格。
正文開始前,作者先在這裡貼标簽,如有不準确、不全面的地方,歡迎文章下方留言交流。
DB-Engines 資料庫排行
- 國際資料庫産品
- 谷歌搜尋引擎
- 出現較早(2012 年)
- 網絡原因導緻分數有偏差
墨天輪國産資料庫排行
- 聚焦國産資料庫
- 百度搜尋引擎
- 流行度計算符合本土化
- 平台官方月度解讀
排行榜|當 DB-Engines 遇見墨天輪國産資料庫排行 DB-Engines 資料庫排行 墨天輪國産資料庫排行 指數對比 寫在結尾
目錄
DB-Engines 資料庫排行
DB-Engines 流行榜單概況
DB-Engines 如何計算流行度?
墨天輪國産資料庫排行
墨天輪國産資料庫流行榜單概況
墨天輪如何計算流行度?
指數對比
Oracle/MySQL
TiDB/OceanBase/DAMENG
寫在結尾
DB-Engines 資料庫排行
首頁:DB-Engines - Knowledge Base of Relational and NoSQL Database Management Systems
DB-Engines 建立于 2012 年 10 月,由奧地利 IT 咨詢公司 solid IT 建立和維護,截至本月(2021 年 9 月)即将營運滿 9 年。
它的 Slogan 是“Knowledge Base of Relational and NoSQL Database Management Systems”,9 年間所收錄産品從 2012 年最初記載的 5 個分類、18 款資料庫産品發展到如今的 15 個分類、378 款資料庫産品,稱得上是資料庫的知識庫,在相關産品對比及選型文章中不斷被引用。
自多年前接觸 DB-Engines開始,網站的首頁始終保持這種懷舊的風格,不知道是否在傳遞着經典不褪色的意思?
(圖源:DB-Engines 首頁)
DB-Engines is a new initiative to collect and present information on relational and NoSQL database management systems.
DB-Engines 第一篇 Blog 的第一句話:“DB-Engines 是一個用來收集并展現關系型和非關系型資料庫資訊的新項目。”
在過去的一段時間,谷歌、亞馬遜等廠商依托于強大的基礎設施在資料領域的創新使行業發生天翻地覆的變化,發展的同時也給業内帶來了一些困惑,DB-Engines 試圖通過“人氣值”即流行度得分的形式給出參考,同時提供了産品相對應的概念和屬性。
DB-Engines 流行榜單概況
(圖源:DB-Engines 排名和曲線)
DB-Engines 9 月榜單,一眼望去 TOP 産品都是相對熟悉的主流資料庫,個别産品雖沒有使用過但也眼熟了。
- 比較有意思的是甲骨文自家的開源産品 MySQL 總在觊觎 Oracle 的位子,沒有趕超卻數次逼近。
- 曲線比較優美的要數 PostgreSQL 和 MongoDB,一路高歌猛進、得分穩定上漲。
在榜單解讀方面 DB-engines 沒有定期專欄解讀,Blog 闆塊下的文章更新頻率較低。
下面看下 DB-Engines 是通過什麼方式計算流行度的。
DB-Engines 如何計算流行度?
DB-Engines 網站對資料庫流行度得分的計算方式如下。
資料庫産品在網站上被提及的次數
以搜尋引擎查詢中的結果數衡量。目前使用谷歌和必應進行這項測量,為了隻計算相關結果,DB-Engines 采集 以及對應的術語,例如“Oracle”和“database”。
對這個系統的普遍興趣
對于這一衡量标準,DB-Engines 使用的是Google Trends中的搜尋頻率。
關于系統的技術讨論頻率
使用知名 IT 相關問答網站 Stack Overflow 和 DBA Stack Exchange 上的相關問題數量和感興趣的使用者數量進行衡量。
相關工作的 Offer 數量
使用的是領先的求職搜尋引擎上的招聘資訊,如 Indeed 和 Simply Hired。
在專業網絡中提到該系統的個人簡介的數量
使用的是國際上最流行的職業社交網站 LinkedIn。
社交網絡中的相關性
統計推特上提到該系統的推文數量。
了解完流行度的計算方式後不知你現在作何感想,6 個方面的内容難以覆寫到我們身邊大部分人。這裡不讨論“XX上網”,畢竟有人離不開、有人嫌麻煩。個人覺得從本土化角度分析,離我們确實稍有點距離。
- 都知道技術要使用 Google 找答案,但還有一部分同仁習慣于某度(設定首頁的同學請舉手);
- 老玩家比較熟悉 Stack Overflow 和 DBA Stack Exchange 問答網站,現在使用頻率如何?
- LinkedIn 的履歷是新的麼?
- Indeed、Simply Hired(招聘平台)
- … …
可以說 DB-Engines 在一定程度上忽略掉了我們這個大市場。
雖然友好度欠佳,仔細看 DB-Engines 其實還是有我國部分資料庫的身影,如 TiDB、PolarDB、SequoiaDB、TDSQL、KingBase、TSDB、TDengine、EsgynDB 和 K-DB 等産品,為你們點贊!
墨天輪國産資料庫排行
首頁:國産資料庫排行 - 墨天輪
回首過去的兩到三年,國産資料庫迎來了一波新的發展,尤其在新基建驅動下如獲新生,更多的使用者和廠商也開始關注起國産資料庫這一領域。
墨天輪國産資料庫流行度排行在 2019 年和大家見面,起初墨天輪排行榜中可以查到國際主流資料庫的排名情況,從 2020 年 9 月開始,推出“國産資料庫流行度排行”,聚焦國産産品,建設國産生态,同年 10 月榜單中加入了信通院評測參考名額,提供更豐富的參考次元。
(圖源:墨天輪國産資料庫排行)
墨天輪國産資料庫流行度榜單由剛開始收錄的 104 款産品發展至如今(2021 年 9 月) 142 款産品,涉及 8 個分類,展現國産資料庫崛起、繁榮發展的一面。
以下來是蓋老師(eygle)對近年國産資料庫發展的了解。
2019,國産資料庫元年開啟新紀元
2020,國産資料庫嶄露峥嵘的發轫之年
2021,國産資料庫的躬行實踐之年
墨天輪國産資料庫流行榜單概況
(圖源:墨天輪國産資料庫排行和曲線)
以上截圖是墨天輪 2021 年 9 月的國産資料庫流行度榜單。
- Top10 中有 4 款是開源産品,并均位于 Top5,開源引領格局;
- 本月 TiDB 雖分數有減但仍以絕對的分數優勢穩居第一;
- OceanBase 得分下滑明顯,達夢進一步拉近與 OceanBase 的距離;
-
openGauss 憑借活躍的生态本月獲得較大的漲幅,超越 PolarDB 取得排名第四的佳績。
詳細解讀請參考墨天輪釋出的“2021年9月國産資料庫排行榜:達夢奮起直追緊逼OceanBase,openGauss反超PolarDB再升一位”。
墨天輪如何計算流行度?
墨天輪主要根據如下資料來計算出資料庫當月的得分和熱度。
0、加分項
Gartner市場佔有率排行;IDC市場佔有率排行;Gartner魔力象限;TPC-C排行;通過信通院評測;DB-Engines上榜。
後續計劃引入專利數、論文數、公示的中标記錄、參加知名論壇、權威評測榜單、舉辦活動次數等。
1、搜尋引擎
引入百度、必應、谷歌以及微信公衆号文章當月搜尋條目數,且每個搜尋引擎權重不同,如國内百度、公衆号文章較高;
除了資料庫英文名稱搜尋,加入中文化搜尋如“金倉資料庫”、“達夢資料庫”等,且每個關鍵字設定了不同的權重,如中文化搜尋較高;
排除關鍵字為通用英文的問題,如K-DB、CloudTable、TSDB等的搜尋關鍵字改為浪潮K-DB、華為CloudTable、阿裡TSDB。
2、趨勢指數
引入百度指數、360趨勢資料。
3、博文數目
引入微信公衆号、CSDN、墨天輪等社群中博文數目。
4、招聘崗位數
引入51JOB相關招聘資料。
5、文獻數目
引入知網資料。
6、問答數目
引入CSDN、Stack Exchange、Stack Overflow、墨天輪問答資料,且權重不同,如CSDN、墨天輪問答較高。
相比 DB-Engines,墨天輪排行榜在本土化方面做的比較好,1 個加分項和 6 個考核次元的内容看起來沒有距離感。
- 搜尋引擎方面覆寫了常用的百度和必應,同時也包含谷歌,更是有我們幾乎每天都在讀的公衆号文章;
- 趨勢、博文數目、文獻均符合本土化,尤其是知網、公衆号和 CSDN 的引入;
- 在招聘方面目前隻看到有 51JOB 的資料,如果能加上其他常用招聘平台資料會更加完備。
除此之外,墨天輪結合每月結合産品流行度的動态,推出了“國産資料庫排行榜 - 月度解讀”專欄,官方釋出解讀文章,國産動态一覽無餘。
(圖源:墨天輪國産資料庫排行榜月度解讀)
指數對比
前面兩部分内容說明了流行度的計算方式,也看出在本土化管道差異較大,為了進一步說明,這裡引入百度和谷歌的指數。
時間範圍 2021.8.1~2021.8.31,分别觀察在不同搜尋引擎下搜尋指數的差異。
Oracle/MySQL
(圖源:百度指數 Oracle/MySQL)
(圖源:谷歌趨勢 Oracle/MySQL)
以下是 8 月的指數對比。
- 百度指數
- MySQL 平均值 5045,Oracle 平均值 3564;
- MySQL 平均值約為 Oracle 的 1.42 倍。
- 谷歌趨勢
- MySQL 平均值 38,Oracle 平均值 75;
- MySQL 平均值約為 Oracle 的 0.51 倍。
在百度中明顯 MySQL 熱度更高,在谷歌中 8 月的平均值至達到 Oracle 的一半,兩平台對與 Oracle 和 MySQL 的指數計算是截然相反的。
TiDB/OceanBase/DAMENG
(圖源:百度指數 TiDB/OceanBase/DAMENG)
(圖源:谷歌趨勢 TiDB/OceanBase/DAMENG)
以下是 8 月的指數對比。
- 百度指數
- TiDB 平均值 656,OceanBase 平均值 395,達夢平均值 53;
- TiDB 指數平均值約為 OceanBase 的 1.66 倍,約為達夢的 12.38 倍。
- 谷歌趨勢
- TiDB 平均值 18,OceanBase 平均值 2,達夢平均值 2;
- TiDB 指數平均值為 OceanBase 的 9 倍,同樣為達夢的 9 倍。
谷歌趨勢中 OceanBase 和 達夢的分數僅僅為 2,TOP 産品的分值比例也同百度存在較大的差異。
無論是主流産品的對比還是國内資料庫産品的對比,兩個平台的指數差異是相當大的,可見對産品流行度排行的影響。
這裡貼對外連結接,可自行驗證。
百度指數:百度指數
谷歌趨勢:https://trends.google.com/
寫在結尾
為了更直覺展現 DB-Engines 和墨天輪國産資料庫排行的差別和特點,結合文章開頭提到的标簽,直接上表格。
看完以上内容,哪個榜單更适合你呢?
作者|Tank
郵箱|[email protected]
參考資料
國産資料庫排行-墨天輪
2021 :國産資料庫名錄和産品資訊一覽
DB-Engines
Method of calculating the scores of the DB-Engines Ranking
你是否曾質疑過DB-Engine的資料庫排名?