在 Stack Overflow 上,與某一技術相關的文章數量越多,則說明該技術的開發者數量越多,也從側面反映了該技術的流行程度和受歡迎程度。在第三章中我們介紹了資料的擷取和預處理。在标簽提取階段,我們得到了提取問題文本所需要的 93 個标簽。在這些标簽中,有很多标簽代表很多熱門的 Java 技術,那麼近年來在 Stack Overflow 上,與這些 Java 技術相關的文章數是如何随時間變化的呢?我們在本章中對該問題進行統計分析。
Java 技術使用趨勢統計
- 資料提取
在本節中,我們對一些 Java 熱門技術曆年來相關文章數變化趨勢進行分析。首先,我們選擇标簽提取階段獲得的其中 6 個标簽所代表的技術進行分析。這 6 個标簽分别是“spring”、“hibernate”、“jdbc”、“java-ee”、“maven”和“javafx”。接下來我們将分析每一種技術相關文章數随時間變化的趨勢。

首先,針對 Posts.xml 文檔中的每一個文章的 Tags 标簽進行篩選,若該文章(記為P)的 Tags 标簽包含上述某技術(記為 T)所對應的标簽,則将該文章的年份(記為 Y)取出,我們将 T 技術在 Y 年内的文章數加一。以此類推進行疊代,直到将 Posts.xml 文檔中的所有文章全部周遊完畢,我們就得到了每一種架構每一個年份的文章數。由于我們的資料集是從 2008 年 7 月 31 日開始,至 2017 年 3 月 14 日截止,是以我們将 2008 年和 2017 年的文章數去掉,不進行統計分析。這樣,我們就得到了從 2009 年到 2016 年八年間上述 Java 技術各年份的文章數。
- Java 技術趨勢統計
Spring 架構相關文章數如圖所示。Spring 是一個開放源代碼的設計層面架構,它解決的是業務邏輯層和其他各層的松耦合問題,是以它将面向接口的程式設計思想貫穿整個系統應用。簡單來說,Spring 是一個分層的 JavaSE/EE full-stack(一站式)輕量級開源架構。從圖中可以看出,從 2009 年到 2016 年,Spring 架構相關文章數逐年增長,并且保持穩定增長趨勢。我們可以得出,Spring 架構的使用者随着時間的增長逐漸增加,并且保持穩定增長趨勢。
Hibernate 架構相關文章數如圖所示。Hibernate 是一個開放源代碼的對象關系映射架構,它對 JDBC 進行了非常輕量級的對象封裝,它将 POJO 與資料庫表建立映射關系,是一個全自動的 ORM 架構,Hibernate 可以自動生成 SQL 語句,自動執行,使得 Java 程式員可以随心所欲的使用對象程式設計思維來操縱資料庫。從圖中可以看出,從 2009年到 2012 年,Hibernate 架構相關文章數逐年增長,但增長越來越慢。2012 年到 2014 年,Hibernate 架構相關文章數增長緩慢,總體上比較穩定。2014 年以後,Hibernate 架構相關文章數呈下降趨勢。我們可以得出,Hibernate 架構的使用者随着時間的增長逐漸增加,到 2012 年後相對比較穩定,2014 年後逐漸減少。
JDBC 技術相關文章數如圖所示。JDBC(Java DataBase Connectivity,Java 資料庫連接配接)是一種用于執行 SQL 語句的 Java API,可以為多種關系型資料庫提供統一通路,它由一組用 Java 語言編寫的類和接口組成。JDBC 提供了一種基準,據此可以建構更進階的工具和接口,使資料庫開發人員能夠編寫資料庫應用程式。從圖中可以看出,從 2009 年到 2014 年,JDBC 技術相關文章數逐年增長。直到 2014 年後,JDBC 技術相關文章數緩慢減少。我們可以得出,JDBC 技術的使用者随着時間的增長逐漸增加,直到 2014 年後緩慢減少。
Java EE 技術相關文章數如圖所示。Java EE 是 J2EE 的一個新的名稱,J2EE 是一套全然不同于傳統應用開發的技術架構,包含許多元件,主要可簡化和規範應用系統的開發與部署,進而提高可移植性、安全與再用價值。從圖中可以看出,從 2009 年到 2012 年,Java EE 技術相關文章數逐年增長。直到 2012 年後,Java EE 技術相關文章數逐年下降。我們可以得出,Java EE 技術的使用者随着時間的增長逐漸增加,直到 2012 年後逐漸減少。
Maven 相關文章數如圖所示。Maven 是一個項目管理工具,它包含了一個項目對象模型(Project Object Model),一組标準集合,一個項目生命周期(Project Lifecycle),一個依賴管理系統(Dependency Management System),和用來運作定義在生命周期階段(phase)中插件(plugin)目标(goal)的邏輯。從圖中可以看出,,從 2009 年到 2013 年,Maven 相關文章數逐年增長,并且保持穩定增長趨勢。2013 年以後增長速率有所下降。我們可以得出 Maven 的使用者随着時間的增長逐漸增加,保持穩定增長趨勢,之後有所減少。
- 結論