天天看點

從政府統計到政府大資料統計

在網際網路大資料發展中,要把各種各樣的資料連結到具有統計思想、統計标準、統計流程、統計方法的科學過程上,形成網際網路雲技術狀态的大資料統計,進而為創造新的大資料生态提供統計科學理論方法,也為與外部無縫連接配接成大系統資料體系、推動全社會産業分工合作、創造更大的生産力,提供統計工具。是以,統計學本身的發展,也要求政府統計成為政府大資料統計。

統計形式主要表現為統計資料和統計分析,統計資料是統計分析的基礎,但在政府統計形式上,則主要從資料出發。統計設計、統計調查及資料搜集整理追求的是一個能夠描述一個國家全部經濟社會活動的資料體系,科學簡潔、充分有效,為社會各界直接認知和直接管理服務,也為專門機構的統計分析研究提供資料支援。

如果政府統計從統計分析出發,那麼因為重心的移動,雖然其也包括統計調查和資料搜集整理,但因統計工作的層次增加,統計分析體系的決定作用就比較大。如此一來,統計調查、統計資料搜集整理可能就會以統計分析為主要目标,而做出一些相對重點的安排。與主要從統計資料出發的政府統計相比,因統計分析重心變化,統計資料體系的完整性可能會被削弱,曆史資料的一緻性也會受到影響,即降低時間序列可比有效資料的系列長度。

客觀性與科學性的沖突統一

政府統計内容是統計發展的實質,即客觀性與科學性的統一。客觀性是指如何把統計體系按照客觀存在的最優細節設計出來,科學性往往受學科的核心理論影響,而核心理論則來自對現實的抽象,二者在統計發展中是沖突統一的過程。從科學性來講,如何把多學科交叉的優化作用反映到客觀存在對象(包括活動)的最優量化解析之中,是統計資料滿足各方面需要的根本點。

政府統計範圍原則上是公共統計資料,是公共服務的組成部分,目的是滿足全社會各種資料需求。縱橫的統計範圍是很難界定清楚的,而且借助網際網路大資料,其無論在廣度和深度上都不斷擴張發展。強化核心不限範圍可能是政府統計逐漸收編業務資料、技術資料、行政記錄、活動記錄、政策資料、專業資料、價值記錄、社會資料、環境資料、自然資料等資料資訊,并形成标準化統計資料資訊,實作政府大資料統計,為政府統計資料實作更強大的公共服務功能提供科學資料支撐的新思維,這将是人類社會發展巨大變革的一個潛在趨勢,也是統計學科與統計工作發展的重大機遇和挑戰。

“資料+模型”助力政府大資料統計

“資料+模型”對政府大資料統計變革具有重要作用。在網際網路大資料雲技術的時代,統計學本身要按照“資料+模型”的要求,重新開發統計應用價值。其中,大資料與統計資料的連結,包含着雙方的互相推動與抱團裂變新能量。抱團裂變新能量是指完全按照客觀存在,把所有量,包括任何一個經濟活動、一個部門活動、一個社會活動中所包含的自然、業務、專業、實驗、技術、政策、行政中的各種資料,按照統計思維、邏輯與方法整理成網際網路雲技術狀态的大資料統計,以此為各方面開展複雜系統全面的研究提供資料資源的能量。有了這個基礎,才可能産生大資料生态的内生智能化研究。在網際網路大資料發展中,要把各種各樣的資料連結到具有統計思想、統計标準、統計流程、統計方法的科學過程上,形成網際網路雲技術狀态的大資料統計,進而為創造新的大資料生态提供統計科學理論方法,也為與外部無縫連接配接成大系統資料體系、推動全社會産業分工合作、創造更大的生産力,提供統計工具。是以,統計學本身的發展,也要求政府統計成為政府大資料統計。

搶占網際網路大資料領域的核心地位

聯系網際網路大資料,重新認識統計學家族的作用,有利于統計學科發展上的戰略選擇。面對網際網路大資料,有必要把統計科學概括成“統計資料+統計模型”。盡管許多人将統計學稱為資料的科學,但實際上,主要還是指如何用統計模型分析資料。目前,需要把統計科學中的“統計資料”獨立出來,其深遠意義是探索如何直接對接網際網路大資料。

“統計資料”面對人類社會的各種實際活動,發揮定量、描述、關聯、網絡等作用,物聯網智能化資料、實驗資料、實物量統計資料、價值量統計資料、業務資料、行政資料、專業資料、文本資料、問卷調查及定性定量化的軟資料,以及展示資料說明客觀規律的名額及名額體系、統計分布、統計分位、統計分層、統計分類、相關分析、投入産出矩陣關系、網絡圖模型、描述統計和探索性統計分析等,都是針對“統計資料”的統計科學作用。探索以因果關系及其客觀規律的統計模型分析,是統計科學的另一部分——“統計模型”的主要功能,其中,涉及更廣泛的機率論與數理統計理論方法。面對網際網路大資料的挑戰,統計科學首要的是要把“統計資料”的層面講清楚,追求運用統計科學解析客觀存在的複雜系統運作的最優體系和機制,并且根據實際需要,還要探索出其他學科不能及的“統計資料”内涵層面及其理論方法,要讓全社會深刻認識到,統計應該能夠成為推動網際網路大資料發展的重要工具,并且具有紮實的統計科學基礎。

統計科學要在“統計資料+統計模型”上,與網際網路所推動的現實内容深刻互動,探索滿足應用的統計理論方法,包括網際網路大資料推動了“資料”範圍擴大、内涵和性質多樣化的變化,統計科學要主動搶占網際網路大資料領域的核心地位。統計的實質是要聚集全社會的所有資料和能夠轉化為資料的資訊。統計要成為網際網路大資料生産的核心科學工具,其中社會所有資料包括物聯網資料、業務資料、專業資料、行政資料等轉化成統計大資料,以及大量文本、音頻、視訊、圖像資訊轉化成統計大資料,要覆寫全社會可量化并形成有效系統應用的工具。

政府部門資料共享是實作政府大資料統計的一個更高層次,本質是統計與其他學科交叉發展,是社會分工與合作的展現。作為最通用的社會基礎又充滿智慧為實際服務的統計科學,在滲透到各個學科領域的過程中,都應該把其所對接的學科對應的實際活動與科學精髓認識清楚、準确,并追求全社會既唯一又統一的大資料統計設計,讓統計成為聚集全社會認知體系的量化工具。是以,統計與其他學科交叉是必須的,也是彰顯統計科學精神與創造社會價值的最好過程和方式。

(作者機關:中國人民大學應用統計科學研究中心、統計學院)

本文轉自d1net(轉載)

繼續閱讀