天天看點

《智能資料時代:企業大資料戰略與實戰》一第1章 大資料的基本定義

.本節書摘來自華章出版社《智能資料時代:企業大資料戰略與實戰》一書中的第1章,作者 talkingdata ,更多章節内容可以通路雲栖社群“華章計算機”公衆号檢視

當今社會,有效利用大資料可以讓我們擁有壓倒性的競争優勢。在本章中,我們将介紹什麼是大資料,以及它的幾個關鍵概念。

大資料究竟是什麼?乍一看,這個術語相當模糊,像是一個包含海量資訊的詞語。盡管這樣的描述符合我們心中對大資料這個概念的設想,但它并沒有确切地告訴我們大資料是什麼。

通常人們認為大資料就是超大的資料集,對于大資料的管理和分析已經超出了傳統資料處理工具的能力。我們借助網際網路搜尋關于大資料概念的一切線索,發現大資料愛好者所推廣和分享的大資料概念可以精簡如下:大資料界定了一種環境,在這種環境中資料集可以增長到很大的規模,以至于正常的資訊技術不能有效地應對資料集規模的增長。換句話說,資料集已經增長到難以管理的程度,甚至難以從中擷取價值。其中主要的困難就在于對資料的收集、存儲、檢索、共享、分析以及可視化。

大資料的概念有更多的内涵和外延,不僅包括資料集的規模,還包括資料利用的過程。大資料甚至已成為其他業務概念的同義詞,如商務智能、分析和資料挖掘。

然而,大資料并不是一個新鮮事物。雖然大規模的資料集是在近兩年被創造出來的,但是大資料在科學和醫學領域早有根源,這些領域通過分析大規模資料來進行藥物研發、實體模組化以及其他研究。這就是大資料概念的來龍去脈。

繼續閱讀