天天看點

《智能資料時代:企業大資料戰略與實戰》一1.1 大資料分析的出現

.本節書摘來自華章出版社《智能資料時代:企業大資料戰略與實戰》一書中的第1章,第1.1節,作者 talkingdata ,更多章節内容可以通路雲栖社群“華章計算機”公衆号檢視

科學家對大資料集進行分析和研究,進而得出研究結論,在這種情況下資料越多、分析研究越多,得出的結果也就越好。研究人員通過整合相關資料、非結構化資料、曆史資料、實時資料,進而産生我們現在所說的大資料。

在商業領域,大資料就意味着商機。根據ibm的報告,人類社會現在每天都能創造出2.5×1018位元組的資料,進而使得世界上90%的資料都能在過往的兩年間被創造出來。這些資料來自社會的方方面面:收集氣象資訊的傳感器、社交網站的文章、數位圖檔、線上視訊傳輸、線上交易記錄,以及手機的gps信号等。它們都是大資料的催化劑,而且伴随着資料分析、算法和其他技術的進一步使用,所有這些資料的内在價值都能被發掘出來。

大資料在很多領域的重要作用和價值業已被充分證明。例如美國國家海洋氣候管理局(noaa)、美國國家航空航天管理局(nasa)以及美國的一些制藥公司和能源企業等,這些組織自身積累了大量的資料,如今它們每天利用大資料技術從中提取價值。

美國國家海洋氣候管理局運用大資料技術促進氣候、生态系統、天氣和商業貿易方面的研究,而美國國家航空航天管理局則将大資料用于航天和其他方面的研究。制藥公司和能源企業則利用大資料實作更具體的研究,例如藥物測試和地球實體分析。《紐約時報》利用大資料進行文本分析和網絡資訊挖掘,而華特迪士尼公司則将大資料與消費者的行為相關聯,進一步了解消費者在其實體店、主題公園、門戶網站的消費行為。

此外,大資料在現代商業領域還另有妙用:大型組織日漸面臨着管理大量合法的結構化和非結構化資料的需求,這些資料涉及從資料庫的交易資訊到員工微網誌,從供應商的記錄到監督部門的檔案。近期的法庭案件倡導企業遵守法律程式,儲存好所有文檔、電子郵件資訊以及其他電子通信裝置的資訊,如即時通信資訊和網際網路通信裝置的資訊,因為這些資訊在企業面臨訴訟時可以用于法庭的電子驗證。

繼續閱讀