天天看點

大資料時代,怎麼才能快速成為一名合格的資料分析師

  Hadoop的組成主要分為三個部分,分别為HDFS、MapReduce、HBase等元件,大資料背景下,ApacheHadoop已經逐漸成為一種标簽性,業界對于這一開源分布式技術的了解也在不斷加深。

  但究竟誰才是Hadoop的最大使用者呢,首先我們應該想到的當然是它的“發源地”,像Google這樣的大型網際網路搜尋引擎,以及Yahoo專門的廣告分析系統,也許你會想,Hadoop平台發揮作用的領域是網際網路行業,用來改善分析性能并提高擴充性。

  深入挖掘你會發現,Haddop的業務場景還是比較多的,如下:

  1.線上旅遊:目前全球範圍内80%的線上旅遊網站都是在使用Cloudera公司提供的Hadoop發行版。

  2.移動資料:美國有70%的智能手機資料服務都是由Hadoop來支撐的,包括資料的存儲和無線營運商的資料處理等都,所使用的都是Hadoop技術。

  3.電子商務:eBay就是最大的實踐者。

  4.能源開采:利用Hadoop進行資料的收集和處理

  5.節能:為消費者提供節約電費的服務,其中對使用者電費單進行了預測分析。

繼續閱讀