當今網際網路已進入大資料時代,通過分析海量資料,可以産生巨大的商業價值。當我們需要大量資料時,如何獲得這些資料?通常使用的方法主要有以下幾種。
商業生産的資料
公司在生産經營過程中會産生大量與其經營活動有關的資料,如:百度搜尋指數,騰訊公司業績資料,阿裡巴巴集團财務營運資料,新浪微網誌微指數等。
大網絡公司擁有龐大的使用者群體,具有自然積累資料的優勢,以及一些注重資料的中小企業,也開始積累自己的資料。
購買資料平台的資料
以資料交易為主要業務的資料平台如:資料堂、國雲資料市場、貴陽大資料交易所等。
購買各行各業的各類資料到各個資料交易平台上進行交易,根據資料資訊的不同,擷取難易程度不同,價格也就不同。
由政府/機構提供的資料
此外,政府和機構還将釋出一些公開資料,作為行業權威資訊的來源。比如中華人民共和國國家統計局的資料,中國人民銀行的調查資料,世界銀行的公開資料,聯合國的資料,納斯達克的資料,新浪财經的美股實時行情等等。
這類資料通常是由各地政府統計報告,或由行業内的專業網站、機構等提供。
資料管理顧問公司的資料
為了提供專業的咨詢服務,資料管理咨詢公司将收集并提供與具體業務相關的資料作為支援。這類管理咨詢公司的數量很多,比如麥肯錫,埃森哲,尼爾森,艾瑞等等。
這些公司往往擁有非常龐大的資料團隊,通常是通過市場研究、問卷調查、固定樣品測試、與其他來自各行各業的公司合作、專家對話等方式獲得資料,并根據客戶需求開發商業解決方案。
現在大家知道爬取資料的應用場景了吧,希望本章内容可以幫助到大家哦~