大資料無法取代傳統科研方法

2021-11-09 11:08:00

有人說，大資料時代的到來改變了傳統的科研方法。無論是大型望遠鏡列陣收集回來的各種宇宙星系圖像，還是從dna測序儀形成的各種基因組，或是社交網站的點選次數都可以成為資料收集目标，大資料已經成為科研基礎。但是，澳洲新南威爾士大學生物地理學進階講師馬爾特·艾巴赫3月17日在該校網站發表文章認為，這是對大資料的誤解，大資料不可能代替傳統科研方法，隻能是傳統科研方法的補充。

資料往往被視為科學實驗成功的基準，擁有的資料越多，研究就會越成功。但是艾巴赫卻不這麼認為，他對本報記者舉例說，2004—2006年，美國生物技術學家克雷格·文特爾帶領探險隊對北大西洋海洋生物樣本基因組進行研究，随後他斷定發現了1800種生物。事實上，他測試出來的基因組成千上萬，但為了能夠把它們真正确定為生物，文特爾和他的團隊對每個基因組都進行了分析和對比，并最終給它們命名。是以，從大資料角度，文特爾發現了10.45億組基因，但是卻沒有10.45億種生物。資料的大小不重要，真正能夠達到科研要求的資料才是最重要的。

之前，大資料在某些領域也存在預測錯誤的情況。例如，谷歌公司曾經想通過使用者搜尋流感相關内容的次數和頻率來預測下一次流感到來的時間。事實證明，這種非傳統的資料分析方式最終導緻谷歌公司錯過了對2009年流感疫情爆發的預告，而對2012年和2013年流感趨勢的預告比真實的情況嚴重兩倍。艾巴赫說，大資料預測失敗之後，有統計學家指責資料采集樣本有偏頗，還有人将失敗的結果歸咎于谷歌搜尋缺乏透明度。而學者卻沒有想到可能是因為使用了非傳統的資料收集方式而導緻問題的出現。如何正确使用大資料應該成為大家重視的問題，正是因為學者對大資料存在誤解，才限制了學者從大資料中找到有意義的内容。

艾巴赫說，與傳統資料相比，大資料可以幫助學者打開探索未知領域的大門，學者應該在适當情況下将大資料與傳統科研方法結合，在傳統的科學研究中融入大資料。

本文轉自d1net（轉載）

大資料無法取代傳統科研方法

繼續閱讀

HDFS指令行工具

【51CTO學院三周年】自學路上的伴侶

線上教育巨頭多鄰國Duolingo入華一周年，中國市場馬力全開

【分類算法】什麼是分類算法定義分類與聚類分類過程方法

在weka中內建自己的算法

申請評分模型拒絕推斷（RI）方法申請評分模型拒絕推斷（RI）方法

Sql優化一：sql語句優化

Nacos 2.0 更新前後性能對比壓測

尚矽谷—韓順平—圖解 Java設計模式（結構型）（55～）

Storm編譯打包過程中遇到的一些問題及解決方法

MapReduce的幾個企業級經典面試案例MapReduce的幾個企業級經典面試案例

9.spark Core 進階2--Cashe

淺談企業活動中進行資料分析的重要性

Ambari介紹和架構原理

NOSQL安全攻擊

win10本地scala和spark安裝安裝scala安裝spark