《大資料、小資料、無資料：網絡世界的資料學術》一 3.2　知識基礎設施

知識基礎設施（knowledge infrastructures）建立在資訊、基礎設施和網際網路的早期發展基礎之上。随着學術基礎設施本身的發展，網際網路已完全融入學術活動，并保持持續資訊流。資訊基礎設施一詞在這裡是狹義的，即從展示資訊世界全貌出發，把技術通信體系結構聯系起來。同樣，國家資訊基礎設施和全球資訊基礎設施均指20世紀90年代的政策架構（Borgman 2000，2007；Busch 2013；Kahin and Foray 2006；Wouters et al. 2012）。

基礎設施既不是工程也不是完全連貫的處理過程。相反，其更像生态圈或複雜的自适應系統。基礎設施包括許多部分，各部分之間通過社會和技術過程互相作用，并取得了不同程度的成功。保羅·愛德華茲（Paul Edwards 2010，17）把知識基礎設施定義為“由人、構件群組織機構三種要素組成的穩健網絡，這三種要素能夠産生、共享并維護人與自然世界的具體知識。”這裡的網絡包括技術、智力活動、學習、協作以及通過分布式擷取人類專業知識和記錄資訊等内容。後來者從學術社群視角出發對以上觀點進行探究，發現可以将其解釋為三方面内容，即知識基礎設施如何變化？資訊基礎設施的權威、影響力以及權利如何進一步加強和再配置設定？我們應當如何最好地學習、了解和想象今天（和明天）的知識基礎設施（Edwards et al. 2013）？

資料是一種似乎時刻處于變化之中且很難靜态固定的資訊形式。随着多方之間進行關于如何了解跨學科、跨領域和跨時間資料問題的談判，隐性知識（tacit knowledge）和常識之間的界限也不斷發生變化。知識規範一直都不穩定，在大資料時代建構知識規範更是難上加難。如果不能對計算結果進行完整解釋，那“知道”（know）一詞意味着什麼？對資料進行跨情景遷移時，我們能夠或應該對資料起源了解多少？隐含在合作夥伴資訊交換中的“信任網絡”（trust fabric）很難複制到與其他主體的資訊交換過程中，特别是跨團隊或跨長時間段的資訊交換。部分資料遷移過程可通過技術進行調節，但是許多資料遷移依舊取決于資料科學家、圖書管理者、檔案保管員或其他新興研究工作參與者等人類調節員的專業技術。商業界也正逐漸進入這一領域。

知識基礎設施與第4章中進一步闡述的“知識共享”（knowledge commons）架構有所重合。知識共享也是一個複雜生态系統，它可以簡單定義為“由于社會困境而形成的群體資源共享”（Hess and Ostrom 2007a，3）。這些複雜生态系統如何加強或重新配置設定權威、影響力和權利的例子是貫穿整本書的線索。掌握大資料分析技術的個人将具有更高價值，掌握探索新型資料所需資源的學者将極大受益。是以，資料挖掘和衆包等新知識形式将有助于實作從資料到知識的重新映射并重塑知識領域。

正所謂“水漲船高”，大規模知識基礎設施投資有利于所有人。但這一說法與一些流行的社會和經濟理論相左，比如知識差距理論（knowledge gap theory；Ettema and Kline 1977；Tichenor，Donohue，and Olien 1970）、媒介素養（media literacies；Jenkins et al. 2009）和馬太效應（Merton 1968，1988，1995）。一般來說，富者更富。在這裡表現為應用新技術和新資訊能力更強的人會取得差别收益。馬太效應在學術界的應用始于對諾貝爾獎獲得者的研究。那些高威望個人和學術中心往往會獲得高比例的認可和資源。如果有相同的新發現，那麼優秀機構會赢取比普通機構更多的關注。相對而言，低等級機構和欠發達國家的學者使用創新技術手段的能力較差、本地資源較少。

知識基礎設施設計和維護的不可見性至少在兩方面存在隐患。一是基礎設施特征的定義，它們隻有在出現故障時才可見（Star and Ruhleder 1996）。無論是電網還是兩個裝置之間的互操作性，除非基礎設施停止工作，否則人們一般都不清楚其對基礎設施的依賴程度。二是維護電網、科學裝置網絡以及科研資料的分布式資訊庫等基礎設施所需的不可見工作。為確定基礎設施所有部件都順利運作，從業人員在背後付出很多努力。而那些使用這些基礎設施并受益的人卻通常不了解這些。由于記錄、組織和管理學術資訊等工作對發現和利用知識基礎設施至關重要，是以不可見工作成為其顯著特征之一。在互相協作、工具開發、資料共享與重用以及其他許多基礎設施元件中，不可見工作同時具備黏結和摩擦兩個功能（Bietz and Lee2009，2012；Birnholtz and Bietz 2003；Borgman 2003；Edwards et al. 2011；Ehrlich and Cash 1999；Lee，Dourish，and Mark 2006；Paisley1980；Ribes and Jackson 2013；Star and Strauss 1999）。

知識基礎設施可能是新術語，但并不是新想法。自早期知識探索以來，為避免淹沒在資料的暴雨、洪水和海嘯中，學者已經學會了“遊泳”（或“設計好船”）。安·布萊爾（Ann Blair 2010）在《無法承受之多》中的報告指出，學者們至少從公元1世紀就開始抱怨被資訊淹沒。近代早期之前，就已經出現對書籍過多的擔憂。13世紀中葉，人們針對資訊問題制定了解決方案，具體包括标題頁、詞語索引和選集。選集（florilegia）的字面意思是“選擇的花”（selected flowers），即在特定話題條件下，從相關書籍中選擇最好的章節并彙編成冊。到16世紀，索引開始流行。布萊爾探讨了早期學者通過複雜筆記群組織機制對閱讀了解問題進行單獨處理的方式。普賴斯（Price 1975）在報告《巴比倫以來的科學》中指出，索引和摘要服務的增長與19世紀中葉以後的期刊增加并行存在。從此，作者、出版商、編索引的人、圖書館、書商及其他利益相關者之間的關系一直處于變化之中。

《大資料、小資料、無資料：網絡世界的資料學術》一 3.2　知識基礎設施

繼續閱讀

jdk1.7+Eclipse+Maven3.5+Hadoop2.7.3建構hadoop項目

HDFS指令行工具

【51CTO學院三周年】自學路上的伴侶

線上教育巨頭多鄰國Duolingo入華一周年，中國市場馬力全開

【分類算法】什麼是分類算法定義分類與聚類分類過程方法

申請評分模型拒絕推斷（RI）方法申請評分模型拒絕推斷（RI）方法

Sql優化一：sql語句優化

Nacos 2.0 更新前後性能對比壓測

尚矽谷—韓順平—圖解 Java設計模式（結構型）（55～）

Storm編譯打包過程中遇到的一些問題及解決方法

MapReduce的幾個企業級經典面試案例MapReduce的幾個企業級經典面試案例

9.spark Core 進階2--Cashe

淺談企業活動中進行資料分析的重要性

Ambari介紹和架構原理

NOSQL安全攻擊

win10本地scala和spark安裝安裝scala安裝spark

《大資料、小資料、無資料：網絡世界的資料學術》一 3.2 知識基礎設施

繼續閱讀

《大資料、小資料、無資料：網絡世界的資料學術》一 3.2　知識基礎設施