天天看點

非結構化資料分析:大資料時代新價值

“大資料”是近兩年來各界最熱議的話題之一,和“大資料”相關的實踐幾乎成為所有行業在技術和商業兩個方面最具創新意義的行動。在越來越多企業重視“大資料”價值的同時,新型資料的挑戰也随之而來。

據IBM商業價值研究院和牛津大學賽德商學院共同釋出的《分析:大資料在現實世界中的應用》顯示,全球僅四分之一的受訪者表示自己具備了分析高度非結構化資料的能力,而對大部分組織而言,掌握先進的非結構化資料分析能力仍是從“大資料”中獲得價值的重大挑戰。究竟 “非結構化資料” 與 “大資料”有何關聯?哪些創新技術能夠應對新型資料的挑戰?

企業内容管理:突圍非結構化資料

針對非結構化資料所呈現的新趨勢,IBM近年來不斷加深在企業内容管理(ECM)領域的實踐,充分發揮資訊全文檢索、自然語言處理、和行業深入了解三大突出能力,為越來越多的企業找到了非結構化資料管理和分析之道。

BJC Healthcare推進醫療研究:和大部分醫療服務提供商一樣,BJC Healthcare面臨大資料時代的挑戰。現有的醫療資訊資源與實際操作嚴重脫節,分散在非結構化的臨床記錄和診斷報告中的曆史資料幾乎閑置,隻有少部分研究人員偶爾查閱,其隐藏的研究資訊是以無法得以充分利用。通過使用IBM 企業内容管了解決方案,BJC和大學研究人員得以分析非結構化的曆史存檔來回答以前無法解決的關鍵問題。

赫茲國際汽車租賃公司是全球最大并廣受歡迎的租車品牌,準确識别客戶關于産品、服務和員工的滿意度是赫茲的關鍵業務。通過使用IBM 企業内容管了解決方案,赫茲能夠通過分析客戶的調查記錄更好地識别汽車和裝置租賃業績水準,确定客戶的滿意水準并進行必要的調整,進而進一步改善流程。

在智慧城市(Smarter City)中,非結構化大資料分析成為政府、公安、消防、民政等多個部門的協同營運奠定基礎;在智慧商務(Smarter Commerce)中,非結構化資料分析為産品資訊管理、銷售合同管理、服務管理、市場推廣行動管理提供支援;在社交商務(Social Business)中,非結構化資料分析成為網絡協同,資訊挖掘的前提。

 在這裡我還是要推薦下我自己建的大資料學習交流qq裙:522189307 , 裙 裡都是學大資料開發的,如果你正在學習大資料 ,小編歡迎你加入,大家都是軟體開發黨,不定期分享幹貨(隻有大資料開發相關的),包括我自己整理的一份最新的大資料進階資料和進階開發教程,歡迎進階中和進想深入大資料的小夥伴。上述資料加群可以領取

非結構化資料:新價值和新挑戰

什麼是“非結構化資料”?相較于記錄了生産、業務、交易和客戶資訊等的結構化資料,非結構化的資訊涵蓋了更為廣泛的内容,包括了如合約、發票、書信與采購記錄等營運内容;如文書處理、電子表格、簡報檔案與電子郵件等部門内容;如HTML與XML等格式資訊的Web内容;以及如聲音、影片、圖形等媒體内容。

目前,非結構化資料的内容占據了目前資料海洋的80%,并将在2020年之前以44倍的速度迅猛增長。同時,因為非結構化資料的資訊量和資訊的重要程度很難被界定,分析成為了難點。如果說結構化資料用詳實的方式記錄了企業的生産交易活動,那麼非結構化資料則是掌握企業命脈的關鍵内容,所反映的資訊蘊含着諸多企業效益提高的機會。

繼續閱讀