天天看點

釋放資料生産力,資料治理要“即時”

作者:大資料線上

近年來,資料成為核心生産要素之後,人們總是期待充分釋放資料生産力。但知易行難,如何釋放資料生産力,大部分企業卻莫衷一是、無所适從。

尤其是針對文檔等非結構化資料,工程設計、生物醫藥、智能制造、金融、教育等行業極為典型。這些行業大多數屬于知識密集型企業,自身積累了豐富且具有極高價值的海量文檔資料,卻在資料治理、内容分析、知識營運等方面捉襟見肘,缺乏有效方法論與工具,隻能眼睜睜看着豐富的資料“沉睡在角落”。

面對文檔等非結構化資料的種種挑戰,以愛數AnyShare Family7為代表的智能内容管理平台近年迅速興起,獲得了多個行業使用者的青睐。尤其是在多級統一标簽體系的加持下,愛數AnyShare Family7率先開啟文檔治理體系專業服務2.0,為非結構化資料的治理帶來“即時”能力,真正幫助多個行業使用者發揮資料要素價值、充分釋放資料生産力。

非結構化資料的“牆”現象

培根說,知識就是力量。

以非結構化資料為例,在很多企業中,非結構化資料蘊含着企業重要的知識、經驗,如果能充分的分享與利用,則對于企業良性發展有着極大促進作用。Forrester一份調研顯示,絕大部分企業都意識到非結構化資料已是企業重要的核心數字資産,提升對非結構化資料的應用,可以有效提升企業的核心競争力。

但從資料到知識絕非易事,其中治理至關重要。如今,幾乎所有企業都面臨着非結構化資料的治理挑戰。愛數文檔治理專家表示,很多企業經過多年發展之後,在非結構化資料治理主要面臨着兩大挑戰:複雜組織與技術架構的挑戰、多樣化業務與可持續發展的挑戰。

釋放資料生産力,資料治理要“即時”

例如,企業組織規模持續變大之後,往往會面臨着跨國、跨區營運,分支機構林立,随之而來的就是資料壁壘越多,“部門牆”現象嚴重,多雲戰略、異構系統造成的資料孤島、資料口徑不統一等情況,使得資料共享、利用面臨着層層困難。

又如,業務多樣化之後,如何實作文檔快速、安全、精準和跨業務的流轉,如何簡化安全治理以及提升知識的傳承均極具難度。

“非結構化資料的‘即時’資料治理如今愈發重要,滞後的資料治理會帶來一系列問題。”愛數文檔治理專家如是說。如何了解“即時”與“滞後”,愛數文檔治理專家通過日常房間整理為例子,房間不即時收納與歸置,很容易就陷入亂糟糟的狀況,人們往往陷入“物品不用的時候随處見、用的時候找不到”的尴尬情況。

“如今,業務的發展也對于非結構化資料治理的時效性要求越來越高。是以,建立非結構化資料的治理體系勢在必行。”愛數文檔治理專家補充道。

“即時”對于資料治理為何至關重要

非結構化資料治理本身就是一項系統化工程,涉及到組織制度、企業文化、業務流程和技術工具等多個方面。Forrester調研資料顯示,超過60%的企業在資料治理上都面臨着内部認知、組織協同、人才工具和資料思維等方面的挑戰。

如今非結構化資料治理需要加上“即時”,對于很多企業是難上加難。對此,愛數在文檔治理體系專業服務1.0的諸多實踐以及對多個行業使用者需求的深度調研基礎上,正式推出了文檔治理體系專業服務2.0,基于多級統一标簽體系,滿足使用者從咨詢、建設和營運等全方位文檔治理需要。

具體來看,愛數文檔治理體系專業服務2.0包括專家咨詢服務、專家傳遞服務和專家教育訓練服務,均是由擁有多年行業領域經驗的專業服務顧問來提供文檔治理體系全生命周期的服務。“愛數的專業顧問具備咨詢、項目管理群組織營運教育訓練的專業能力,以及豐富的數字化建設經驗。”愛數文檔治理專家介紹道。

釋放資料生産力,資料治理要“即時”

如果說文檔治理體系專業服務2.0解決了各大企業缺乏資料治理專家方面的難題;那麼,愛數AnyShare Family7 智能内容管理平台則是資料治理離不開的“百寶箱”。

正所謂“工欲善其事必先利其器”,對于文檔治理而言,愛數AnyShare Family7 智能内容管理平台不僅打破資料孤島、實作非結構化資料的統一管理,更是讓内容治理、安全治理和知識治理不再割裂,進而為“即時”資料治理奠定基礎,幫助使用者真正形成文檔治理體系。

“通過‘即時’資料治理,能夠有效避免大量、滞後的資料治理,推動知識及時共享與發揮價值。”愛數文檔治理專家介紹道,“有效的資料治理是讓資料結構化,而統一标簽體系是資料結構化的基礎。”

衆所周知,資料标簽是對資料特征的符号表示,每一個資料标簽都是認識、觀察和描述資料的一個角度。通過統一标簽體系,使用者可以針對文檔、知識、表格等不同内容進行分類、标記,以即時資料治理實作高效的内容治理、嚴格的安全治理和精準的知識治理。

釋放資料生産力,資料治理要“即時”

例如,文檔隻有流動、共享,其價值才能最大化。但文檔的流轉往往涉及到複雜的安全與合規規則,利用人工稽核的方式,不僅效率低下,而且成本高昂。統一标簽體系可以利用安全政策和敏感度标簽在文檔流轉過程中自動識别安全規則,大幅提升文檔流轉效率。

又如在很多企業的财務、供應商管理和HR等系統中,不同業務系統往往存在姓名、身份證、位址等基礎資料格式不統一的情況,進而容易造成基礎資料重複、不準确、不唯一等情況,這些核心業務資料一旦有誤,就容易對業務造成隐患。而通過統一标簽體系,利用标簽和編目能力,可以實作跨業務系統的主資料進行賦能,生成統一、唯一的資料,更好地為業務賦能。

但“打标簽”在大資料時代通常被視為是一項極為場景的工作,愛數的統一标簽體系體系有何不同?其背後有哪些核心技術,又是如何幫助使用者做到“即時”資料治理的。

統一标簽背後的核心技術是什麼

資料标簽通常是以微觀視角,對每一條資料進行加工和細化管理,并且會帶上業務含義的概括性描述,進而友善資料價值的充分挖掘與實作。

“與個人不同,企業對于資料标簽需求是在限制中尋求足夠的自由。”愛數研發副總裁楊宇介紹道;“由于法律法規等因素,企業希望所有流動環節均被管控,不能留一個漏洞;同時又希望内容最大化流動,提升員工的生産力。”

釋放資料生産力,資料治理要“即時”

從技術上挑戰上看,因為文檔與标簽是一對N的關系,一旦文檔等非結構化資料爆炸性增長,形成海量規模,那意味着标簽數量規模會更加龐大。是以,如何面對海量文檔資料實作自動化、和準确高效地打标簽,海量标簽如何快速、高效存取,以及安全的通路控制和精準的搜尋都是标簽體系面臨的主要挑戰。

“統一标簽體系的技術理念是在銜接多種技術的基礎上,采用靈活、開放和一體化的設計理念。”楊宇表示道。

具體來看,從标簽生成、标簽存取到标簽應用過程中融合多項人工智能、大資料、資料存儲等多項技術。例如,在标簽生産階段,采用AI技術實作自動打标簽,減少人工操作;在标簽存取階段,采用内容自動化技術,可以在内容生産時候更多元度的标簽,并且高效存取下來;而在标簽應用階段,通過搜尋、安全管控和第三方內建,實作一體化的使用體驗。

以内容治理為例,從文檔上傳和内容撰寫開始,愛數AnyShare Family7的内容識别子產品就會對内容進行識别,并利用DLP安全服務打上不可修改的安全标簽,後續在某些場景使用時候會促發安全規則;而AI子產品則可以通過識别文檔内容,進一步豐富标簽内容。

“像财務工作中,很多财務希望發票基于企業、金額等分門别類放在不同子目錄中,這可以通過機器人基于内容了解和标簽去分類。”楊宇補充道。

事實上,除了各種内容治理場景外,在安全治理和知識治理等各種場景中,統一标簽體系也是基于靈活、開放和一體化的設計理念,融合了多種技術來實作有效的治理。

“統一标簽的背後是一系列技術體系的高效內建,真正幫助企業從海量非結構化資料中挖掘價值,在日常工作中為員工提供幫助,持續釋放資料生産力。”楊宇最後表示道。

繼續閱讀