大資料相關總結（待續）

2021-11-11 03:39:49

“區塊鍊”、文本分析、hadoop、lucence

文本分析是說詞性分形，

分詞應該是搜尋引擎中的分詞器比如現在最常用的是ik 原來的是庖丁

需要做分詞索引：

eg：你幹嘛呢

你 , 幹嘛，呢

分析詞性和詞義還有詞頻，分詞一般就是中文麻煩點，英文簡單

lxh：

通過海量資料計算分析可以提取出有用的資料關系模型這些資料關系模型可以做推薦可以計算使用者行為可以做人物或者城市畫像等等

eg1：

拿到北京200w浮動車資料點計算到北京的所有的道路網絡上計算出每條道路的擁堵程度車速通行時間

eg2：

在電信做的工作就是拿到電信收集到的全國2e人的信令資料計算分析算出每個人工作在那裡每天幾天上下班加班多不多下周二可能出現在那裡平時喜歡做什麼再比如每天地鐵站幾點開始擁堵需要限流排隊某個景點在每年的什麼時候出現高峰高峰值大概什麼樣預測規劃這樣的。

自然語言處理大資料索引資料總結大資料總結

上一篇: 一文梳理世界11國家和地區ICO政策：監管趨嚴，展現定義證券傾向

下一篇: AI 驅動的新興金融市場改革，還有這三項障礙

繼續閱讀