天天看點

《 短文本資料了解》——2.5小結

本節書摘來自華章出版社《短文本資料了解》一書中的第2章,第2.5節,作者:王仲遠 編著,更多章節内容可以通路雲栖社群“華章計算機”公衆号檢視。

本章提出一個從多資料源提取屬性并通過機率為屬性打分的算法架構。同以往基于實體的方法不同,新的方法強調實體的歧義性,并與基于概念的模式聚合。這項工作創新地将兩種模式結合在一起,并通過多重資料源擷取屬性,依靠pairwise排序算法聚合屬性得分。總而言之,本工作能得到嚴謹而實用的屬性典型度得分,用以支援上層短文本了解推理。

繼續閱讀