天天看点

ACL2020-知识图谱论文-NER(一)

1、Named Entity Recognition without Labelled Data: A Weak Supervision Approach   摘要:本文提出了一种简单但强大的方法来学习NER模型,在缺乏标签数据,通过薄弱的监督。该方法依赖于广泛的标签功能来自动标注来自目标域的文本。这些注释然后使用隐藏马尔科夫模型合并在一起,该模型捕获了标签函数的不同准确性和混淆性。在此统一标注的基础上,最终可以训练序列标记模型。我们从两个方面来评价这个方法(CoNLL 2003和来自路透社和彭博社的新闻文章),并证明与域外神经NER模型相比,实体级F1得分提高了约7个百分点。 结论 针对命名实体等序列标记任务,提出了一种弱监督模型识别。为了利用任务可用的所有可能的知识来源,该方法使用广泛的标签功能,包括数据驱动的NER模型、地名词典、启发式功能和实体之间的文档级关系。标签功能可以专门识别特定的标签,而忽略其他的标签。此外,不同于以前薄弱的监督方法,标记功能可以产生概率预测。这些标记函数的输出,然后合并在一起使用隐藏马尔科夫模型,其参数估计与鲍姆-韦尔奇算法。在这些统一预测的基础上,最终可以学习神经序列标记模型。  

继续阅读