天天看點

短文本相似度比較

2019獨角獸企業重金招聘Python工程師标準>>>

短文本相似度比較

emm。。。補上次第二周的坑,這是第一周的内容,第二周的連結:https://my.oschina.net/DDigimon/blog/1622301

本次GitHub位址:https://github.com/qiangzi11hao/Semantic-Textual-Similarity

直接上圖:

短文本相似度比較
短文本相似度比較
短文本相似度比較
短文本相似度比較
短文本相似度比較
短文本相似度比較

總結吧。。。在資料量那麼小的資料集上做dl真的是失了智。。。教訓吧。。。還不如一堆分類器聯合。。。最後一層能不能改成boost勒。。。感覺這樣想有點死循環?嗯,什麼情況該什麼算法還是要搞清楚。不過以前對相似度打分内心小聲bb就是不過就是cos餘弦值嘛,這次閱讀了别人的文獻才發現就算餘弦值的變化也能做出很大改進。另外,如果隻用他提到的相似度評分居然分數一下就是0.79,直接秒掉沒有做精細化處理的普通模型了。。。 另外參考論文:http://nlp.arizona.edu/SemEval-2017/pdf/SemEval025.pdf

轉載于:https://my.oschina.net/DDigimon/blog/1626441