方向是自然語言處理的同學們有福啦,為了跟蹤自然語言處理(NLP)的進展,有大量仁人志士在 Github 上維護了一個名為 NLP-Progress 的庫。它記錄了幾乎所有NLP任務的 baseline 和 标準資料集,同時還記錄了這些問題的state-of-the-art。
● Github
● https://github.com/sebastianruder/NLP-progress
● 官方網址
● https://nlpprogress.com/
● 整理報道
● huaiwen
NLP-Progress 同時涵蓋了傳統的NLP任務,如依賴解析和詞性标注,和一些新的任務,如閱讀了解和自然語言推理。它的不僅為讀者提供這些任務的 baseline 和 标準資料集,還記錄了這些問題的state-of-the-art。
下面小編簡單列舉了幾個NLP-Progress 記錄的任務:
● Coreference resolution 共指消解
● Dependency parsing 依存分析
● Dialogue 對話
● Domain Adaption 領域遷移
● Entity Linking 實體連結
● Information extraction 資訊抽取
● Language modeling 語言模型
● Machine translation 機器翻譯
● Multi-task learning 多任務學習
● Multi-modal 多模态
● Named entity recognition 命名實體是被
● Natural language inference 自然語言推理
● Part-of-speech tagging 詞性标注
● Question answering 問答
● Relation prediction 關系預測
● Relationship extraction 關系抽取
● Semantic textual similarity 語義文本相似性
● Semantic parsing 語義分析
● Semantic role labeling 語義角色标注
● Sentiment analysis 情感分析
● Summarization 文本照耀
● Taxonomy learning 分類結構學習
● Temporal processing 時序分析
● Text classification 文本分類
● Word sense disambiguation 詞義消岐
● 。。。
對于每一個任務,NLP-Progress都會簡單介紹一下這個任務是做什麼的,并詳細列出公開的标準資料集,以及在該資料集上各個模型目前的排名情況。比如,比較火的Question answering 問答系統任務,它的組織形式如下:

具體到某一個開放資料集,如 Quasar, 貢獻者會簡單介紹該資料集的組成,然後列出論文排行榜,其中每一行都包括:模型,效果,文章名和連結,以及代碼連結。
還等什麼,趕緊去 Star一下。
原文釋出時間為:2018-11-15
本文來自雲栖社群合作夥伴“
專知”,了解相關資訊可以關注“
”。