天天看點

NLP-Progress記錄NLP最新資料集、論文和代碼: 助你緊跟NLP前沿

方向是自然語言處理的同學們有福啦,為了跟蹤自然語言處理(NLP)的進展,有大量仁人志士在 Github 上維護了一個名為 NLP-Progress 的庫。它記錄了幾乎所有NLP任務的 baseline 和 标準資料集,同時還記錄了這些問題的state-of-the-art。

 ●  Github

    ●  https://github.com/sebastianruder/NLP-progress

 ●  官方網址

    ●  https://nlpprogress.com/

 ●  整理報道

 ●  huaiwen

NLP-Progress 同時涵蓋了傳統的NLP任務,如依賴解析和詞性标注,和一些新的任務,如閱讀了解和自然語言推理。它的不僅為讀者提供這些任務的 baseline 和 标準資料集,還記錄了這些問題的state-of-the-art。

下面小編簡單列舉了幾個NLP-Progress 記錄的任務:

 ●  Coreference resolution 共指消解

 ●  Dependency parsing 依存分析

 ●  Dialogue 對話

 ●  Domain Adaption 領域遷移

 ●  Entity Linking 實體連結

 ●  Information extraction 資訊抽取

 ●  Language modeling 語言模型

 ●  Machine translation 機器翻譯

 ●  Multi-task learning 多任務學習

 ●  Multi-modal 多模态

 ●  Named entity recognition 命名實體是被

 ●  Natural language inference 自然語言推理

 ●  Part-of-speech tagging 詞性标注

 ●  Question answering 問答

 ●  Relation prediction 關系預測

 ●  Relationship extraction 關系抽取

 ●  Semantic textual similarity 語義文本相似性

 ●  Semantic parsing 語義分析

 ●  Semantic role labeling 語義角色标注

 ●  Sentiment analysis 情感分析

 ●  Summarization 文本照耀

 ●  Taxonomy learning 分類結構學習

 ●  Temporal processing 時序分析

 ●  Text classification 文本分類

 ●  Word sense disambiguation 詞義消岐

 ●  。。。

對于每一個任務,NLP-Progress都會簡單介紹一下這個任務是做什麼的,并詳細列出公開的标準資料集,以及在該資料集上各個模型目前的排名情況。比如,比較火的Question answering 問答系統任務,它的組織形式如下:

NLP-Progress記錄NLP最新資料集、論文和代碼: 助你緊跟NLP前沿

具體到某一個開放資料集,如 Quasar, 貢獻者會簡單介紹該資料集的組成,然後列出論文排行榜,其中每一行都包括:模型,效果,文章名和連結,以及代碼連結。

NLP-Progress記錄NLP最新資料集、論文和代碼: 助你緊跟NLP前沿

還等什麼,趕緊去 Star一下。

原文釋出時間為:2018-11-15

本文來自雲栖社群合作夥伴“

專知

”,了解相關資訊可以關注“

”。

繼續閱讀