Parser
主要有以下幾個問題:
- Parser是什麼?
- 如何使用Stanford Parser
- Parser把一個句子轉變為樹狀結構,那麼這棵樹具體的是怎麼樣,怎麼操作這棵樹?也就是說,怎麼把這棵樹用在LSTM上。這裡面又包含了許多問題。
一、Definition
我隻知道Parser是句法分析。
專業一點的說:
句法分析判斷輸入的單詞序列(一般為句子)的構成是否合乎給定的文法,并通過構造句法樹來确定句子的結構以及各層次句法成分之間的關系,即确定一個句子中的哪些詞構成一個短語,哪些詞是動詞的主語或賓語等問題。
二、Usage of Stanford Parser
1 .
download2 . 解壓之後的目錄如下:
3 . 執行
# mydata.txt是我的語料,輸出在result.txt
./lexparser.sh mydata.txt > result.txt
4.結果如圖所示:
mydata.txt
中隻有一句話
My dog also likes eating sausage.
下面是
My dog also likes eating sausage.
的兩種Parser的結果:
三、Tree
一開始這個結果看不明白。第二種還好,先了解了;第一種是要通過入棧出棧來實作的。
第一種是Constituency Parser,第二種是Dependency Parser。
下面是我手繪的圖:
Constituency Parser:
這個我感覺應該是了解錯了,這個
S
是啥意思呢???
Dependency Parser