LDA是一種主題模型,它可以将文檔集中每篇文檔的主題按照機率分布的形式給出。[1]
這裡,先附上原論文中LDA的圖模型表示。[2]

NOTE:上圖中的方框(plate notation)用來表示圖模型重複的變量。外層的框表示文檔,内層的框表示在一個文檔中的詞和主題。
沒寫完,有時間繼續寫。
[1]https://en.wikipedia.org/wiki/Latent_Dirichlet_allocation
[2]http://www.jmlr.org/papers/volume3/blei03a/blei03a.pdf