利用viterbi算法計算出現機率最大字串

2023-06-24 12:49:59

很多人寫的viterbi算法過于依賴HMM，進行分詞、命名實體識别什麼的，因為反而對于這種單純計算字元串機率最大組合的程式較少：

MIN_FLOAT = -3.14E100

"""每一步包含的詞彙清單"""
step1 = ["two"]
step2 = ["of", "off", "on"]
step3 = ["the", "thew"]
step4 = ["people"]
status = [step1, step2, step3, step4]  #狀态集


"""狀态轉移機率"""
trans_probability = {"two": {"on": 0.1, "off": 0.2, "of": 0.6},
                    "of": {"the": 0.6, "thew": 0.8},
                    "off": {"the": 0.3, "thew": 0.5},
                    "on": {"the": 0.2, "thew": 0.52},
                    "the": {"people": 0.5},
                    "thew": {"people": 0.4}
                    }

init_state_p = [("two", 1.0)]


def viterbi(status, init_state_p, trans_p):
    V = [{}]
    path = {}
    for y, prob in init_state_p:
        V[0][y] = prob
        path[y] = [y]

    for t in range(1, len(status)):
        V.append({})
        newpath = {}
        for y in status[t]:
            (prob, state) = max([(V[t-1][y0] + trans_p[y0].get(y, MIN_FLOAT), y0) for y0 in status[t-1]])
            V[t][y] = prob
            newpath[y] = path[state] + [y]
        path = newpath

    (prob, state) = max((V[len(status)-1][y], y) for y in status[-1])
    for y in status[-1]:
        print("last candidate: ", (V[len(status)-1][y], path[y]))
    return (prob, path[state])

print(viterbi(status=status, init_state_p=init_state_p, trans_p=trans_probability))

利用viterbi算法計算出現機率最大字串

繼續閱讀

tf.reduce_prod用法及tf.placehoder用法

卷積碼Viterbi譯碼算法基本原理及C語言實作配套代碼：https://download.csdn.net/download/wlwdecs_dn/14463620

讀《word2vec中的數學原理詳解》的一點了解

tensorflow 入門級别程式實作

BiLSTM+CRF code

Viterbi algorithm

tensorflow 使用HMM的 viterbi 計算誤差

viterbi算法一、前言二、方法對比三、舉例了解四、有關代碼

HMM的應用與Forward算法、Viterbi算法

R語言實作viterbi算法資料集介紹算法輸入輸出Viterbi算法結尾

Viterbi算法及在x264編碼中的應用viterbi算法在 slicetype decision中的應用

動态規劃維特比 viterbi python實作

【基礎算法】維特比算法●Viterbi Algorithm

tf.squard_difference() 和 tf.square()差別

HMM、Viterbi與中文分詞前言正文參考資料

tf.data.Dataset讀取資料的幾種方式案例