【NLG】(四)文本生成評價名額—— diversity原理及代碼示例

2023-04-10 08:53:59

前奏：

【NLG】(一)文本生成評價名額——BLEU原理及代碼示例

【NLG】(二)文本生成評價名額—— METEOR原理及代碼示例

【NLG】(三)文本生成評價名額—— ENTROPY原理及代碼示例

1.diversity原理

衡量生成的文本中，詞的豐富度。

2.優缺點

優點：

衡量了文本詞的豐富，即：重複詞越少，文本更豐富，該名額值越大

3.如何算diversity

輸入資料：

字與字分開的文本。

給一句話的每個字之間插入一個空格，比如：

輸入為：["吃飯了嗎？", "沒有"]

輸出：["吃飯了嗎？", "沒有"]

def insert_black(list_value):
    len_text = len(list_value)
    res_list = []
    for i in range(len_text):
        gen_value = gen_list[i]
        list_split = ''.join(["%s " % j for j in gen_value])
        res_list.append(list_split)
    return res_list

代碼：

def calc_diversity(predicts):
    '''
    生成結果加入空格
    '''
    tokens = [0.0, 0.0]
    types = [defaultdict(int), defaultdict(int)]
    for gg in predicts:
        g = gg.rstrip().split()
        for n in range(2):
            for idx in range(len(g)-n):
                ngram = ' '.join(g[idx:idx+n+1])
                types[n][ngram] = 1
                tokens[n] += 1
    div1 = len(types[0].keys())/tokens[0]
    div2 = len(types[1].keys())/tokens[1]
    return [div1, div2]

if __name__ == '__main__':
    predicts = ['你 說 什 麼 ？'， '你 說 的 是 啥 ?']
    etp_score, div_score = entropy(predicts)

【NLG】(四)文本生成評價名額—— diversity原理及代碼示例

1.diversity原理

2.優缺點

3.如何算diversity

輸入資料：

代碼：

繼續閱讀

評價名額/性能度量

微科普：基于雲模型的基本機率指派生成方法及應用雲模型是一種基于不确定性推理的數學模型，它能把定性概念和定量描述聯系起來，

為什麼有的地方政府部門績效考核上得去，但發展就過不去，考核和發展兩張皮，不成正比？導緻一些地方政府部門績效考核上得去但發

推薦搜尋場景下的auc了解

#chat2db##openai#阿裡巴巴開源自然語言生成SQL的工具，在github上面可以下載下傳。使用前需要具有ope

今天下午火山引擎釋出的“火山方舟”，一下子集齊了七個葫蘆娃，哦不對，是七家大模型，企業可以根據自己的需要使用統一接口随時

一文讀懂回歸模型準确度評價名額：R-square, AIC, BIC, Cp

#創作能手挑戰賽##頭條創作挑戰賽#昨天通過了阿裡的人工智能測試體驗資格，希望我可以為大規模AI發展做些微薄貢獻吧！關于

評價名額，precision，recall，AP，mAP

precision, recall, accuracy, F1 score等評價名額

不同類型糖在畜牧業生産中的飼喂影響先前的研究發現，葡萄糖、果糖和蔗糖都能誘導鵝肝中産生更多的脂質沉積。瑪格麗特和鵝肝醬是

HPS v2：800K文生圖模型的人類偏好資料集以及評價名額

搜尋算法小知識：QP之類目識别1.搜尋引擎中有一套多級類目體系，通常包含數十個一級類目、數百個二級類目、甚至還有三級和四

将油漆廢水原水和經預處理之後的出水進行氣相色譜檢測，從色譜圖中可以看出反應前後油漆廢水中有機物的吸收峰變化明顯，在保留時

3D點雲目标跟蹤的評價名額及詳細代碼

員外帶你讀論文：From RankNet to LambdaRank to LambdaMART: An Overview