天天看點

#DataLearner論文快訊#科研人員福利!面向學術科研領域的NLP預訓練大模型GALACTICA釋出!自然語言處理

作者:資料學習DataLearner

#DataLearner論文快訊# 科研人員福利!面向學術科研領域的NLP預訓練大模型GALACTICA釋出!自然語言處理預訓練大模型在最近幾年十分流行,如OpenAI的GPT-3模型,在很多領域都取得了十分優異的性能。而昨天,PapersWithCode釋出了一個學術論文處理領域預訓練大模型GALACTICA,可以幫助科研人員進行論文寫作,提高科研效率,其主要功能包括:引用預測、LaTeX預測、推理、文檔生成、分子式生成、預測蛋白質注釋。例如第一個引用預測,你隻要給出一個公式或者是一段描述,它可以自動幫你找出這方面的文獻。而Latex預測更有意思,你可以給出python代碼,它可以自動生成Latex公式,反過來也行!最重要的是該模型開源,預訓練檔案已經可以使用,最大的1200億參數,200多G,最小的1.24億參數,235MB。最後2幅圖來自DataLearner官網,可以看到除了超大規模的兩個變态,它也是近幾年很靠前的大模型了。大家可以去使用了,用起來十分簡單

#DataLearner論文快訊#科研人員福利!面向學術科研領域的NLP預訓練大模型GALACTICA釋出!自然語言處理
#DataLearner論文快訊#科研人員福利!面向學術科研領域的NLP預訓練大模型GALACTICA釋出!自然語言處理
#DataLearner論文快訊#科研人員福利!面向學術科研領域的NLP預訓練大模型GALACTICA釋出!自然語言處理
#DataLearner論文快訊#科研人員福利!面向學術科研領域的NLP預訓練大模型GALACTICA釋出!自然語言處理
#DataLearner論文快訊#科研人員福利!面向學術科研領域的NLP預訓練大模型GALACTICA釋出!自然語言處理
#DataLearner論文快訊#科研人員福利!面向學術科研領域的NLP預訓練大模型GALACTICA釋出!自然語言處理
#DataLearner論文快訊#科研人員福利!面向學術科研領域的NLP預訓練大模型GALACTICA釋出!自然語言處理