天天看點

基于Chat GPT的學術論文寫作神器chatgpt_academic使用指南

作者:兮夜雜談

chatgpt_academic是一種基于GPT-2的聊天機器人,專注于學術領域的問答。

chatgpt_academic的代碼可以從以下連結擷取:

https://github.com/PaddlePaddle/PaddleNLP/tree/develop/examples/language_model/gpt/chatgpt_academic

這個github項目是以PaddleNLP為基礎的Chatbot,但是chatgpt_academic.py檔案使用了PyTorch的庫,該檔案用于學術問答。下載下傳并運作該檔案需要預先下載下傳GPT-2的PyTorch模型。

以下是使用chatgpt_academic的基本步驟:

1. 確定你已經安裝了Python環境和PyTorch庫。如果沒有,請先安裝。

2. 下載下傳chatgpt_academic模型檔案并解壓縮。模型檔案非常大,建議使用官方提供的百度網盤連結進行下載下傳。

3. 導入模型并建立chatbot執行個體。首先需要導入相應的子產品,并加載模型檔案。

```

import torch

from transformers import GPT2Tokenizer, GPT2LMHeadModel

tokenizer = GPT2Tokenizer.from_pretrained('gpt2-medium')

model = GPT2LMHeadModel.from_pretrained('./chatgpt_academic')

device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

model.to(device)

chatbot = Chatbot(model, tokenizer, device)

```

在建立chatbot執行個體時,需要指定模型、tokenizer和device。Chatbot類是自定義的一個類,包含了chatgpt_academic的核心功能,即輸入問題并擷取回答。例如:

```

response = chatbot.get_response("What is the greenhouse effect?")

print(response)

```

以下是Chatbot類的示例代碼,你可以在其中添加自己的邏輯和功能:

```

class Chatbot:

def __init__(self, model, tokenizer, device):

self.model = model

self.tokenizer = tokenizer

self.device = device

def get_response(self, input_text):

# 将文本編碼為ids

input_ids = self.tokenizer.encode(input_text, return_tensors='pt').to(self.device)

# 生成回答

sample_outputs = self.model.generate(input_ids,

do_sample=True,

max_length=512,

top_k=50,

top_p=0.95,

temperature=1.0)

# 解碼回答文本

response = self.tokenizer.decode(sample_outputs[0], skip_special_tokens=True)

return response

更詳細的使用指南,給出以下步驟和注意事項:

步驟1:安裝Python環境和PyTorch庫。確定你已經具備了使用Python的基本知識,并安裝了Python環境和PyTorch庫。

步驟2:下載下傳chatgpt_academic模型檔案。該模型檔案非常大,建議使用官方提供的百度網盤連結進行下載下傳。下載下傳完成後,解壓縮檔案。

步驟3:導入模型并建立Chatbot執行個體。在Python中使用chatgpt_academic模型,需要導入torch和transformers子產品,然後從GPT2Tokenizer和GPT2LMHeadModel類中加載适當的tokenizer和model。然後建立Chatbot類的執行個體,并指定模型、tokenizer和device。以下是示例代碼:

```

import torch

from transformers import GPT2Tokenizer, GPT2LMHeadModel

tokenizer = GPT2Tokenizer.from_pretrained('gpt2-medium')

model = GPT2LMHeadModel.from_pretrained('./chatgpt_academic')

device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

model.to(device)

class Chatbot:

def __init__(self, model, tokenizer, device):

self.model = model

self.tokenizer = tokenizer

self.device = device

def get_response(self, input_text):

input_ids = self.tokenizer.encode(input_text, return_tensors='pt').to(self.device)

sample_outputs = self.model.generate(input_ids, do_sample=True, max_length=512, top_k=50, top_p=0.95, temperature=1.0)

response = self.tokenizer.decode(sample_outputs[0], skip_special_tokens=True)

return response

chatbot = Chatbot(model, tokenizer, device)

```

注意:model和tokenizer的加載可能需要一些時間,在Python解釋器中顯示的輸出可能會很多。為了防止這些輸出幹擾到Chatbot類和get_response()函數,建議将它們包裝為try-except塊或放在啟動腳本中。

步驟4:使用Chatbot類擷取機器人回答。現在你已經建立了一個可以回答學術問題的聊天機器人,可以使用Chatbot類的get_response()方法來擷取回答。以下是一個示例代碼,它将機器人的回答列印到控制台中:

```

while True:

# 從控制台擷取輸入

input_text = input('> You: ')

# 擷取機器人的回答

response = chatbot.get_response(input_text)

# 将答案列印到控制台上

print('> AI: ' + response)

```

注意事項:

1. chatgpt_academic使用的是GPT-2模型,是以在使用時建議使用GPU,否則速度會非常慢。

2. 在使用示例代碼時,應将chatgpt_academic所在的路徑替換為你的實際路徑。

3. chatgpt_academic的性能受到多種因素的影響,包括輸入問題的類型、語言、長度和複雜度,以及計算裝置的性能。在使用時應注意調整相關參數。

以上就是使用chatgpt_academic的基本步驟和示例代碼。需要注意的是,chatgpt_academic僅僅是一個學術問答機器人的核心,還需要針對具體的應用場景進行二次開發,添加更多功能和邏輯。

三、論文輔助寫作實戰

1、以下是使用chatgpt_academic模型生成寫作論文的實際案例:

題目:社交媒體營銷的利弊分析

1. 引言

社交媒體營銷是指利用各種社交媒體平台展示和推銷産品、服務和品牌的一種營銷方式。社交媒體廣泛應用于當今的商業營銷中,并在許多方面取得了成功,但同時也帶來了一些負面影響。是以,本篇論文将對社交媒體營銷的利弊進行分析。

2. 社交媒體營銷的優勢

1)大衆性:社交媒體平台可以讓營銷者接觸到全世界各個地區的使用者,而且不限于年齡、地域、膚色等因素,無論是消費者還是生産商,都可以使用社交媒體達到其目标使用者。

2)傳播速度快:在社交媒體上釋出營銷資訊,由于資訊的便利性和傳播性,在幾個小時内可能會被數百萬人閱讀。

3)多樣性和互動性:社交媒體營銷可以通過各種形式進行,例如圖檔、視訊、音頻、部落格等,營銷内容也可以直接與使用者互動,增強與使用者的互動和粘性。

3. 社交媒體營銷的劣勢

1)精準度:由于社交媒體平台的大衆化和開放性,導緻許多與營銷目标無關的使用者也會被推銷資訊打擾,無法實作真正的高精準度營銷。

2)不可控性:社交媒體平台對于不同的推銷者都有不同的規定和标準,導緻它們不一定始終掌握平台的變化,或者無法适應新規則和政策。

3)資料安全:社交媒體營銷會涉及到使用者的個人資訊和隐私,一旦使用者的個人資訊被洩露或被濫用,就會對消費者和企業帶來潛在的風險和損失。

4. 結論

社交媒體營銷作為一種新興的營銷方式,在商業領域的應用越來越廣泛,但它也存在一些不足之處。是以,在進行社交媒體營銷時,企業應該根據實際情況制定符合自己的營銷政策,同時注重對使用者隐私和資料安全的保護。

2、論文修改潤色實戰案例

以下是一個具體修改潤色論文的實際案例:

假設你的論文中有一個句子:“Our study shows that the model has achieved high accuracy rates in prediction.”

如果需要潤色這個句子,可以考慮以下幾個方面進行修改:

1. 縮短句子長度。上面的句子偏長,可能難以閱讀。可以嘗試将其縮短,同時保持意思不變。比如,“Our model shows high accuracy rates.”。

2. 替換詞彙。句子中的一些詞彙可能可以替換為更準确、更恰當的詞彙。比如,“shows”可以替換為“demonstrates”、“illustrates”等。如果選擇更恰當的詞彙,可以讓句子更具有說服力。

3. 增加具體細節。句子中可以增加一些具體的細節,以便讀者更好地了解論文。比如,“Our study shows that the model has achieved high accuracy rates in prediction, with an average accuracy rate of 95% over 1000 test cases.”

4. 翻譯語言,以更通俗的語言描述研究。根據論文的讀者群,可能需要将專業的術語或研究描述轉化為更通俗的語言,進而更容易了解。

綜上所述,修改後的句子可以是這樣的:“Our model demonstrates high accuracy rates, with an average accuracy rate of 95% over 1000 test cases.”。

繼續閱讀