天天看點

ChatGPT的前世今生、架構體系、應用場景及未來展望(3)

作者:李論與實建

ChatGPT的前世今生、架構體系、應用場景及未來展望

李建民

四、 ChatGPT應用場景

ChatGPT本質上是一種系統應用,其系統的資料流流轉的過程如下:

ChatGPT的前世今生、架構體系、應用場景及未來展望(3)

資料來源:miukoo.ChatGPT内部技術工作流程. 2022-12-12

  • Li處理:既語言識别(Language identification),ChatGPT是面向中國區之外的使用者,是以使用者輸入的資訊有多種語言,至于是那種語言需要先進行識别。識别之後既可以确定在PPO中使用的是中文、還是英文、還是其它模型資料。
  • Ea處理:既情感分析(Emotional analysis),ChatGPT對于輸入資訊進行了多中情感分析,如果情感不符合正能量方面的要求,ChatGPT會自動拒絕回答相關使用者問題。這點也是非常必要的。Ea處理也需要基于PPO模型庫來分析計算。
  • Ei處理:既抽取資訊 (Extract information),從使用者輸入的資訊中提取關鍵特征,為下一步準備資料
  • NER處理:既命名實體識别(Named entity recognition),負責提取其中的人名、地名、專業術語等資訊
  • SS處理:既句子相似性處理(Sentence Similarity),使用者輸入的資訊可能存在錯别字等資訊,通過此步可以進行一個修正
  • TC處理:既文本分類(Text Classification),把使用者輸入得資訊進行分類,通過此步分類,好定位到下一步搜尋用到的相關搜尋索引
  • Full Search 處理:既全文搜尋處理,ChatGPT是一個自然語言+搜尋引擎內建的架構,通過Ei處理得到的資料就是全文搜尋的輸入資料,比如EI提取出 NER=觀滄海,SS=,TC=文學,那麼此步就可以去搜尋文學索引中的《觀滄海》,得到想要的答案。
  • TG處理:既文本生成(Text Generation),上一步搜尋的結果可能有多條資料,那麼哪一條最符合使用者需求呢?則通過RM模型來進行選取,選取後生成對應的文本内容。
  • QA處理:既問題解答(Question Answering),把上一步生成的答案進一步轉換成适合問答的形式或格式。

以上應用的流程流轉過程了解之後,在官網已經釋出的應用場景大約有40餘種,需要使用到這應用場景則需要進行登入注冊才可:

ChatGPT的前世今生、架構體系、應用場景及未來展望(3)
ChatGPT的前世今生、架構體系、應用場景及未來展望(3)
ChatGPT的前世今生、架構體系、應用場景及未來展望(3)

五、 ChatGPT未來展望

從GPT-3開始,ChatGPT及尚未出爐的GPT-4都面臨訓練成本過大的問題。有分析指出,是否收費是個兩難決策:如果繼續免費,OpenAI會無法承受,但收費又會極大減少使用者基數。倘若訓練成本能大幅下降,則兩難自解。

此外,GPT-3曆經兩年商業化嘗試,并未“如願”取代記者編輯或碼農的職業生涯,OpenAI也從中發現,将GPT系列作為輔助生産力工具對商業化更為合适。此前業内傳言微軟對這家公司的新一輪注資即将落地,屆時其估值預計超過200億美元,商業化也必将提上日程。到那時,OpenAI可以倚仗的大機率是ChatGPT,或者是通過了圖靈測試的GPT4。

ChatGPT的前世今生、架構體系、應用場景及未來展望(3)

OpenAI CEO對産品未來的展望

一片叫好聲中,也不乏有人潑來冷水,程式員首選問答社群Stack Overflow日前便宣布,禁止使用者複制ChatGPT的答案來回答其它使用者的問題,理由是ChatGPT的答案正确比率太低,日後待社群讨論後再作出解禁決定。

此舉立刻引發了業界普遍關注,仿佛是對ChatGPT程式設計價值的徹底否定。與此同時,人工智能界的專家們也在激辯這些大型語言模型可能帶來的負面效應,比如Meta的首席人工智能科學家Yann LeCun認為,雖然它們會有錯誤資訊和不良輸出,但并不會使文本的實際分享變得容易,而後者才是造成危害的真正原因。但也有人反駁稱,這些語言系統的廉價文本生成能力必然會增加其後被分享的風險。

ChatGPT的前世今生、架構體系、應用場景及未來展望(3)

ChatGPT自己回答的關于Stack Overflow社群将其臨時封禁的原因

而在OpenAI内部,一年半前曾遭遇核心員工集體出走,創辦了一家名為Anthropic的新公司,緻力于提高AI安全和可解釋性,目前籌資已超過7億美元,業内亦有聲音認為,這支“AI叛逆者聯盟”說不定會是另一個OpenAI。

(完.)

繼續閱讀