天天看點

使用 ChatGPT 建構數學測驗應用程式:疊代提示之旅

作者:順發AI
使用 ChatGPT 建構數學測驗應用程式:疊代提示之旅

必應生成的 AI 圖像

周末,我和我 12 歲的孩子談論 ChatGPT 以及如何制作提示來讓它做不同的事情。與其試圖解釋這些大型語言模型聊天機器人可以做什麼,我想為什麼不玩得開心,并嘗試通過玩不同的提示并看看會發生什麼來實際建構一個小的數學測驗應用程式。

數學測驗應用要求

為 12 歲的兒童開發一個數學測驗應用程式,其中包含 2 位加法、減法、乘法和除法問題。以基于聊天的格式一次提出一個問題,并立即驗證使用者響應。顯示“正确”或“錯誤”,以及針對每個問題的工作,并顯示性能摘要,其中包含所花費的時間和鼓勵的回報。

什麼是格式正确的提示?

格式良好的 ChatGPT 提示應該清晰、具體和簡潔。它應該說明使用者的查詢或他們想要讨論的主題,提供上下文或相關詳細資訊,以確定 ChatGPT 有重點和準确的響應。通過精心設計定義明确的提示,使用者可以從 AI 語言模型獲得更多有用和相關答案。

提示工程是一個疊代過程,涉及優化和修改初始提示,以獲得最适合特定任務或與 ChatGPT 互動的格式良好的提示。通過實驗和調整,使用者可以提高AI響應的品質和準确性,并與AI語言模型實作更有效的溝通。

閱讀有關提示工程的詳細文章:提示工程的藝術

為測驗應用設定提示

疊代 1:\最初的提示隻是列出了一組問題和答案,而沒有對測驗應用程式的規則進行任何解釋。是以,我将應用程式的規則編寫為“規則 1:xxxxx,規則 2:xxxxx”。這有助于 ChatGPT 更好地了解測驗的上下文并生成更準确的答案。

疊代 2:\ChatGPT 根據提示“使用規則執行測驗應用程式”生成代碼。但是,我希望聊天界面輸入響應。是以,我通過明确提及“使用您的聊天界面”來調整提示。這有助于 ChatGPT 更好地了解我對使用聊天界面的期望。

疊代 3:\我希望應用程式開始根據指令“我準備好了”和“我完成了”提問。但是,這兩個規則在同一句話中,這還不夠清楚。是以,我将它們分解為兩個單獨的規則。

疊代 4:\我清楚地提供了驗證答案的規則,但 ChatGPT 在兩種不同的情況下驗證不正确。在第一種情況下,ChatGPT說答案是正确的,但實際上它是錯誤的。在第二種情況下,ChatGPT說答案是錯誤的,而實際上是正确的。這是由于一種稱為經典幻覺的現象。

經過幾次疊代對提示進行細微的調整和改進後,我決定直接利用 ChatGPT 本身來幫助完善措辭。我能夠為我的數學測驗應用程式最終确定最佳提示,如下所示:

使用 ChatGPT 建構數學測驗應用程式:疊代提示之旅

為了驗證最終提示的結構是否良好,我要求 ChatGPT 對其進行審查并确認它将實作所需的測驗應用程式功能。

使用 ChatGPT 建構數學測驗應用程式:疊代提示之旅

一切準備就緒,是時候測試應用程式了!

快樂路徑測試

使用 ChatGPT 建構數學測驗應用程式:疊代提示之旅

萬歲!它有效。一些負面情況怎麼樣?

陰性檢測

使用 ChatGPT 建構數學測驗應用程式:疊代提示之旅

ChatGPT 可以了解意圖,即使沒有提供明确的規則,也會顯示錯誤消息。這些提示使我們能夠建立 chatGPT 在涉及負面場景的情況下應如何響應的指南。

好吧,它通常滿足要求并且運作平穩。但是,我想提請大家注意一些挑戰和問題。

挑戰和問題

挑戰1:\第7條明确規定,每個問題所花費的時間應在最後摘要中列出。但是,在我的測試中并非如此。我嘗試了幾個不同的選項,但沒有一個奏效。

挑戰2:\我最初在提示中包含了一些示例問題。但是,ChatGPT 隻問了這些問題,是以我将它們從提示中删除了。

挑戰3:\數學測驗應用程式在 5 或 6 個問題後沒有重複。它将在收到指令“我已完成”之前顯示摘要。這可能是由于 ChatGPT 免費層的限制。

挑戰4:經典幻覺問題\

以下示例清楚地捕獲了 chatGPT 如何将輸入的值與計算的答案進行比較中的錯誤。第二個問題(49-18=)有一個不正确的答案,但ChatGPT仍然說它是正确的,即使它正确地計算了答案。

使用 ChatGPT 建構數學測驗應用程式:疊代提示之旅

快速工程使使用者能夠優化大型語言模型并實作強大的性能。但是,使用者有責任在使用模型之前徹底檢查模型的輸出。負責任的提示工程需要了解模型的功能和局限性,仔細審查其響應,并就何時信任或忽略生成的文本做出明智的決策。通過适當的洞察力和謹慎,即時工程允許通路大型語言模型的強大功能,同時降低盲目依賴 AI 生成的文本的風險。

如果您有興趣了解有關快速工程的更多資訊,我鼓勵您嘗試自己的項目。您可能會對自己的成就感到驚訝。

繼續閱讀