現在,大模型可以做私人導遊,為你規劃Citywalk路線了——
港大MIT等機關聯合推出ITINERA,将LLM與空間優化相結合,實作個性化的開放域城市行程規劃。
舉個栗子,使用者輸入“給我規劃一條包含‘巨富長’、以靜安寺為終點的citywalk路線”。
ITINERA系統立馬生成了一條包含若幹地點的路線,并提供了相應的介紹文本。
甚至“适合情侶一起去的酒吧”“二次元聖地”“途經網紅打卡點”這樣的個性化需求,ITINERA也可以了解和滿足。
單看可能沒感覺,咱們直接對比ITINERA(左側)和GPT-4 CoT生成的路線。
同一提示詞:“我想要一個文藝的路線,要經過橋和渡輪。”
可以看到,ITINERA生成的行程會經過蘇州河沿岸的幾座橋和黃浦江渡輪,在文藝的朵雲書店結束,并且路線較為合理,将地點集中在兩個空間聚類中。
而右圖中GPT選擇的POI(個人偏好的興趣點)則與使用者要求的橋和渡輪不太相符,還出現了繞路、POI距離過遠的情況。除了這個例子外,GPT有時還會出現幻覺,生成不存在的POI。
概括而言,ITINERA具有以下特色:
- 動态資訊:實時更新POI和目前熱門活動
- 個性定制:優先考慮個人喜好而非僅考慮熱門景點
- 多樣限制:靈活應對複雜、多樣的使用者需求
- 空間智能:結合空間優化算法,確定路線合理高效
ITINERA在四個城市的旅行行程資料集(1233條熱門城市路線、7578個POI)上進行了訓練評估。
結果顯示,它可以生成比傳統行程規劃、直接使用LLM等方法更優的效果。
目前相關論文已被KDD Urban Computing Workshop (UrbComp) 2024收錄。
五大子產品組成ITINERA
下一個問題來了:咋做到的呢?
如下圖所示,ITINERA由大模型驅動的五個子產品組成。
首先, User-owned POI Database Construction(UPC)子產品從社交平台上的旅遊内容中收集、建構使用者興趣點資料庫。
為了規劃符合使用者請求的行程,Request Decomposition(RD)子產品對使用者的偏好進行解讀和整理,轉換為結構化的資料形式。
Preference-aware POI Retrieval(PPR)子產品将會根據使用者偏好進行檢索,擷取最相關的若幹個興趣點。
為了確定行程在空間上連貫,作者采用了Cluster-aware Spatial Optimization(CSO)子產品,通過解決分層旅行商問題來空間過濾和排列檢索的興趣點。
最後,Itinerary Generation(IG)子產品将候選興趣點集與多個限制相結合,使用大模型生成既空間合理又符合使用者請求的旅行路線及相關描述。
原理摸清了,ITINERA實際表現如何呢?
為了搞清這個問題,作者收集了來自四個城市的旅行行程資料集,包括使用者請求、相應的城市行程路線以及詳細的興趣點(POI)資料。
通過POI的召回率(RR)、總路程與理論最短路徑的內插補點(AM)、路線中的交叉點個數(OL)、未知POI比例(FR)等客觀名額,評測個性化推薦POI的準确度、與使用者請求的比對度,以及生成路線的空間合理度。
甚至為了解決興趣點吸引力、使用者請求比對度等方面無法量化的問題,作者還采用了LLM自動評估POI的品質、路線的品質、行程和使用者請求的比對程度。
可以看到,與GPT-3.5、GPT-4和GPT-4 CoT等其他方法相比, ITINERA系統在所有名額上均表現更好。
在使用者和專家評估的POI品質(POI Quality)、行程品質(Itinerary Quality)和比對度(Match)方面,ITINERA系統也獲得了更高的評分。
總體來說,ITINERA能夠從自然語言請求直接生成個性化、空間連貫的citywalk行程,不僅探究了大模型時代的開放域行程規劃問題,還提供了在城市應用中利用大模型解決複雜空間相關問題的思路。
更多方法細節和實驗結果,歡迎閱讀原文了解。
— 完 —
量子位 QbitAI · 頭條号簽約
關注我們,第一時間獲知前沿科技動态