Meta開源通用架構Theseus，可互補傳統技術和深度學習的優勢

（映維網Nweon 2022年10月31日）Meta人工智能團隊早前開源了一個可微分非線性最小二乘（NLS）的優化技術庫Theseus。據介紹，Theseus基于PyTorch，适用于機器人和計算機視覺等用例，允許研究人員能夠輕松地将專家領域知識融入現代AI架構。它将knowledge表示為優化問題，并在基于梯度的學習過程中将其作為子產品化“優化層”添加到架構之中。這個domain knowledge與訓練資料不同，它可以幫助模型實作更為準确的預測。例如，為了確定機器人的運動平穩，研究人員可以将機器人的實作方式和運動模式的knowledge作為一個層，同時對機器人進行端到端的運動訓練。

Theseus是一個為可微非線性優化提供跨應用架構的庫。Theseus非常高效，可通過支援批處理、GPU加速、稀疏解算器和隐式微分來加速計算和記憶體。Meta宣稱，它比谷歌基于C++的Ceres Solver（不支援端到端學習）快四倍。

Theseus融合了将prior knowledge注入人工智能系統的兩種主流方法的最佳方面。在深度學習出現之前，研究人員使用更簡單、獨立的AI優化算法來解決機器人中的單個問題。通過計算手動選擇的因素組合的最小值，機器人系統學會了執行指令的最佳方式。這種方法有效但不靈活。特定于應用的優化算法通常難以适應新的系統或環境。

另一方面，深度學習方法的可擴充性要高得多，但它們需要大量的資料，會産生有效但在training domain之外脆弱的解決方案。

為了訓練特定應用的深度學習模型，研究人員使用精心選擇的損失函數來衡量模型預測資料的效果。但要通過反向傳播更新模型權重，每個層必須是可微分，允許誤差資訊通過網絡流動。傳統的優化算法不是端到端可微分，是以研究人員面臨着一個權衡：他們可以放棄優化算法，轉而進行專門針對特定任務的端到端深度學習，并有可能失去優化的效率及其泛化能力。

或者，他們可以離線訓練深度學習模型，并在推理時将其添加到優化算法中。第二種方法的優勢是将深度學習和prior knowledge相結合，但由于深度學習模型是在沒有預存在資訊或特定任務的錯誤函數的情況下訓練，是以其預測可能不準确。

為了融合相關政策，減輕它們的弱點并利用它們的優勢，Theseus将優化結果轉換為一個可以插入任何神經網絡架構的層。這樣，修改可以通過優化層反向傳播，進而允許研究人員對最終任務損失的特定domain knowledge進行微調，并作為端到端深度學習模型的一個組成環節。

Theseus（綠色）如上所示， objective由上遊神經模型的輸出張量（灰色）和prior knowledge（橙色）組成。Theseus層的輸出是最小化 objective的張量。

工作原理

NLS測量一個非線性函數與它要預測的實際資料之間的差異。較小的值意味着函數非常适合資料集。從映射和估計到規劃和控制，NLS在機器人和視覺問題的表述中非常普遍。例如，機器人朝向目标的路線可以表述為NLS優化問題：為了繪制最快的安全軌迹，系統會尋找一個可以最小化行程時間和不必要行為的sum-of-costs objective，比方說急轉彎或與環境中的障礙物碰撞。sum-of-costs objective同時可以捕獲傳感器測量誤差，進而優化機器人或camera的過去軌迹。

通過令NLS可微分，Theseus提供了可微非線性優化，并作為研究人員可以插入神經網絡的層。輸入張量定義了權重平方和objective函數，輸出張量是産生objective最小值的參數。通過優化器進行微分，可以保留端到端計算梯度的能力。

這将優化器和已知先驗內建到深度學習訓練循環中，允許模型對domain knowledge進行編碼，并學習實際的任務損失。同時，深度學習模型将從訓練過程中的感覺或語言教學中提取更大的objective。這樣，研究人員可以在訓練循環中使用已知的運動學模型來開發objective預測模型。這種将已知先驗與神經元件子產品化混合的技術可以提高資料效率和泛化能力。

為了提高效率，Theseus內建了對稀疏解算器、自動矢量化、批處理、GPU加速和帶隐式微分的梯度計算的支援。正如autodiff和GPU加速推動了PyTorch在NumPy的發展一樣，稀疏性和隐式微分推動了Theseus的發展，與通常隻支援稀疏性的Ceres等解算器形成對比。

對于标準GPU，使用稀疏解算器的Theseus要比使用密集解算器快得多，所需記憶體同樣要少得多。另外，Ceres的GPU支援有限，不支援分批或端到端學習。最後，隐式微分比标準展開産生更好的梯度。隐式差異同時具有恒定的記憶體和計算占用空間。

為何重要

Theseus提供了一個可以利用傳統技術、視覺方法和深度學習的互補優勢的通用架構。可微分優化作為歸納先驗，提高資料效率和泛化能力。

現有的實作是特定于任務，通常效率低下。Theseus可以跨應用，是以AI社群可以通過訓練在多個任務和環境中表現出色的精确模型來取得更快的進展。

相關論文：Theseus: A Library for Differentiable Nonlinear Optimization

Theseus目前已經開源。具體源代碼請通路這裡，而項目頁面請通路這裡。

Meta開源通用架構Theseus，可互補傳統技術和深度學習的優勢

繼續閱讀

簡單文檔分類——樸素貝葉斯算法樸素貝葉斯算法簡單文檔分類執行個體步驟總結樸素貝葉斯分類調用(sklearn)

考證大全 | 證券從業資格考試

敲黑闆！2021年證券從業考試考點預測

2021年銀行從業考試考情介紹,果斷收藏!

證券從業合格證書什麼時候列印？有哪些注意事項？

【幹貨滿滿】初級銀行從業考試《個人理财》重點梳理

2020年經濟師考試，難嗎？

初級銀行從業資格證有什麼用？

MBA提前面試純幹貨分享

MBA值得學麼

吳恩達logistic回歸實作

【人工智能行業大師訪談1】吳恩達采訪 Geoffery Hinton

深度學習模型分析人類複雜疾病的準确性

【趨高機器視覺】機器視覺技術原了解析及解決方案

解碼器用于語義分割：資料依賴的解碼可以實作靈活的特征聚合

cs231n斯坦福基于卷積神經網絡的CV學習筆記（一）KNN和線性分類器/分類器損失/反向傳播一，KNN圖像分類算法二，線性分類器三，線性分類器損失四，反向傳播五，神經網絡