天天看點

算法交易政策優化中的機器學習方法——設計和時間效率

作者:三分觀寰宇

文|三分觀寰宇 編輯|三分觀寰宇

文摘:本文的主要目的是建立和分析适合于戰略參數優化特點的機器學習方法。最重要的問題是政策性能對小的參數變化和以不規則方式分布在解空間上的大量局部極值的敏感性。這些方法旨在顯著縮短計算時間,而不會造成政策品質的實質性損失。在移動平均線交叉系統的情況下,比較了三對不同資産的方法效率。這個問題是針對三組兩種資産的投資組合提出的。在第一種情況下,一種政策是在标準普爾指數和DEMDAX指數期貨上交易;第二,關于AAPL和MSFT股票;最後,在第三個案例中,HGF和CBF的商品期貨。這些方法對包含1998年至2013年間16年每日價格的樣本内資料進行操作,并在2014年至2017年的樣本外期間得到驗證。本文驗證的主要假設是,機器學習方法選擇的政策的評估标準接近最高标準,但執行時間明顯低于蠻力方法(窮舉搜尋)。

關鍵詞:算法交易,投資政策,機器學習,優化,投資政策,差異進化方法,交叉驗證,過度拟合。

1導言

在過去的幾年裡,機器學習的普及和快速發展取得了巨大的進步。建立立的算法被用來解決各種科學領域的許多難題,并産生促進生活許多領域的解決方案。是以,應用這些方法來改進戰略調整過程似乎是一種自然的選擇。

本研究的主要目的是制定和分析機器學習方法,以适應戰略參數的優化特性。最重要的問題是政策性能對小的參數變化和以不規則方式分布在解空間上的大量局部極值的敏感性。設計這些方法的目的是在不顯著損失政策品質的情況下顯著縮短計算時間。在移動平均線交叉系統的情況下,比較了三對不同資産的方法效率。綜合算法——擴充爬山法、網格法和差分進化法是基于衆所周知的機器學習方法或基于對前面步驟觀察的直覺想法,以改進後面的步驟。

本文讨論的機器學習方法旨在選擇政策參數,以使政策性能最大化,通過指定的優化标準來衡量。這些方法對包含16年每日價格的樣本内資料進行操作,并在4年的樣本外資料上驗證了它們的結果。在第一種情況下,一種政策是在标準普爾指數和DEMDAX指數期貨上交易,第二種政策是在AAPL和MSFT股票上交易,最後,第三種政策是在HGF和CBF商品期貨上交易。

本文驗證的主要假設是,機器學習方法的結果與通過窮舉搜尋(蠻力方法)獲得的最高評估标準附近的結果相同或僅稍差,但是它們的執行所需的時間顯著低于從解空間檢查所有點的計算時間。額外的研究問題是,通過機器學習方法獲得的政策比通過窮舉搜尋過程獲得的政策具有更低的過拟合風險。

比較并給出了優化準則的分布和1000次不同方法執行的計算時間詳盡的搜尋結果。對樣本内資料和額外的樣本外資料進行調整品質評估,以

測試過度拟合趨勢。讓我們強調,本文的目的不是設計最有利可圖的政策,而是比較不同機器學習方法和窮舉搜尋(蠻力)的效率。在樣本外階段進行測試,以評估過度拟合問題。針對不同資産組的模拟是在為本研究目的而實施的同一架構中執行的

基本的機器學習方法有嚴重的缺點。例如,衆所周知的爬山法傳回局部極值,但不能保證到達全局極值。該算法不足以解決全局搜尋問題,但它可以作為更複雜和更有效的全局優化方法的主要組成部分。

由于機器學習方法通過解決大量複雜問題證明了它們的價值,是以,期望這些方法用于政策優化的滿意結果是合理的。最初的直覺是,機器學習方法傳回的結果會比最優方法差一點,但比檢查所有可能性以獲得最佳結果(窮舉搜尋)的時間要短得多。

此外,預計機器學習方法比窮舉搜尋更不可能過度使用政策。所讨論的方法基于這樣一個假設,即對于被該準則的高值所包圍的點,優化準則的條件期望值通常較高。是以,解空間的低正則性可能是該方法性能的真正障礙。沒有理由假設甚至現代水準的空間規律性,是以機器學習方法可能找不到最佳點,如果它們不在高值鄰域。這種特性可能會降低過度拟合的風險,因為通常情況下,那些政策表現相似的人所包圍的參數向量在未來盈利的機會比那些來自不太穩定的地方的人更大。

本文的結構如下。第二章是文獻綜述。第三部分闡述了本文使用的機器學習方法,以及交易假設和基本術語。第四章是資料描述,第五章是效率測試。考慮機器學習方法,特别關注優化标準和計算時間分布。最後一部分是對結果和結論的總結。

算法交易政策優化中的機器學習方法——設計和時間效率

2 文獻綜述

機器學習方法已經發展了幾十年,甚至在這個術語在五十年代被創造出來之前(塞缪爾,1959)。然而,由于人工智能在科學和生活的各個領域應用的技術可能性,近年來人們對該領域的興趣日益增加。維拉提(1984)讨論了從計算觀點學習的現象。人類天生的學習和适應能力表現在資訊的選擇和自動調整過程,導緻算法的修改。

這種方法被大量的現代機器學習方法所遵循,它接近于經典統計模組化的一般思想,在經典統計模組化中,包含新的資料集會導緻模型本身的變化。傳統的統計和計量經濟模型通常假設資料是由特定類别的随機過程産生的。當機器學習方法通常基于疊代改進而沒有指定的模型形式時,拟合過程旨在找到精确到實際資料的過程。Breiman (2001)廣泛讨論了這兩種方法(分别稱為資料模型和算法模型)之間的差異。機器學習領域包含大量的各種算法和方法,用于解決各種各樣的問題。有些方法有很強的數學基礎,例如,基于馬爾可夫鍊蒙特卡羅的方法(尼爾,1993),而其他方法,如爬山法或進化方法,則基于啟發式方法(朱爾斯和瓦滕伯格,1994)。

Hastie等人(2013)和Hastie等人(2001)讨論了科學問題中常用的方法和算法。

算法政策在金融市場中被廣泛使用,但由于其獨特性,大多數算法政策并沒有在論文中讨論。然而,一些類型的量化政策是廣為人知的,是以,在書籍和論文中被讨論。基于技術分析名額的政策,如簡單移動平均交叉法。

本文中所考慮的是針對Gunasekarage和Power (2001)中的特定案例進行分析的。自從機器學習方法開始流行以來,作為解決各種領域問題的工具,出現了許多将其用于交易政策的嘗試。除了商業用途之外,許多描述戰略的學術論文已經發表,其中邏輯基于機器學習。例如,Sankovi等人(2015年)的一組研究人員提出了基于技術分析和最小二乘支援向量機的政策。與本文相反,他們使用機器學習方法作為生成交易信号的系統的一部分,而不是作為系統優化過程的一部分。

最近的研究是由Ritter (2017)進行的,他使用帶有适當獎勵函數的Q學習來處理風險厭惡情況,并在模拟交易中測試政策。Dunis和Nathani (2007)提出了基于多層感覺器(MLP)、高階神經網絡(HONN)等神經網絡和K近鄰方法的量化政策。作者證明了方法可以有效地用于從黃金和白銀交易中産生超額收益。機器學習方法的性能與ARMA類型的線性模型之間的比較不僅導緻構造更好的政策,而且還顯示了所考慮的時間序列中非線性的存在。

應用機器學習方法來預測未來價格現在變得越來越流行。沈、姜和張(2012)提出了基于支援向量機的股票市場指數預測模型,并基于産生的預測結果對交易系統進行了測試。Choundhry和kum (2008)采 用了類似的方法,他們引入了混合機器學習系統,将支援向量機和遺傳算法相結合來預測股票價格。帕特爾等人(2015年)在最近的一項研究中也使用了機器學習方法進行預測。本文主要研究資料預處理方法,以便進一步預測。是以,許多書籍和論文讨論了一般方面和方法,如向前行走優化(柯克帕特裡克和達爾奎斯特,2011年或帕爾多,2011年)。

差分進化是本文考慮的方法之一,由Storn和Price (1997)設計,并在其他論文中讨論,如Price等人(2006)。該算法是為解決具有不規則解的複雜問題而提出的空間。它被用于解決Aria等人(2010)的非凸投資組合優化問題和Aria等人(2011a)的大規模投資組合的CVAR最小化問題。該方法被證明是優化複雜問題的有效方法。

算法交易政策優化中的機器學習方法——設計和時間效率

繼續閱讀