機器學習擇時系列之三:LSTM模型市場擇時策略-210909(14頁).pdf

編號:61931 PDF 14頁 2.70MB 下載積分:VIP專享
下載報告請您先登錄!

機器學習擇時系列之三:LSTM模型市場擇時策略-210909(14頁).pdf

1、 請仔細閱讀在本報告尾部的重要法律聲明 1 LSTM 模型市場擇時策略 機器學習擇時系列之三 投資要點投資要點: : 量化擇時交易量化擇時交易策略策略 機器學習量化交易策略的制定,是通過從海量歷史數據中,利用計算機強大的處理能力,挖掘并分析出那些能夠為投資者帶來收益的各種大概率可行的投資方式來實現的。通過數學模型對這些策略進行分析并加以驗證,以期望讓投資者獲得更高更穩定的收益,或更合理地規避風險。 長短期記憶長短期記憶模型模型通過記憶單元有效地學習長期依賴通過記憶單元有效地學習長期依賴關系,在金融市場預測中具有明顯優勢關系,在金融市場預測中具有明顯優勢 長短期記憶網絡是人工神經網絡的一種,具有

2、負責計算時間序列中各個觀測值之間依賴性的能力,同時具有快速適應趨勢中急劇變化的固有能力。所以,長短期記憶模型可以在波動的時間序列中很好地工作。在處理股票價格這樣的時間序列數據時,此模型具有明顯的優勢。 基于基于長短期記憶長短期記憶模型的擇時策略具有高收益,高模型的擇時策略具有高收益,高夏普比率,低夏普比率,低回撤率等特點回撤率等特點 長短期記憶網絡可以通過記憶單元有效地學習時間序列中的長期依賴關系,對股票市場變化趨勢有著較高的擬合度。所以可以根據模型對股票收益的預測結果來決定交易行為。對滬深 300 指數的回測結果表明模型具有高收益,高勝率,高夏普比率,低回撤率等優點。 基于基于長短期記憶長短

3、期記憶模型擇時在風險和收益兩個維度模型擇時在風險和收益兩個維度有著很好的表現有著很好的表現 利用長短期記憶網絡構建股票收益預測模型,根據預測結果決定交易行為。通過在滬深 300 上的回測表明模型具有高收益,高勝率,高夏普比率,低回撤率的優點。 風險提示風險提示 模型基于對歷史數據統計,僅作為投資參考。 評級及分析師信息 證券研究報告|量化研究報告 僅供機構投資者使用 Table_Date 2021 年 09 月 09 日 證券研究報告|量化研究報告 請仔細閱讀在本報告尾部的重要法律聲明 2 正文目錄 1. 長短期記憶模型基本理論. 4 1.1. 長短期記憶模型的定義 . 4 1.1.1.循環神

4、經網絡 . 4 1.1.2.長短期記憶模型. 4 1.2. 長短期記憶模型的學習過程 . 5 1.2.1.正向傳播 . 5 1.2.2.反向傳播 . 5 1.3. 小結 . 6 2. 長短期記憶模型的擇時建模 . 6 2.1. 模型合理性的討論 . 7 2.2. 模型優缺點的討論 . 7 2.3. 策略設計思路 . 8 2.3.1. 建模方法 . 8 2.3.2. 預測方法 . 8 2.3.3. 數據及參數選擇 . 8 2.4. 策略具體過程及回測分析 . 10 2.4.1. 長短期記憶模型的優化 .10 2.4.2. 3:2 的數據劃分訓練模式分析.12 2.4.3. 窗長窗移滾動訓練模式分

5、析 .12 2.5. 擇時策略討論 . 13 3. 總結.14 4. 風險提示 .14 dV8VzWgVmUcXyXrQpOrR6MdN8OtRpPpNpNeRmMpMfQnNoPbRrQmMuOoNtRNZpOvM 證券研究報告|量化研究報告 請仔細閱讀在本報告尾部的重要法律聲明 3 圖目錄 圖 1 持倉時間平均收益率 . 10 圖 2 5 日平均收益率 . 10 圖 3 5 日和持倉期的平均成交量之比 . 10 圖 4 持倉時間長度內夏普比率 . 10 圖 5 數據劃分訓練模式累計收益 . 13 圖 6 窗長窗移訓練模式累計收益 . 13 圖 7 數據劃分訓練模式累計超額收益率 . 13

6、圖 8 窗長窗移訓練模式累計超額收益率 . 13 表目錄 表 1 3 個特征變量 1 個響應變量及其含義 . 9 表 2 長短期記憶網絡層數對回測結果的影響 . 11 表 3 訓練批次對回測結果的影響 . 11 表 4 長短期記憶網絡層神經元個數對回測結果的影響 . 11 表 5 兩種訓練方式結果對比 . 12 證券研究報告|量化研究報告 請仔細閱讀在本報告尾部的重要法律聲明 4 1.1.長短期記憶模型長短期記憶模型基本理論基本理論 長短期記憶模型(Long Short-Term Memory, LSTM),是一種特殊的循環神經網絡,能夠學習長期依賴性。長短期記憶模型在各種各樣的問題上表現非常

7、出色,現在被廣泛使用,例如,文本生成、機器翻譯、語音識別、時序數據預測、生成圖像描述和視頻標記等。這一節我們主要介紹長短期記憶模型的基本理論,包括模型定義和算法。 1.1.1.1.長短長短期期記憶模型的定義記憶模型的定義 1.1.1.1.1.1.循環神經循環神經網絡網絡 循環神經網絡將時間的概念引入了模型中,在循環神經網絡中,每個節點都是一個循環單元,循環結構的加入使得網絡的層之間相連,并且是全連接的形式,每一層的節點之間也是互相連接的,網絡會按照時序關系對輸入及反饋的信息進行處理,即當前時刻節點的輸出是由當前時刻的輸入以及前一時刻的反饋共同決定的,此反饋也可稱為狀態或記憶。將循環單元的結構按

8、照時間順序展開,可知此類鏈式結構十分適合處理時序數據。 正如其它神經網絡,循環神經網絡的學習同樣分為前向傳播以及反向傳播。 (1)前向傳播 t 時刻的輸出由 t-1 時刻的狀態和時刻的輸入共同計算而得,則 t 時刻的狀態:= (+1+),其中()為激活函數,U、V 均為權重且不同時刻同類型的權值是共享的,不隨時間變化而產生變動,為偏置。則時刻的輸出為:=+ ,其中 W 也為權重,取值規則與 U、V 相同,c 也為偏置。則最終模型預測的輸出為: = ()。 (2)反向傳播 損失函數的計算公式為:= ,其中,L 為 t 時刻的損失值,為 t 時刻的實際值。 反向傳播就是為了使損失函數最小化,隨著時

9、間以需要優化的參數的負梯度方向為準來計算累計殘差的過程,最終直至損失收斂,而需要優化的參數是指 U、V 和 W。 循環神經網絡加入的循環結構使得模型較之傳統神經網絡更為復雜,卻增加了其靈活度和適應性,提高了特征學習的能力,也使得模型解決了傳統神經網絡難以處理時序數據的問題,同時共享的權重參數也一定程度上降低了因循環結構而增加的模型復雜度,減少了計算量,使之在理論上可以處理任意長度的時序數據問題。但是在實際問題處理的過程中,當需要處理長期依賴關系的數據時,權重參數 U、V 會在訓練過程中逐漸衰減或放大:倘若梯度大于,當 t 增大時,最終的梯度則會趨于無窮大,模型參數不穩定,無法收斂,此為梯度爆炸

10、;倘若梯度小于 1,則當 t 增大時,最終的梯度會趨于 0,模型參數不更新,此為梯度消失。因此,循環神經網絡往往只能處理較短的序列,而為了解決這個問題,便出現了 LSTM 網絡。 1.1.2.1.1.2.長短長短期期記憶模型記憶模型 證券研究報告|量化研究報告 請仔細閱讀在本報告尾部的重要法律聲明 5 長短期記憶網絡其實是循環神經網絡變形中的一種,其出現就是為了彌補循環神經網絡無法處理長序列數據的缺陷。長短期記憶網絡神經元的結構與循環神經網絡相比,主要有兩大部分的變化:首先是,在長短期記憶網絡神經元中多了一個存儲單元用于存儲長期記憶;此外,其內部還引入了三個邏輯門控單元,可以控制信息的存儲與流

11、動,使得有用的信息得以被留存,無用的信息被遺忘,讓模型能夠以較小的成本來實現不錯的記憶效果。 存儲長期狀態和臨時狀態的細胞單元分別用和表示,三個邏輯門控單元分別為輸入門、遺忘門和輸出門,分別用、和來表示。那么,在 t 時刻下,各門控單元的狀態向量和輸出向量由以下公式進行計算(當 t1 時,初始值0、0均為 0) :() = () tanh() , () = () ( 1)+ () , = tanh(h( 1) +() + ) , () = ( 1)+ () +) , () = (h( 1) +()+ ) ,() = tanh(h( 1)+ () + ) 。 其中,即表示 sigmoid 函數,

12、表示向量的對應元素相乘。、和分別為輸入到三個門控單元的權重矩陣,、h和h則為隱藏層的權重矩陣,、和分別為相應門單元的偏置向量。 1.2.1.2.長短期記憶模型的學習過程長短期記憶模型的學習過程 與循環神經網絡相似,長短期記憶模型的學習過程也分為正向傳播和反向傳播兩部分,而正向傳播的過程基本可以劃分為三個階段:遺忘階段、記憶選擇階段以及輸出階段,分別對應著三個邏輯門控單元的作用過程。 1 1.2.1.2.1.正正向傳播向傳播 (1)遺忘階段 t 時刻輸入長短期記憶網絡神經元的信息來源于三個部分:t 時刻外界的輸入、t-1 時刻的長期狀態1以及臨時狀態1, 和1中的信息在進行權值變換之后會被 si

13、gmoid 函數映射為取值范圍為 0-1 的遺忘門閾值。而遺忘門的作用就是判斷1對于當前內容的重要性,選擇性遺忘掉1中的某些內容,以便當前 t 時刻的新信息得以被輸入進來,這一過程即是數學描述中的() ( 1),其中,()中各元素均為 0-1 的小數,代表的就是存儲單元中信息留存的比例,表示全部遺忘,表示狀態全部保留。 (2)記憶選擇階段 此階段由輸入門發揮作用,輸入門會控制信息的留存,其主要是對新輸入的信息對于的重要性進行判斷,即() 。此過程中中 tanh 函數的作用是對輸入的信息進行縮放,生成當前 t 時刻狀態更新的備選內容。 (3)輸出階段 此階段就是由輸出門確定輸出的內容,對狀態進行

14、更新,需要從中篩選出對 t時刻的輸出有用的信息生成,作為當前的輸出或進入下一時刻的學習。 1 1.2.2.2.2.反反向傳播向傳播 證券研究報告|量化研究報告 請仔細閱讀在本報告尾部的重要法律聲明 6 長短期記憶模型以損失函數的最小化為目標,沿著負梯度方向對各參數進行調整更新,不過 LSTM 中參數數量更多,因此此過程的計算要更為復雜。LSTM 的損失函數為:=12( )2。而決定梯度的是本層在當前 t 時刻的輸出誤差以及之后誤差 , 所 以 := + +1= +1+1+1+1=+1+1+1+1 , = ( )() , +1=+1=+1 ()。 同 理 :+1=+1 1() ,+1=+1 ta

15、nh()() ,+1=+1 。由此可得:= = = ,= , = , = , = , = 1 , = 1 , = 1 , = 1 。 從表面上來理解,在前向傳播過程中,長短期記憶網絡可以判斷何時讓激活函數進入內部狀態,而當輸入門的取值為 0 的時候,激活函數就無法進入。同理,輸出門學習的是何時將值輸出。當兩個門都處于關閉狀態時,激活函數不會有任何變化,也不會對當時的輸出產生任何影響。這就使得在反向傳播過程中的梯度既不會消失也不會爆炸,所以從這個意義上來說,邏輯門控單元在學習何時讓誤差進入,何時將其輸出。在實際應用中,相比于循環神經網絡,門控單元的引入使得長短期記憶網絡可以控制數據的傳遞,可以很

16、好地進行長期依賴關系的學習。 1.3.1.3.小結小結 深度學習是機器學習的一種方法。 “深度”意為含有多隱層節點的神經網絡結構,是和淺層機器學習相對的概念,早期的機器學習模型如支持向量機、邏輯回歸都可以理解為淺層機器學習模型,這類模型在結構上相當于只含一層或不含任何隱層節點。相比于淺層機器學習模型,深度學習可以更好的提取原始數據的特征結構,具有較好的泛化能力,深度神經網絡是深度學習實現的途徑,比較有代表性的深度神經網絡有 卷積神經網絡、循環神經網絡和長短期記憶網絡。其中,長短期記憶網絡是循環神經網絡的一種變體,相比循環神經網絡,長短期記憶網絡具有記憶性,能夠檢測數據中的長期依賴關系,因此更適

17、用于對股票價格時間序列進行預測。 股票數據采集與存儲的自動化方法成本低、易于實現,存在變量多、樣本量大等問題,股票的收益受到多種因素的影響。我們這里挑選出合適的特征變量和響應變量,希望通過長短期記憶模型對股票的收益趨勢做出預測。模型的本質就是通過訓練好的模型來對未來進行預測。我們從證券市場獲得的觀測數據大多都具有時間趨勢,借助長短期記憶模型來進行股票收益預測是具有很強的現實意義的。 2.2.長短期記憶長短期記憶模型的擇時建模模型的擇時建模 量化擇時是指采用數據化的方式,判斷進場或者離場時機。通過計算機技術分析相關數據,得出對證券市場未來一段時間內發展趨勢的分析預判,如果判定上漲則給出買入持有的

18、操盤建議,如果判定下跌則提示投資者賣出清倉規避風險,如果判定震 證券研究報告|量化研究報告 請仔細閱讀在本報告尾部的重要法律聲明 7 蕩則進行高拋低吸或低吸高拋以此來降低持倉成本??梢钥闯?,擇時方法的核心在于精確找到股票走勢,來進一步確定交易的信號。股票數據具有時序性特點,股票數據具有時序性特點,長短期長短期記記憶網絡憶網絡可以通過分層特征可以通過分層特征來表示其內在關系,并且來表示其內在關系,并且具有負責計算具有負責計算時間時間序列中各個觀序列中各個觀測值之間依賴性的能力測值之間依賴性的能力。所以,在預測股票市場走勢時,利用長短期記憶網絡更為合適。我們這里來研究基于長短期記憶模型的擇時建模。

19、 2.1.2.1.模型合理性的討論模型合理性的討論 時間序列分析是以已有的歷史數據為根據,通過數學建模進行分析和判斷未來發展趨勢的一種手段,被廣泛地運用在證券走勢的預測當中。針對復雜的金融時間序列,深度學習方法是目前最適合進行股票市場預測的算法。在眾多深度神經網絡模型中,長短期記憶網絡被廣泛應用。長短期記憶網絡克服了梯度消失問題,能夠通過記憶單元有效地學習時間序列中的長期依賴關系。 長短期記憶網絡是人工神經網絡的一種,衍生于循環人工神經網絡。作為循環神經網絡的變體,長短期記憶網絡最大的不同之處在于它借鑒了人類大腦的選擇性輸入和選擇性遺忘機制,引入了遺忘門、輸入門和輸出門三個“門”結構,以及一個

20、記憶單元來選擇性接收傳入神經網絡的信息。屬于邏輯單元的“門”結構只負責在神經網絡中其它部分與記憶單元相接的邊緣地帶完成權值的設定工作,而不會對其他神經元節點產生影響。長短期記憶模型具有負責計算時間序列中各個觀測值之間依賴性的能力,所以通常被用來實現預測目的。又因其具有快速適應發展趨勢中急劇變化的固有能力,因此可以在波動的時間序列中很好地工作。傳統的時間序列分析模型,如差分整合移動平均自回歸模型則無法盡快適應證券價格的突然劇烈變動。所以我們利用長短期記憶模型對證券價格進行時間序列分析,選取一些重要的指標作為預測向量,再以 5 日平均收益率作為響應變量建立長短期記憶模型,以預測結果的正負作為標志,

21、在回測階段判斷進場或者離場的時機。 2.2.2.2.模型優缺點的討論模型優缺點的討論 長短期記憶網絡是循環神經網絡的一個優秀的變體模型,繼承了大部分循環神經網絡的特性,克服了循環神經網絡的缺陷。循環神經網絡的優勢在于它將時序數據和神經網絡相結合,并且保留了上一時刻對于現在的影響,保留了數據的時序性。但是隨著時間序列的增長,研究者們發現循環神經網絡對于長時間的序列處理能力較弱,也就是說循環神經網絡的長期記憶效果并不是很理想。此外,隨著序列長度增加,模型深度增加,在計算梯度的時候就無法避免梯度消失與梯度爆炸的問題。簡單來說就是循環神經網絡模型在運作到反向傳遞誤差的過程時,由于其結構限制,前面的時間

22、步難以收到后面時間步傳遞的誤差信號,使其難以通過學習遠距離的影響來調整網絡。而長短期記憶網絡更真實地表征或模擬了人類行為、邏輯發展和神經組織的認知過程,繼承了大部分循環神經網絡的特性,同時解決了梯度反轉過程中的梯度消失與梯度爆炸問題。 長短期記憶模型能夠處理非線性問題,具有長期記憶能力,泛化能力強。股票數據由于受到經濟因素、政治因素和環境因素的影響,使其變化規律難以捉摸,變化規律的周期難以確定,所以模型需要大量的歷史數據以及篩選合適的特征變量進行分析才能夠得到需要的結果。在分析復雜的股票市場時,神經網絡作為深度學習領域的技術,能夠很好地解決非線性的問題。長短期記憶網絡在傳統的神經網絡上進行了優

23、化,引入了“門”的概念,增強了該模型的長期記憶能力,合適的優化算法在一定程度上提高了模型的泛化能力,在序列建模問題上具有很大優勢。 證券研究報告|量化研究報告 請仔細閱讀在本報告尾部的重要法律聲明 8 然而,長短期記憶模型也有一定的局限性:循環神經網絡的特性決定了其不能很好的并行化處理數據,長短期記憶模型作為循環神經網絡的改進模型在并行處理上同樣存在劣勢。此外,長短期記憶模型本身的結構相對復雜,如果長序列數據的時間跨度很大,設置的網絡層數較深,將會產生很大的計算量和時間消耗。 2.3.2.3.策略設計思路策略設計思路 我們的策略的主要設計思路如下: 1.1. 設置主要的模型構建方法,即設置主要

24、的模型構建方法,即進行進行兩種方式的模型兩種方式的模型訓練及設置執行方案;訓練及設置執行方案; 2. 根據根據長短期記憶長短期記憶模型的原理來設置預測方案模型的原理來設置預測方案; 3. 對數據及參數進行選??; 4. 通過回測來確定最優模型。 2.3.1.2.3.1.建模方法建模方法 神經網絡通過對人腦工作機制的模擬,以神經元之間權重連接的方式逐層建立起網絡架構,并且每個神經元都有偏置項和激活函數對數據信息進行非線性化變換,這使得運用神經網絡對股票價格建模能夠克服金融時序的非平穩性和非線性,從而最大限度的逼近和擬合實際的股票價格。本文將利用長短期記憶神經網絡來實現滬深 300股票 5 日平均收

25、益率的預測。 我們這里采用兩種方式對模型進行訓練。一種是 3:2 的數據劃分訓練模式,即將60%的數據作為訓練數據,剩余的 40%的數據作為測試數據。一種是窗長窗移滾動訓練模式,即將第 1-30 天的數據用來訓練,第 31 天的數據用來測試,然后將 2-31 天數據用來訓練,第 32 天數據用來測試,以此類推。我們這里將會對兩種方案分別進行測試。 建模過程為: 對模型進行訓練,做參數估計。選取模型的訓練集,如上所述,一種是 3:2 的數據劃分訓練模式,一種是窗長窗移滾動訓練模式,將持倉時間長度平均收益率,持倉期間夏普比率,5 日和持倉期平均成交量之比作為輸入變量,5 日平均收益率作為輸出變量通

26、過對模型進行訓練,得到估計的參數。 本策略利用長短期記憶模型對滬深 300 指數預測得出的 5 日平均收益率作為買賣信號,在回測階段用以檢驗長短期記憶模型用于滬深 300 指數技術指標回歸分析中的精度, 2.3.2.2.3.2.預測方法預測方法 做預測是基于未來數據和歷史數據存在類似的規律假設。根據長短期記憶模型的基本原理,可以構造預測的基本方法,即準備測試數據,利用訓練好的模型實現預測。我們這里將滬深 300 的 5 日平均收益率作為響應變量進行預測,如果預測值大于 0,記為 1;如果預測值小于 0,記為 0,根據此結果在回測階段進行相應的交易操作。 2.3.3.2.3.3.數據及參數選擇數

27、據及參數選擇 關于預測標的的選取我們使用滬深 300 指數(000300)的日數據來進行測試。 證券研究報告|量化研究報告 請仔細閱讀在本報告尾部的重要法律聲明 9 長短期記憶模型的參數主要包括三部分,一個是長短期記憶網絡本身的參數配置;一個是輸入給模型的特征變量的選擇;一個是模型的輸出變量即響應變量的選擇。 模型關鍵參數選擇如下: (1)長短期記憶網絡層神經元的個數(hidden_dim) :長短期記憶網絡需要對每個神經層的神經元個數進行定義。在定義時要考慮輸入數據形狀,并保證模型能夠正常運行,神經元個數不能設置的過大也不能過小。這里我們將神經元個數定為 32 個。 (2)隨機斷開輸入神經元

28、比例(dropout) :該參數用來調節 dropout 層將部分神經網絡單元暫時從網絡中篩選出去的概率,dropout 層用于減小神經網絡模型發生過擬合及性能過低的概率,減少神經網絡單元的同時也減少了神經元之間的相關性,增強了神經網絡在樣本外進行測試時的泛化能力。這里我們將 dropout 設置為 0.2。 (3)訓練批次(num_epochs) :單次 num_epochs 指的是將所有的數據輸入網絡進行一次完整的計算。此參數的設置會極大地影響模型的訓練精度和訓練時間。兩種訓練方式下,此參數最終分別確定為 84 和 17。 (4)輸入數據維數(input_dim):因為特征變量為 3 個,

29、所以將其設置為 3。 (5)輸出數據維數(output_dim) :因為響應變量為 1 個,所以將其設置為 1。 (6)損失函數(loss_fn) :常用的損失函數有 mean_squared_error 和 mean absolute error,這里選取 mean_squared_error 作為損失函數。 (7)優化器(optimiser) :優化器的目的是使損失(loss_fn)函數最小化,在所有神經網絡優化器中,adam 是最為常用的優化器,這里設置優化器為 adam。 表 1 :3 個特征變量 1 個響應變量及其含義 特征變量特征變量 含義含義 持倉收益率 以持倉周期等于 10 為

30、例,即 10 日內的指數收益率 持倉期間夏普比率 夏普比率是一個衡量基金風險與收益關系的指標。以持倉周期等于 10 為例,10 日內的夏普比率即為持倉期夏普比率 5 日和持倉期平均成交量之比 以持倉周期等于 10 為例,則持倉半周期為 5。持倉半周期和持倉全周期平均成交量之比即為 5 日和持倉期平均成交量之比 響應變量響應變量 含義含義 5 日平均收益率 以持倉周期等于 10 為例,則持倉半周期為 5。5 日時間長度內股票的總收益與總成本的比值即為 5 日平均收益率(也稱持倉半周期平均收益率) 資料來源:華西證券研究所 特征變量選擇:股票數據指標能夠在一定程度上幫助投資者判斷股市的當前行情,尋

31、找行情的轉折點。這里長短期記憶模型的特征變量選取了 3 個變量,它們分別是持倉收益率,持倉期間夏普比率,和 5 日和持倉期平均成交量之比。表 1 對它們做出了相應解釋。 響應變量選擇:本實驗長短期記憶模型的響應變量選取的是股票的 5 日平均收益率,表 1 對變量做出了解釋。在回測階段我們將模型預測的 5 日平均收益率的正負作為交易行為的判斷標志之一,為正表示可以獲利,反之表示不能獲利。已知理性的投資者選擇投資標的與投資組合的主要目的為:在固定所能承受的風險下,追求最大的 證券研究報告|量化研究報告 請仔細閱讀在本報告尾部的重要法律聲明 10 報酬或在固定的預期報酬下,追求最低的風險。夏普比率是

32、一個衡量基金風險與收益關系的指標,最大回撤率是用來描述買入產品后可能出現的最糟糕的情況,它們是衡量股票投資風險的重要指標。這里我們主要以夏普率和最大回撤率這兩個指標來衡量交易結果。 2.4.2.4.策略具體過程及回測分析策略具體過程及回測分析 我們這里以滬深 300 作為交易標的,首先獲取觀測值的時間序列,這是后續進行模型計算的基礎。我們首先將特征變量分為價格類,成交量類和綜合類。對于收益率類特征變量,我們選取持倉時間長度收益率作為價格類特征變量;持倉期間夏普比率作為綜合類特征變量;5 日和持倉期平均成交量之比作為成交量類特征變量。響應變量我們選取滬深 300 股票的 5 日平均收益率。如圖

33、1、圖 2、圖 3、圖 4 所示,我們以持倉時間長度為 10 日為例,畫出 4 個變量對應數據的頻率分布直方圖: 圖 1 持倉時間平均收益率 圖 2 5 日平均收益率 資料來源:華西證券研究所 資料來源:華西證券研究所 圖 3 5 日和持倉期的平均成交量之比 圖 4 持倉時間長度內夏普比率 資料來源:華西證券研究所 資料來源:華西證券研究所 2.4.1.2.4.1.長短期記憶長短期記憶模型的優化模型的優化 證券研究報告|量化研究報告 請仔細閱讀在本報告尾部的重要法律聲明 11 (1)調整長短期記憶網絡的層數(num_layers) 本文在研究長短期記憶網絡層數的設置對回測結果的影響時,以夏普比

34、率、最大回撤率、勝率作為評價指標,其取值為當前長短期記憶網絡層數設置下的最優回測結果。初始時將長短期記憶網絡的層數設置為 1,然后通過將其增加至 3 層來研究長短期記憶網絡層數的設置對回測結果的影響,神經元節點數設置為 32。以 3:2 數據劃分訓練方式為例,研究結果如表 2 所示。 表 2:長短期記憶網絡層數對回測結果的影響 長短期記憶網絡層數 夏普比率 最大回撤率 勝率 1 0.52 0.3800 0.74 2 0.31 0.3800 0.75 3 0.28 0.3800 0.73 資料來源:華西證券研究所 從表 2 可以看出長短期記憶網絡層數的設置對回測結果的影響較大,并且隨著層數增加,

35、夏普比率有所降低。盡管已有部分研究表明適當增加長短期記憶網絡層數能夠提升模型預測能力,但在本文研究模型中,一層長短期記憶網絡層就已經能夠保證模型預測的效果。 (2)調整訓練批次(num_epochs) 單次 num_epochs 指的是將劃分的訓練數據輸入網絡進行一次完整的計算,它是影響模型輸入結構的重要參數之一,在每一個 num_epochs 下神經網絡中的神經元權重會不斷迭代更新。以 3:2 數據劃分訓練方式為例,研究結果如表 3 所示。 表 3:訓練批次對回測結果的影響 訓練批次 夏普比率 年化收益率 總收益率 最大回撤 勝率 交易次數 30 0.09 0.0458 29.2647 0.

36、4547 0.70 43 35 0.14 0.0568 36.2873 0.3122 0.71 34 55 0.30 0.1020 65.1207 0.3800 0.76 38 75 0.39 0.1246 79.5328 0.3800 0.72 43 84 0.52 0.1724 110.0464 0.3800 0.74 43 95 0.45 0.1493 95.3323 0.3800 0.77 43 基準 0.28 0.1002 63.9818 0.4670 資料來源:華西證券研究所 從表 3 可以看出長短期記憶網絡訓練批次的設置對回測結果的影響較大,并且隨著訓練批次增加,夏普比率呈現先上

37、升后下降的趨勢。本文中我們將訓練批次設置為84 將獲得較高的夏普率和較低的最大回撤率。 (3)調整長短期記憶網絡層神經元的個數(hidden_dim) 在訓練過程中長短期記憶網絡往往會將噪音進行放大,最終導致模型整體過擬合,長短期記憶網絡層神經元個數設置的越多,模型往往有更高的過擬合可能性。因此,神經元個數是影響模型最終性能的一個重要參數。本文使長短期記憶網絡的神經元個數在數組16,32,64,128中分別進行取值,探究其對回測結果的影響。以 3:2 數據劃分訓練方式為例,研究結果如表 4 所示。 表 4:長短期記憶網絡層神經元個數對回測結果的影響 長短期記憶網絡層神經元個數 夏普比率 最大回

38、撤率 勝率 16 0.28 0.3800 0.76 證券研究報告|量化研究報告 請仔細閱讀在本報告尾部的重要法律聲明 12 32 0.52 0.3800 0.74 64 0.35 0.3800 0.80 128 0.39 0.3800 0.76 資料來源:華西證券研究所 從表 4 可以看出長短期記憶網絡層神經元個數的設置對夏普比率影響較大,結合最大回撤率來看,將神經元個數設置為 32 為最佳。 2.4.2.2.4.2.3:3:2 2 的數據劃分訓練模式分析的數據劃分訓練模式分析 3:2 的數據劃分訓練模式是在拆分數據集(由 2005 年 1 月到 2021 年 7 月的滬深300 標的計算出的

39、 3 個特征變量值)時,將 60%的數據作為訓練數據,剩余的 40%的數據作為測試數據。這里通過對模型預測性能的調節,我們將模型訓練過程中的訓練批次確定為 84。從表 5 可以看出這種訓練方式的實現結果的夏普比率和最大回撤率都是在較大程度上好于基準的,且具有較高的交易勝率。 表 5:兩種訓練方式結果對比 夏普比率 年化收益率 總收益率 最大回撤 勝率 交易次數 數據劃分模式 0.52 0.1724 110.0464 0.3800 0.74 43 基準 0.28 0.1002 63.9818 0.4670 窗長窗移模式 0.61 0.1990 127.0886 0.2459 0.60 40 基準

40、 0.28 0.1002 63.9818 0.4670 資料來源:華西證券研究所 2.4.3.2.4.3.窗長窗移滾動訓練模式分析窗長窗移滾動訓練模式分析 窗長窗移滾動訓練模式的實現過程是第 1-30 天的數據用來訓練,第 31 天的數據用來測試,然后將 2-31 天數據用來訓練,第 32 天數據用來測試,以此類推。這里通過對模型預測性能的調節,我們將模型訓練過程中的訓練批次確定為 17。從表 5 可以看出,這種訓練方式可以獲得較高的夏普比率,較低的最大回撤率,較高的收益率和交易勝率。 證券研究報告|量化研究報告 請仔細閱讀在本報告尾部的重要法律聲明 13 圖 5:數據劃分訓練模式累計收益 圖

41、 6:窗長窗移訓練模式累計收益 資料來源:華西證券研究所 資料來源:華西證券研究所 圖 7:數據劃分訓練模式累計超額收益率 圖 8:窗長窗移訓練模式累計超額收益率 資料來源:華西證券研究所 資料來源:華西證券研究所 2.5.2.5.擇時策略討論擇時策略討論 神經網絡通過對人腦工作機制的模擬,以神經元之間權重連接的方式逐層建立起網絡架構,并且每個神經元都有偏置項和激活函數對數據信息進行非線性化變換,這使得運用神經網絡對股票價格建模能夠克服金融時序的非平穩性和非線性,從而最大限度的逼近和擬合實際的股票價格,因此神經網絡在預測股票價格的問題上優于傳統的建模方法。此外,神經網絡的各層神經元節點之間相互

42、連接,可訓練參數量通??梢赃_到上千上萬個,更多的可訓練參數可以更有效地發現數據之間的關系從而強化模型的表達能力。因此,利用長短期記憶網絡進行股票收益的預測是可行的。 長短期記憶模型主要包括兩個步驟,第一是通過訓練過程和優化過程求得模型的參數,第二是利用訓練好的模型對滬深 300 的 5 日平均收益率做出預測。根據機器學習中的經驗,我們將數據分為訓練集和測試集,首先在訓練集上進行模型的參數和觀測變量的調優選擇,之后固定調優參數在測試集上進行回測。 證券研究報告|量化研究報告 請仔細閱讀在本報告尾部的重要法律聲明 14 基于長短期記憶模型的擇時策略主要是通過預測股票市場的 5 日平均收益率得到這樣

43、的結論:預測結果為負值時,意味著市場的“負向”波動占主體直到變為正的為止;預測結果為正值時,意味著市場的“正向”波動占主體,直到變為負的為止。 3.3.總結總結 本篇報告我們提出了一個具有 3 個特征變量 1 個響應變量的長短期記憶模型來預測滬深 300 股價的 5 日平均收益率,采用兩種訓練方式對模型進行訓練,然后確定參數進行測試并且進行了交易回測。我們介紹了長短期記憶模型關鍵參數的選擇,特征變量的選擇,響應變量的選擇,并且闡述了其含義。在回測的過程中通過調整長短期記憶模型訓練的訓練批次,結合提出的擇時策略結果證明長短期記憶模型具有高收益,高夏普比,低回撤,高勝率的優點。 總結來看長短期記憶

44、模型具有以下特點: 1. 長短期記憶模型能夠處理非線性問題,具有長期記憶能力,泛化能力強。在分析復雜股票市場時,神經網絡作為深度學習領域技術,能夠很好地解決非線性問題。長短期記憶網絡在傳統的神經網絡上進行了優化,引入了“門”引入了“門”的概念,增強了該模型的長期記憶能力的概念,增強了該模型的長期記憶能力,合適的優化算法在一定程度上提高了模型的泛化能力,在序列建模問題上具有很大優勢; 2. 長短期記憶網絡對股票價格建模能夠克服金融時序的非平穩性和非線性,從而最大限度的逼近和擬合實際的股票價格; 3. 使用更多的可訓練參數去擬合股價問題很容易出現過擬合現象,這使得模型對過去的股票價格有很好的解釋能力,但對于未來的股票價格沒有任何預測能力。因此,長短期記憶模型需要充足數據保障其能夠在一定程度上緩解過擬合現象。 4. 長短期記憶網絡層數越深,節點越多,訓練時所花費的時間也就越長。如何加速訓練過程從而縮減模型的訓練時間對計算機軟硬件的發展提出了更高要求。 4.4.風險提示風險提示 模型基于對歷史數據統計,僅作為投資參考。 Table_AuthorTable_AuthorInfoInfo

友情提示

1、下載報告失敗解決辦法
2、PDF文件下載后,可能會被瀏覽器默認打開,此種情況可以點擊瀏覽器菜單,保存網頁到桌面,就可以正常下載了。
3、本站不支持迅雷下載,請使用電腦自帶的IE瀏覽器,或者360瀏覽器、谷歌瀏覽器下載即可。
4、本站報告下載后的文檔和圖紙-無水印,預覽文檔經過壓縮,下載后原文更清晰。

本文(機器學習擇時系列之三:LSTM模型市場擇時策略-210909(14頁).pdf)為本站 (小時候) 主動上傳,三個皮匠報告文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對上載內容本身不做任何修改或編輯。 若此文所含內容侵犯了您的版權或隱私,請立即通知三個皮匠報告文庫(點擊聯系客服),我們立即給予刪除!

溫馨提示:如果因為網速或其他原因下載失敗請重新下載,重復下載不扣分。
相關報告
客服
商務合作
小程序
服務號
折疊
午夜网日韩中文字幕,日韩Av中文字幕久久,亚洲中文字幕在线一区二区,最新中文字幕在线视频网站