預構建模型¶
也參考
有關更多詳細信息,請參見 model_layer。
作為一個軟件包,FinOL 的一部分創新是在其模型層中預先實現的模型。這些預構建的模型為數據驅動的 OLPS 領域的研究人員提供了顯著的優勢,為他們提供了堅實的基礎。通過利用這些模型,研究人員可以簡化項目的初始階段,避免從頭構建複雜模型,從而節省寶貴的時間和資源。
時間序列表示模型¶
FinOL 中的時間序列表示模型旨在解決數據驅動的 OLPS 中順序數據的獨特挑戰。這些模型專門設計用於處理順序輸入,確保準確捕捉和分析金融時間序列數據中固有的時間依賴性。通過利用這些模型,研究人員可以深入洞察市場趨勢、價格波動及其他影響數據驅動 OLPS 任務的關鍵因素。
AlphaPortfolio¶
AlphaPortfolio 的整體框架¶
- 描述:
AlphaPortfolio 模型是一個基於 Transformer 的資產評分和投資組合選擇模型。
- 基本思想:
利用注意力機制根據資產的歷史表現進行評分。
- 模型構造:
- 優點:
資產評分的高準確性;通過經濟蒸餾提供的可解釋結果。
- 缺點:
計算密集型;需要仔細調整超參數。
- 細節:
AlphaPortfolio 模型接受形狀為
(batch_size, num_assets, num_features_augmented)的輸入張量x,其中num_features_augmented表示每個資產的特徵數量(包括任何預處理或增強的特徵)。AlphaPortfolio 模型的最終輸出是形狀為(batch_size, num_assets)的張量,表示對應資產的預測評分。
有關更多詳細信息,請參閱論文 AlphaPortfolio: Direct Construction through Reinforcement Learning and Interpretable AI。
Hyper-parameter |
Choice |
Hyper-parameter |
Choice |
|---|---|---|---|
Embedding dimension |
256 |
Optimizer |
SGD |
Feed-forward network |
1021 |
Learning rate |
0.0001 |
Number of multi-head |
4 |
Dropout ratio |
0.2 |
Number of TE layer |
1 |
Training epochs |
30 |
AlphaStock¶
AlphaStock 的關鍵組件¶
- 描述:
AlphaStock 模型是一個基於 LSTM 的資產評分和投資組合選擇模型。
- 基本思想:
利用 LSTM 捕捉資產數據中的順序依賴和全局依賴。
- 模型構造:
- 優點:
對時間序列數據有效;能夠隨時間學習複雜模式。
- 缺點:
可能會出現過擬合。
- 細節:
AlphaStock 模型接受形狀為
(batch_size, num_assets, num_features_augmented)的輸入張量x,其中num_features_augmented表示每個資產的特徵數量(包括任何預處理或增強的特徵)。AlphaStock 模型的最終輸出是形狀為(batch_size, num_assets)的張量,每個元素表示對應資產的預測評分。
有關更多詳細信息,請參閱論文 AlphaStock: A Buying-Winners-and-Selling-Losers Investment Strategy using Interpretable Deep Reinforcement Attention Networks。
DNN¶
- 描述:
用於資產評分和投資組合選擇的深度神經網絡模型。
- 基本思想:
實現多個全連接層以從輸入特徵中學習表示。
- 模型構造:
- 優點:
靈活的架構。
- 缺點:
沒有正則化的過擬合風險。
- 細節:
DNN 模型接受形狀為
(batch_size, num_assets, num_features_augmented)的輸入張量x,其中num_features_augmented表示每個資產的特徵數量(包括任何預處理或增強的特徵)。該模型的最終輸出是形狀為(batch_size, num_assets)的張量,每個元素表示對應資產的預測評分。
GRU¶
- 描述:
用於資產評分和投資組合選擇的門控循環單元模型。
- 基本思想:
類似於 LSTM,但具有更簡單的架構,專注於捕捉順序依賴性。
- 模型構造:
- 優點:
比 LSTM 計算需求低;訓練時間更快。
- 缺點:
可能無法像 LSTM 一樣有效捕捉長期依賴性。
- 細節:
GRU 模型接受形状为
(batch_size, num_assets, num_features_augmented)的输入张量x,其中num_features_augmented表示每个资产的特征数量(包括任何预处理或增强的特征)。该模型的最终输出是形状为(batch_size, num_assets)的张量,每个元素表示对应资产的预测评分。
LSRE-CAAN¶
LSRE-CAAN 的整体框架¶
- 描述:
LSRE-CAAN 模型是一个基于 Transformer 的资产评分和投资组合选择模型。
- 基本思想:
结合长序列表示和注意力机制,以解决 AlphaPortfolio 中的效率问题。
- 模型構造:
- 優點:
在处理长序列方面高效;强大的注意力机制。
- 缺點:
缺乏理论保证。
- 細節:
LSRE-CAAN 模型接受形状为
(batch_size, num_assets, num_features_augmented)的输入张量x,其中num_features_augmented表示每个资产的特征数量(包括任何预处理或增强的特征)。该模型的最终输出是形状为(batch_size, num_assets)的张量,每个元素表示对应资产的预测评分。
有關更多詳細信息,請參閱論文 Online portfolio management via deep reinforcement learning with high-frequency data。
Hyper-parameter |
Choice |
描述 |
|---|---|---|
Depth of net (L) |
1 |
The number of process layers in LSRE. |
Number of latents (M) |
1 |
The number of latents. |
Latent dimension (D) |
32 |
The size of the latent space. |
Number of cross-heads |
1 |
The number of heads for cross-attention. |
Number of latent-heads |
1 |
The number of heads for latent self-attention. |
Cross-attention dimension |
64 |
The number of dimensions per cross-attention head. |
Self-attention dimension |
32 |
The number of dimensions per latent self-attention head. |
Dropout ratio |
None |
No dropout is used following Jaegle et al. (2022). |
Embedding dimension |
None |
No Embedding layer is used, as illustrated in Section 4.1. |
Optimizer |
LAMB |
An optimizer specifically designed for Transformer-based models. |
Learning rate |
0.001 |
Parameter of the LAMB optimizer. |
Weight decay rate |
0.01 |
Parameter of the LAMB optimizer. |
Training steps |
104 |
Training times. |
Episode length (T) |
50 |
The length of an episode. |
G |
m/2 |
Half of the assets are identified as winners. |
W |
100 |
The look-back window size. |
LSTM¶
- 描述:
用於資產評分和投資組合選擇的長短期記憶模型。
- 基本思想:
旨在長時間記憶信息,適合時間序列數據。
- 模型構造:
- 優點:
非常適合捕捉時間依賴性;在時間序列領域廣泛使用。
- 缺點:
比傳統 RNN 更複雜;計算開銷可能較大。
- 細節:
LSTM 模型接受形狀為
(batch_size, num_assets, num_features_augmented)的輸入張量x,其中num_features_augmented表示每個資產的特徵數量(包括任何預處理或增強的特徵)。該模型的最終輸出是形狀為(batch_size, num_assets)的張量,每個元素表示對應資產的預測評分。
RNN¶
- 描述:
用于资产评分和投资组合选择的递归神经网络模型。
- 基本思想:
通过保持一个隐状态来处理数据序列,该隐状态捕捉来自先前输入的信息。
- 模型構造:
- 優點:
架构简单;对短期依赖有效。
- 缺點:
在长期依赖方面表现较差;可能会遭遇梯度消失问题。
- 細節:
RNN 模型接受形状为
(batch_size, num_assets, num_features_augmented)的输入张量x,其中num_features_augmented表示每个资产的特征数量(包括任何预处理或增强的特征)。该模型的最终输出是形状为(batch_size, num_assets)的张量,每个元素表示对应资产的预测评分。
TCN¶
- 描述:
用于资产评分和投资组合选择的时序卷积网络模型。
- 基本思想:
利用卷积层捕捉序列中的时间依赖性。
- 模型構造:
- 優點:
能夠處理長距離依賴;支持並行訓練。
- 缺點:
可能需要仔細設計網絡架構;比 RNN 的可解釋性差。
- 細節:
TCN 模型接受形狀為
(batch_size, num_assets, num_features_augmented)的輸入張量x,其中num_features_augmented表示每個資產的特徵數量(包括任何預處理或增強的特徵)。該模型的最終輸出是形狀為(batch_size, num_assets)的張量,每個元素表示對應資產的預測評分。
Transformer¶
- 描述:
用於資產評分和投資組合選擇的 Transformer 模型。
- 基本思想:
採用自注意力機制並行處理序列。
- 模型構造:
- 優點:
對於廣泛的任務非常有效;能夠捕捉複雜關係。
- 缺點:
需要大量計算資源。
- 細節:
Transformer 模型接受形狀為
(batch_size, num_assets, num_features_augmented)的輸入張量x,其中num_features_augmented表示每個資產的特徵數量(包括任何預處理或增強的特徵)。該模型的最終輸出是形狀為(batch_size, num_assets)的張量,每個元素表示對應資產的預測評分。
圖像表示模型¶
除了時間序列數據,FinOL 還提供圖像表示模型。這些模型旨在從金融圖像中提取有意義的表示,例如圖表、圖形和其他視覺數據。通過這樣做,它使研究人員能夠利用視覺格式中包含的大量信息,這對模式識別、趨勢分析等任務至關重要。將此模型納入 FinOL 進一步鞏固了其作為數據驅動 OLPS 研究的多功能工具的地位。
CNN¶
- 描述:
用於資產評分和投資組合選擇的卷積神經網絡模型。
- 基本思想:
應用卷積層從資產的圖像中提取特徵。
- 模型構造:
- 優點:
對圖像分類和特徵提取有效。
- 缺點:
需要大量計算資源。
- 細節:
CNN 模型接受形狀為
(batch_size, num_assets, height, width)的輸入張量x,其中height和width是每個資產的圖像尺寸。該模型的最終輸出是形狀為(batch_size, num_assets)的張量,每個元素表示對應資產的預測評分。
CNN-JF¶
CNN-JF 的整體框架¶
- 描述:
CNN-JF 模型是一個基於 CNN 的資產評分和投資組合選擇模型。它利用 CNN 來分析以圖像形式表示的歷史股票價格數據。
- 基本思想:
利用 CNN 架構捕捉以視覺方式表示的金融時間序列中的模式。
- 模型構造:
- 優點:
結合視覺數據分析和金融建模的優勢。
- 缺點:
需要大量計算資源。
- 細節:
CNN-JF 模型接受形狀為
(batch_size, num_assets, height, width)的輸入張量x,其中height和width是每個資產的圖像尺寸。該模型的最終輸出是形狀為(batch_size, num_assets)的張量,每個元素表示對應資產的預測評分。
有關更多詳細信息,請參閱論文 (Re-)Imag(in)ing Price Trends。
Hyper-parameter |
Choice |
Hyper-parameter |
Choice |
|---|---|---|---|
Kernel Size Height |
5 |
Kernel Size Width |
3 |
Stride Height |
3 |
Stride Width |
1 |
Dilation Height |
2 |
Dilation Width |
1 |
Padding Height |
12 |
Padding Width |
1 |
Dropout Rate |
0.5 |