預構建模型

也參考

有關更多詳細信息,請參見 model_layer

作為一個軟件包,FinOL 的一部分創新是在其模型層中預先實現的模型。這些預構建的模型為數據驅動的 OLPS 領域的研究人員提供了顯著的優勢,為他們提供了堅實的基礎。通過利用這些模型,研究人員可以簡化項目的初始階段,避免從頭構建複雜模型,從而節省寶貴的時間和資源。

時間序列表示模型

FinOL 中的時間序列表示模型旨在解決數據驅動的 OLPS 中順序數據的獨特挑戰。這些模型專門設計用於處理順序輸入,確保準確捕捉和分析金融時間序列數據中固有的時間依賴性。通過利用這些模型,研究人員可以深入洞察市場趨勢、價格波動及其他影響數據驅動 OLPS 任務的關鍵因素。

AlphaPortfolio

../_images/AlphaPortfolio.png

AlphaPortfolio 的整體框架

描述:

AlphaPortfolio 模型是一個基於 Transformer 的資產評分和投資組合選擇模型。

基本思想:

利用注意力機制根據資產的歷史表現進行評分。

模型構造:

AlphaPortfolio 源代碼

優點:

資產評分的高準確性;通過經濟蒸餾提供的可解釋結果。

缺點:

計算密集型;需要仔細調整超參數。

細節:

AlphaPortfolio 模型接受形狀為 (batch_size, num_assets, num_features_augmented) 的輸入張量 x,其中 num_features_augmented 表示每個資產的特徵數量(包括任何預處理或增強的特徵)。AlphaPortfolio 模型的最終輸出是形狀為 (batch_size, num_assets) 的張量,表示對應資產的預測評分。

有關更多詳細信息,請參閱論文 AlphaPortfolio: Direct Construction through Reinforcement Learning and Interpretable AI

表 C.1:基於 TE-CAAN 的 AP 的超參數。

Hyper-parameter

Choice

Hyper-parameter

Choice

Embedding dimension

256

Optimizer

SGD

Feed-forward network

1021

Learning rate

0.0001

Number of multi-head

4

Dropout ratio

0.2

Number of TE layer

1

Training epochs

30

AlphaStock

../_images/AlphaStock.png

AlphaStock 的關鍵組件

描述:

AlphaStock 模型是一個基於 LSTM 的資產評分和投資組合選擇模型。

基本思想:

利用 LSTM 捕捉資產數據中的順序依賴和全局依賴。

模型構造:

AlphaStock 源代碼

優點:

對時間序列數據有效;能夠隨時間學習複雜模式。

缺點:

可能會出現過擬合。

細節:

AlphaStock 模型接受形狀為 (batch_size, num_assets, num_features_augmented) 的輸入張量 x,其中 num_features_augmented 表示每個資產的特徵數量(包括任何預處理或增強的特徵)。AlphaStock 模型的最終輸出是形狀為 (batch_size, num_assets) 的張量,每個元素表示對應資產的預測評分。

有關更多詳細信息,請參閱論文 AlphaStock: A Buying-Winners-and-Selling-Losers Investment Strategy using Interpretable Deep Reinforcement Attention Networks

DNN

描述:

用於資產評分和投資組合選擇的深度神經網絡模型。

基本思想:

實現多個全連接層以從輸入特徵中學習表示。

模型構造:

DNN 源代碼

優點:

靈活的架構。

缺點:

沒有正則化的過擬合風險。

細節:

DNN 模型接受形狀為 (batch_size, num_assets, num_features_augmented) 的輸入張量 x,其中 num_features_augmented 表示每個資產的特徵數量(包括任何預處理或增強的特徵)。該模型的最終輸出是形狀為 (batch_size, num_assets) 的張量,每個元素表示對應資產的預測評分。

GRU

描述:

用於資產評分和投資組合選擇的門控循環單元模型。

基本思想:

類似於 LSTM,但具有更簡單的架構,專注於捕捉順序依賴性。

模型構造:

GRU 源代碼

優點:

比 LSTM 計算需求低;訓練時間更快。

缺點:

可能無法像 LSTM 一樣有效捕捉長期依賴性。

細節:

GRU 模型接受形状为 (batch_size, num_assets, num_features_augmented) 的输入张量 x,其中 num_features_augmented 表示每个资产的特征数量(包括任何预处理或增强的特征)。该模型的最终输出是形状为 (batch_size, num_assets) 的张量,每个元素表示对应资产的预测评分。

LSRE-CAAN

../_images/LSRE-CAAN.jpg

LSRE-CAAN 的整体框架

描述:

LSRE-CAAN 模型是一个基于 Transformer 的资产评分和投资组合选择模型。

基本思想:

结合长序列表示和注意力机制,以解决 AlphaPortfolio 中的效率问题。

模型構造:

LSRE_CAAN 源代码

優點:

在处理长序列方面高效;强大的注意力机制。

缺點:

缺乏理论保证。

細節:

LSRE-CAAN 模型接受形状为 (batch_size, num_assets, num_features_augmented) 的输入张量 x,其中 num_features_augmented 表示每个资产的特征数量(包括任何预处理或增强的特征)。该模型的最终输出是形状为 (batch_size, num_assets) 的张量,每个元素表示对应资产的预测评分。

有關更多詳細信息,請參閱論文 Online portfolio management via deep reinforcement learning with high-frequency data

表 7:LSRE-CAAN 框架的超參數。

Hyper-parameter

Choice

描述

Depth of net (L)

1

The number of process layers in LSRE.

Number of latents (M)

1

The number of latents.

Latent dimension (D)

32

The size of the latent space.

Number of cross-heads

1

The number of heads for cross-attention.

Number of latent-heads

1

The number of heads for latent self-attention.

Cross-attention dimension

64

The number of dimensions per cross-attention head.

Self-attention dimension

32

The number of dimensions per latent self-attention head.

Dropout ratio

None

No dropout is used following Jaegle et al. (2022).

Embedding dimension

None

No Embedding layer is used, as illustrated in Section 4.1.

Optimizer

LAMB

An optimizer specifically designed for Transformer-based models.

Learning rate

0.001

Parameter of the LAMB optimizer.

Weight decay rate

0.01

Parameter of the LAMB optimizer.

Training steps

104

Training times.

Episode length (T)

50

The length of an episode.

G

m/2

Half of the assets are identified as winners.

W

100

The look-back window size.

LSTM

描述:

用於資產評分和投資組合選擇的長短期記憶模型。

基本思想:

旨在長時間記憶信息,適合時間序列數據。

模型構造:

LSTM 源代碼

優點:

非常適合捕捉時間依賴性;在時間序列領域廣泛使用。

缺點:

比傳統 RNN 更複雜;計算開銷可能較大。

細節:

LSTM 模型接受形狀為 (batch_size, num_assets, num_features_augmented) 的輸入張量 x,其中 num_features_augmented 表示每個資產的特徵數量(包括任何預處理或增強的特徵)。該模型的最終輸出是形狀為 (batch_size, num_assets) 的張量,每個元素表示對應資產的預測評分。

RNN

描述:

用于资产评分和投资组合选择的递归神经网络模型。

基本思想:

通过保持一个隐状态来处理数据序列,该隐状态捕捉来自先前输入的信息。

模型構造:

RNN 源代码

優點:

架构简单;对短期依赖有效。

缺點:

在长期依赖方面表现较差;可能会遭遇梯度消失问题。

細節:

RNN 模型接受形状为 (batch_size, num_assets, num_features_augmented) 的输入张量 x,其中 num_features_augmented 表示每个资产的特征数量(包括任何预处理或增强的特征)。该模型的最终输出是形状为 (batch_size, num_assets) 的张量,每个元素表示对应资产的预测评分。

TCN

描述:

用于资产评分和投资组合选择的时序卷积网络模型。

基本思想:

利用卷积层捕捉序列中的时间依赖性。

模型構造:

TCN 源代碼

優點:

能夠處理長距離依賴;支持並行訓練。

缺點:

可能需要仔細設計網絡架構;比 RNN 的可解釋性差。

細節:

TCN 模型接受形狀為 (batch_size, num_assets, num_features_augmented) 的輸入張量 x,其中 num_features_augmented 表示每個資產的特徵數量(包括任何預處理或增強的特徵)。該模型的最終輸出是形狀為 (batch_size, num_assets) 的張量,每個元素表示對應資產的預測評分。

Transformer

描述:

用於資產評分和投資組合選擇的 Transformer 模型。

基本思想:

採用自注意力機制並行處理序列。

模型構造:

Transformer 源代碼

優點:

對於廣泛的任務非常有效;能夠捕捉複雜關係。

缺點:

需要大量計算資源。

細節:

Transformer 模型接受形狀為 (batch_size, num_assets, num_features_augmented) 的輸入張量 x,其中 num_features_augmented 表示每個資產的特徵數量(包括任何預處理或增強的特徵)。該模型的最終輸出是形狀為 (batch_size, num_assets) 的張量,每個元素表示對應資產的預測評分。

圖像表示模型

除了時間序列數據,FinOL 還提供圖像表示模型。這些模型旨在從金融圖像中提取有意義的表示,例如圖表、圖形和其他視覺數據。通過這樣做,它使研究人員能夠利用視覺格式中包含的大量信息,這對模式識別、趨勢分析等任務至關重要。將此模型納入 FinOL 進一步鞏固了其作為數據驅動 OLPS 研究的多功能工具的地位。

CNN

描述:

用於資產評分和投資組合選擇的卷積神經網絡模型。

基本思想:

應用卷積層從資產的圖像中提取特徵。

模型構造:

CNN 源代碼

優點:

對圖像分類和特徵提取有效。

缺點:

需要大量計算資源。

細節:

CNN 模型接受形狀為 (batch_size, num_assets, height, width) 的輸入張量 x,其中 heightwidth 是每個資產的圖像尺寸。該模型的最終輸出是形狀為 (batch_size, num_assets) 的張量,每個元素表示對應資產的預測評分。

CNN-JF

../_images/CNN-JF.png

CNN-JF 的整體框架

描述:

CNN-JF 模型是一個基於 CNN 的資產評分和投資組合選擇模型。它利用 CNN 來分析以圖像形式表示的歷史股票價格數據。

基本思想:

利用 CNN 架構捕捉以視覺方式表示的金融時間序列中的模式。

模型構造:

CNN_JF 源代碼

優點:

結合視覺數據分析和金融建模的優勢。

缺點:

需要大量計算資源。

細節:

CNN-JF 模型接受形狀為 (batch_size, num_assets, height, width) 的輸入張量 x,其中 heightwidth 是每個資產的圖像尺寸。該模型的最終輸出是形狀為 (batch_size, num_assets) 的張量,每個元素表示對應資產的預測評分。

有關更多詳細信息,請參閱論文 (Re-)Imag(in)ing Price Trends

(Re-)Imag(in)ing Price Trends 的超參數。

Hyper-parameter

Choice

Hyper-parameter

Choice

Kernel Size Height

5

Kernel Size Width

3

Stride Height

3

Stride Width

1

Dilation Height

2

Dilation Width

1

Padding Height

12

Padding Width

1

Dropout Rate

0.5