問題背景¶
早期的在線投資組合選擇(OLPS)方法依賴於對市場動態和數學優化的先驗假設。隨著計算能力和數據的增加,直接從數據中學習的數據驅動型 OLPS 方法引起了人們的關注。
雖然各種數據驅動型的 OLPS 方法都顯示出了一定的前景,但評估和比較它們仍然是一個挑戰。由於缺乏標準化的數據集和公平的比較,目前還不清楚哪種方法在真實環境中的表現最佳,這阻礙了該領域的進步。
研究人員往往會默認認為新的方法更優秀,但如果没有統一的測試條件,這種做法是不负责任的。金融時間序列高度非穩定,因此同一個方法在不同的數據集上可能會表現出截然不同的性能。
為了解決這個問題,我們推出了 FinOL —— 一個專為數據驅動型 OLPS 研究而設計的新型金融基準平台。 FinOL 提供了多樣化的金融數據集,並給出了廣泛的基準測試結果,以便進行公平比較。
符號¶
符號 |
描述 |
|---|---|
\(b_{t,i}\) |
在交易期 \(t\) 開始時,投資於資產 \(i\) 的財富比例。 |
\(\mathbf{b}_t\) |
在交易期 \(t\) 開始時,\(m\) 維的投資組合向量。 |
\({\mathbf{b}}_{1}\) |
初始投資組合向量,通常是均勻分布的向量 \((1/m, \ldots, 1/m)\)。 |
\(\mathbf{b}_{t}^{\top} \mathbf{x}_t\) |
交易期 \(t\) 結束時投資組合的日回報。 |
\(m\) |
金融市場上的資產數量。 |
\(n\) |
離散交易期總數。 |
\(S_n\) |
在第 \(n\) 個交易期結束時獲得的最終財富。 |
\(S_0\) |
投資組合的初始價值,通常設定為 1。 |
\(x_{t,i}\) |
在交易期 \(t\) 結束時,資產 \(i\) 的相對價格。 |
\(\mathbf{x}_t\) |
在交易期 \(t\) 結束時,\(m\) 維的非負相對價格向量。 |
\(\Delta_m\) |
單純形約束,表明投資組合是完全自融資的,不允許槓桿或做空。 |
問題定義¶
在線上投資組合選擇的背景下,我們分析了一個由 \(m\) 種資產組成的金融市場,這些資產在由 \(n\) 個離散交易期 (術語 「周期」的定義是靈活的) 組成的特定時間段內進行觀察。在第 \(t\) 個交易期結束時,我們使用一個 \(m\) 維的非負相對價格向量 \(\mathbf{x}_t=(x_{t,1},\ldots,x_{t,m}) \in \mathbb{R}_{+}^{m}\) 來表示 \(m\) 個資產的表現,其中元素 \(x_{t,i}\) 等於第 \(t\) 個交易期資產 \(i\) 的收市價除以第 \((t-1)\) 個交易期資產 \(i\) 的收市價,即 \(x_{t,i}={C_{t,i}}/{C_{t-1,i}}\)。
在第 \(t\) 個交易期開始之前,利用過去的歷史資訊,我們可以構建一個投資組合向量 \(\mathbf{b}_t=(b_{t,1},\ldots,b_{t,m}) \in \mathbb{R}^m\) 以在 \(m\) 個資產中分配我們的財富。每個元素 \(b_{t,i}\) 代表在第 \(t\) 個交易期開始時,投資於資產 \(i\) 的財富比例。投資組合顯然需要滿足簡單約束:\(\mathbf{b}_t \in \Delta_m\),其中其中:\(b_{t,i} \ge 0\) 且 \(\sum\nolimits_{i=1}^{m}{{{b}_{t,i}}}=1\)。 這個約束表明投資組合是完全自融資的,不允許槓桿或做空。
因此,在第 \(t\) 個交易期結束時,投資組合的每日回報定義為 \(\mathbf{b}_{t}^{\top} \mathbf{x}_t = \sum\nolimits_{i=1}^{m} b_{t,i}x_{t,i}\)。据此,投資組合在第 \(n\) 個交易期結束時實現的最終財富為:
其中,在不喪失一般性的前提下,投資組合的初始值通常設定為 1,即:\({S}_{0} = 1\);同時,投資組合向量初始化為均勻分布的向量,即:\({\mathbf{b}}_{1} = (1/m, \ldots, 1/m)\)。
顯然,這項任務的目標是最大化最終的投資組合財富,而這完全取決於數據驅動法在每個時期生成的投資組合向量。