問題背景¶

早期的在線投資組合選擇（OLPS）方法依賴於對市場動態和數學優化的先驗假設。隨著計算能力和數據的增加，直接從數據中學習的數據驅動型 OLPS 方法引起了人們的關注。

雖然各種數據驅動型的 OLPS 方法都顯示出了一定的前景，但評估和比較它們仍然是一個挑戰。由於缺乏標準化的數據集和公平的比較，目前還不清楚哪種方法在真實環境中的表現最佳，這阻礙了該領域的進步。

研究人員往往會默認認為新的方法更優秀，但如果没有統一的測試條件，這種做法是不负责任的。金融時間序列高度非穩定，因此同一個方法在不同的數據集上可能會表現出截然不同的性能。

為了解決這個問題，我們推出了 FinOL —— 一個專為數據驅動型 OLPS 研究而設計的新型金融基準平台。 FinOL 提供了多樣化的金融數據集，並給出了廣泛的基準測試結果，以便進行公平比較。

符號¶

符號	描述
\(b_{t,i}\)	在交易期 \(t\) 開始時，投資於資產 \(i\) 的財富比例。
\(\mathbf{b}_t\)	在交易期 \(t\) 開始時，\(m\) 維的投資組合向量。
\({\mathbf{b}}_{1}\)	初始投資組合向量，通常是均勻分布的向量 \((1/m, \ldots, 1/m)\)。
\(\mathbf{b}_{t}^{\top} \mathbf{x}_t\)	交易期 \(t\) 結束時投資組合的日回報。
\(m\)	金融市場上的資產數量。
\(n\)	離散交易期總數。
\(S_n\)	在第 \(n\) 個交易期結束時獲得的最終財富。
\(S_0\)	投資組合的初始價值，通常設定為 1。
\(x_{t,i}\)	在交易期 \(t\) 結束時，資產 \(i\) 的相對價格。
\(\mathbf{x}_t\)	在交易期 \(t\) 結束時，\(m\) 維的非負相對價格向量。
\(\Delta_m\)	單純形約束，表明投資組合是完全自融資的，不允許槓桿或做空。

問題定義¶

在線上投資組合選擇的背景下，我們分析了一個由 \(m\) 種資產組成的金融市場，這些資產在由 \(n\) 個離散交易期 (術語「周期」的定義是靈活的) 組成的特定時間段內進行觀察。在第 \(t\) 個交易期結束時，我們使用一個 \(m\) 維的非負相對價格向量 \(\mathbf{x}_t=(x_{t,1},\ldots,x_{t,m}) \in \mathbb{R}_{+}^{m}\) 來表示 \(m\) 個資產的表現，其中元素 \(x_{t,i}\) 等於第 \(t\) 個交易期資產 \(i\) 的收市價除以第 \((t-1)\) 個交易期資產 \(i\) 的收市價，即 \(x_{t,i}={C_{t,i}}/{C_{t-1,i}}\)。

在第 \(t\) 個交易期開始之前，利用過去的歷史資訊，我們可以構建一個投資組合向量 \(\mathbf{b}_t=(b_{t,1},\ldots,b_{t,m}) \in \mathbb{R}^m\) 以在 \(m\) 個資產中分配我們的財富。每個元素 \(b_{t,i}\) 代表在第 \(t\) 個交易期開始時，投資於資產 \(i\) 的財富比例。投資組合顯然需要滿足簡單約束：\(\mathbf{b}_t \in \Delta_m\)，其中其中：\(b_{t,i} \ge 0\) 且 \(\sum\nolimits_{i=1}^{m}{{{b}_{t,i}}}=1\)。這個約束表明投資組合是完全自融資的，不允許槓桿或做空。

因此，在第 \(t\) 個交易期結束時，投資組合的每日回報定義為 \(\mathbf{b}_{t}^{\top} \mathbf{x}_t = \sum\nolimits_{i=1}^{m} b_{t,i}x_{t,i}\)。据此，投資組合在第 \(n\) 個交易期結束時實現的最終財富為：

\[{{S}_{n}}={{S}_{0}}\prod\limits_{t=1}^{n}{\mathbf{b}_{t}^{\top} {\mathbf{x}_{t}}}={{S}_{0}}\prod\limits_{t=1}^{n}{\sum\limits_{i=1}^{m}{{{b}_{t,i}}{{x}_{t,i}}}},\]

其中，在不喪失一般性的前提下，投資組合的初始值通常設定為 1，即：\({S}_{0} = 1\)；同時，投資組合向量初始化為均勻分布的向量，即：\({\mathbf{b}}_{1} = (1/m, \ldots, 1/m)\)。

顯然，這項任務的目標是最大化最終的投資組合財富，而這完全取決於數據驅動法在每個時期生成的投資組合向量。