问题背景¶

早期的在线投资组合选择（OLPS）方法依赖于对市场动态和数学优化的先验假设。随着计算能力和数据的增加，直接从数据中学习的数据驱动型 OLPS 方法引起了人们的关注。

虽然各种数据驱动型的 OLPS 方法都显示出了一定的前景，但评估和比较它们仍然是一个挑战。由于缺乏标准化的数据集和公平的比较，目前还不清楚哪种方法在真实环境中的表现最佳，这阻碍了该领域的进步。

研究人员往往会默认认为新的方法更优秀，但如果没有统一的测试条件，这种做法是不负责任的。金融时间序列高度非平稳，因此同一个方法在不同的数据集上可能会表现出截然不同的性能。

为了解决这个问题，我们推出了 FinOL —— 一个专为数据驱动型 OLPS 研究而设计的新型金融基准平台。 FinOL 提供了多样化的金融数据集，并给出了广泛的基准测试结果，以便进行公平比较。

符号¶

符号	描述
\(b_{t,i}\)	在交易期 \(t\) 开始时，投资于资产 \(i\) 的财富比例。
\(\mathbf{b}_t\)	在交易期 \(t\) 开始时，\(m\) 维的投资组合向量。
\({\mathbf{b}}_{1}\)	初始投资组合向量，通常是均匀分布的向量 \((1/m, \ldots, 1/m)\)。
\(\mathbf{b}_{t}^{\top} \mathbf{x}_t\)	交易期 \(t\) 结束时投资组合的日回报。
\(m\)	金融市场上的资产数量。
\(n\)	离散交易期总数。
\(S_n\)	在第 \(n\) 个交易期结束时获得的最终财富。
\(S_0\)	投资组合的初始价值，通常设置为 1。
\(x_{t,i}\)	在交易期 \(t\) 结束时，资产 \(i\) 的相对价格。
\(\mathbf{x}_t\)	在交易期 \(t\) 结束时，\(m\) 维的非负相对价格向量。
\(\Delta_m\)	单纯形约束，表明投资组合是完全自融资的，不允许杠杆或做空。

问题定义¶

在在线投资组合选择的背景下，我们分析了一个由 \(m\) 种资产组成的金融市场，这些资产在由 \(n\) 个离散交易期 (术语 “周期”的定义是灵活的) 组成的特定时间段内进行观察。在第 \(t\) 个交易期结束时，我们使用一个 \(m\) 维的非负相对价格向量 \(\mathbf{x}_t=(x_{t,1},\ldots,x_{t,m}) \in \mathbb{R}_{+}^{m}\) 来表示 \(m\) 个资产的表现，其中元素 \(x_{t,i}\) 等于第 \(t\) 个交易期资产 \(i\) 的收盘价除以第 \((t-1)\) 个交易期资产 \(i\) 的收盘价，即 \(x_{t,i}={C_{t,i}}/{C_{t-1,i}}\)。

在第 \(t\) 个交易期开始之前，利用过去的历史信息，我们可以构建一个投资组合向量 \(\mathbf{b}_t=(b_{t,1},\ldots,b_{t,m}) \in \mathbb{R}^m\) 以在 \(m\) 个资产中分配我们的财富。每个元素 \(b_{t,i}\) 代表在第 \(t\) 个交易期开始时，投资于资产 \(i\) 的财富比例。投资组合显然需要满足简单约束：\(\mathbf{b}_t \in \Delta_m\)，其中其中：\(b_{t,i} \ge 0\) 且 \(\sum\nolimits_{i=1}^{m}{{{b}_{t,i}}}=1\)。这个约束表明投资组合是完全自融资的，不允许杠杆或做空。

因此，在第 \(t\) 个交易期结束时，投资组合的每日回报定义为 \(\mathbf{b}_{t}^{\top} \mathbf{x}_t = \sum\nolimits_{i=1}^{m} b_{t,i}x_{t,i}\)。据此，投资组合在第 \(n\) 个交易期结束时实现的最终财富为：

\[{{S}_{n}}={{S}_{0}}\prod\limits_{t=1}^{n}{\mathbf{b}_{t}^{\top} {\mathbf{x}_{t}}}={{S}_{0}}\prod\limits_{t=1}^{n}{\sum\limits_{i=1}^{m}{{{b}_{t,i}}{{x}_{t,i}}}},\]

其中，在不失一般性的前提下，投资组合的初始值通常设置为 1，即：\({S}_{0} = 1\)；同时，投资组合向量初始化为均匀分布的向量，即：\({\mathbf{b}}_{1} = (1/m, \ldots, 1/m)\)。

显然，这项任务的目标是最大化最终的投资组合财富，而这完全取决于数据驱动法在每个时期生成的投资组合向量。