问题背景

早期的在线投资组合选择(OLPS)方法依赖于对市场动态和数学优化的先验假设。随着计算能力和数据的增加,直接从数据中学习的数据驱动型 OLPS 方法引起了人们的关注。

虽然各种数据驱动型的 OLPS 方法都显示出了一定的前景,但评估和比较它们仍然是一个挑战。由于缺乏标准化的数据集和公平的比较,目前还不清楚哪种方法在真实环境中的表现最佳,这阻碍了该领域的进步。

研究人员往往会默认认为新的方法更优秀,但如果没有统一的测试条件,这种做法是不负责任的。金融时间序列高度非平稳,因此同一个方法在不同的数据集上可能会表现出截然不同的性能。

为了解决这个问题,我们推出了 FinOL —— 一个专为数据驱动型 OLPS 研究而设计的新型金融基准平台。 FinOL 提供了多样化的金融数据集,并给出了广泛的基准测试结果,以便进行公平比较。

符号

符号

描述

\(b_{t,i}\)

在交易期 \(t\) 开始时,投资于资产 \(i\) 的财富比例。

\(\mathbf{b}_t\)

在交易期 \(t\) 开始时,\(m\) 维的投资组合向量。

\({\mathbf{b}}_{1}\)

初始投资组合向量,通常是均匀分布的向量 \((1/m, \ldots, 1/m)\)

\(\mathbf{b}_{t}^{\top} \mathbf{x}_t\)

交易期 \(t\) 结束时投资组合的日回报。

\(m\)

金融市场上的资产数量。

\(n\)

离散交易期总数。

\(S_n\)

在第 \(n\) 个交易期结束时获得的最终财富。

\(S_0\)

投资组合的初始价值,通常设置为 1。

\(x_{t,i}\)

在交易期 \(t\) 结束时,资产 \(i\) 的相对价格。

\(\mathbf{x}_t\)

在交易期 \(t\) 结束时,\(m\) 维的非负相对价格向量。

\(\Delta_m\)

单纯形约束,表明投资组合是完全自融资的,不允许杠杆或做空。

问题定义

在在线投资组合选择的背景下,我们分析了一个由 \(m\) 种资产组成的金融市场,这些资产在由 \(n\) 个离散交易期 (术语 “周期”的定义是灵活的) 组成的特定时间段内进行观察。在第 \(t\) 个交易期结束时,我们使用一个 \(m\) 维的非负相对价格向量 \(\mathbf{x}_t=(x_{t,1},\ldots,x_{t,m}) \in \mathbb{R}_{+}^{m}\) 来表示 \(m\) 个资产的表现,其中元素 \(x_{t,i}\) 等于第 \(t\) 个交易期资产 \(i\) 的收盘价除以第 \((t-1)\) 个交易期资产 \(i\) 的收盘价,即 \(x_{t,i}={C_{t,i}}/{C_{t-1,i}}\)

在第 \(t\) 个交易期开始之前,利用过去的历史信息,我们可以构建一个投资组合向量 \(\mathbf{b}_t=(b_{t,1},\ldots,b_{t,m}) \in \mathbb{R}^m\) 以在 \(m\) 个资产中分配我们的财富。每个元素 \(b_{t,i}\) 代表在第 \(t\) 个交易期开始时,投资于资产 \(i\) 的财富比例。投资组合显然需要满足简单约束:\(\mathbf{b}_t \in \Delta_m\),其中其中:\(b_{t,i} \ge 0\)\(\sum\nolimits_{i=1}^{m}{{{b}_{t,i}}}=1\)。 这个约束表明投资组合是完全自融资的,不允许杠杆或做空。

因此,在第 \(t\) 个交易期结束时,投资组合的每日回报定义为 \(\mathbf{b}_{t}^{\top} \mathbf{x}_t = \sum\nolimits_{i=1}^{m} b_{t,i}x_{t,i}\)。据此,投资组合在第 \(n\) 个交易期结束时实现的最终财富为:

\[{{S}_{n}}={{S}_{0}}\prod\limits_{t=1}^{n}{\mathbf{b}_{t}^{\top} {\mathbf{x}_{t}}}={{S}_{0}}\prod\limits_{t=1}^{n}{\sum\limits_{i=1}^{m}{{{b}_{t,i}}{{x}_{t,i}}}},\]

其中,在不失一般性的前提下,投资组合的初始值通常设置为 1,即:\({S}_{0} = 1\);同时,投资组合向量初始化为均匀分布的向量,即:\({\mathbf{b}}_{1} = (1/m, \ldots, 1/m)\)

显然,这项任务的目标是最大化最终的投资组合财富,而这完全取决于数据驱动法在每个时期生成的投资组合向量。