复制普通股票型基金指数——机器学习方法

导读：

万得普通股票型基金指数（885000.WI）年化收益高达17%左右，值得复制。

组合复制技术(Mimic Portfolio)是金融投资实战中的一项重要技能，在金融学术研究中也有充分的研究，传统方法是先计算被复制标的在因子上的暴露，然后对基础资产进行组合使得它的暴露与被复制资产的因子暴露相同。

实际计算中传统方法不但繁琐，而且复制的准确度并不好。我们采用高维统计中的稀疏优化算法，直接输入大量(几千列)基金收益率数据，即可获得尽量数量少基础资产的组合，且跟踪误差小。

摘要

1.模型思路与效果：利用普通股票基金的日度收益率矩阵数据，去复制万得普通股票型基金指数（885000.WI）。

（1）调仓频率：季度末调仓；

（2）组合资产个数：三十多个权益基金。

模型思路是跟踪误差最小化，模型解法是机器学习算法，算法下文会展示。具体效果如下。

2.算法原理：传统方法通过寻找定价因子，计算目标组合beta，再通过优化技术让模仿组合beta和其相等，以此达到复制的目的。流程较长，每个流程都涉及不同的统计和优化技术。考虑复杂系统的不稳定性。

我们试图利用更直接的方法来复制，设计一种优化算法，直接利用基础资产的某种组合来跟踪目标组合的收益序列。事实证明，在优化方法构造得当的情形下，是可以利用较少基金组合来模仿目标组合的收益表现。我们利用统计学习中的稀疏优化算法，去求解跟踪误差最小化问题。

正文

1.机器学习算法效果

利用20200101-20221125区间的普通股票基金的日度收益率数据，去复制万得普通股票型基金指数（885000.WI）。每个季度末调仓，每一期FOF组合大概有三十多个权益基金。模型思路是跟踪误差最小化，模型解法是机器学习算法，算法下文会展示。具体效果如下。

下图红色线是模仿组合累积收益曲线，淡蓝色线是指数，可以看出过去三年，机器学习组合能够较好的复制普通股票型基金指数。

图 1：复制组合走势

资料来源：Wind，中泰证券研究所

2. 调仓与每期持仓概况

每个季度末调仓；每期大概三十多个基金构成组合。

表1：每期持仓组合

资料来源：Wind，中泰证券研究所

表2：最新一期持仓

资料来源：Wind，中泰证券研究所

3. 算法原理

传统方法通过寻找定价因子，计算目标组合beta，再通过优化技术让模仿组合beta和其相等，以此达到复制的目的。流程较长，每个流程都涉及不同的统计和优化技术。考虑复杂系统的不稳定性，我们试图利用更直接的方法来复制，设计一种优化算法，直接利用基础资产的某种组合来跟踪目标组合的收益序列。事实证明，在优化方法构造得当的情形下，是可以利用较少基金组合来模仿目标组合的收益表现。需要特别说明的是，文中介绍的方法，计算效率高且无需日常维护。

假设一个目标组合是一个指数，由N项资产组成。记

，

分别为该指数及N项资产过去T天的（算术）净收益率，其中

为N项资产在第t天的净收益。

我们的目标是设计稀疏投资组合

，满足

，以追踪指数，使得

。相当于要解决的优化问题为：

其中

代表一般跟踪误差，

为控制投资组合稀疏性的正则化参数，以及

为组合权重上限。

范数由连续和可微（对于

）函数近似：

其中p>0 是控制估计的参数。于是转变成以下近似问题：

其中

。

有多种类型的目标函数可供选择，例如经验跟踪误差（ETE）、下行风险（DR）、Huber经验跟踪误差（HETE）、Huber下行风险（HDR）等。此处，我们选取经验跟踪误差（ETE）为目标函数：

因为经验跟踪误差就是我们常规的指数复制技术，选取该目标函数主要是为了验证优化算法，如果这个目标函数下，模仿组合能够跟住，那么说明这套优化算法是合适的。

无论选择何种跟踪误差类型，问题（1）都可以通过一种迭代的闭合形式更新算法——优化最小化来求解（迭代次数用k表示）。可以看出，上述所有变化归结为以下凸问题的迭代优化：

其中

，

求解上述优化问题的算法细节请参考：

《稀疏统计学习及其应用》，作者为斯坦福大学两位统计学泰斗Trevor Hastie、Robert Tibshirani。

风险提示：本报告结论完全基于公开的历史数据进行统计、测算，文中部分数据有一定滞后性，同时存在第三方数据提供不准确风险；模型均基于历史数据得到的统计结论且模型自身具有一定局限性并不能完全准确地刻画现实环境以及预测未来；模型根据历史规律总结，历史规律可能失效；模型结论基于统计工具得到，在极端情形下或存在解释力不足的风险，因此其结果仅做分析参考。

复制普通股票型基金指数——机器学习方法

1.机器学习算法效果

2. 调仓与每期持仓概况

3. 算法原理

相关文章