三步拆解公募量化模型

首页 > 资讯 > > 正文

三步拆解公募量化模型

2023-06-19 15:10:46 来源：散装基精锦鲤

前面发文，说我最近在“深入”研究AI，深入到什么程度呢？身体日渐消瘦，一日不如一日。所以，大家在和AI交流时，要注意保护好自己。

(相关资料图)

不过，当前各种AI模型采用的机器学习思路，本质上只是一种“限定条件下选出的最优解”，而非创造一个全新解。以咨询ChatGPT如何买基金为例，如果你直接说“给我推荐一只基金”，得到的答复大概率是“我不能给出具体的投资建议”……就算你强制要求它给出一个结论，得到的也只会是一大段废话，比如它会告诉你先评估自己的风险承受能力、资金占用期限、预期收益回报等等等等，但最终也不会给出一个答复。

我试验下来，最接近让ChatGPT给出结论的方法，就是真的通过10-15个问题去框定一些前提（比如上文提到的风险承受能力等等），然后它就会给到你一个选基范围（比如主动权益基、被动指数债基等等），并且告诉你更应该关注这些基金的哪些指标（比如夏普比率、年化收益率等等），最终你就可以愉快地去“执行”了（最终还是不会给出具体答案，不过我个人认为是因为它的数据库不是实时更新的，所以给不出这种时效性很强的答案）。从这点来说，其实用ChatGPT做基金投顾服务还挺好的……

我不知道大家在和AI的交流中是什么感觉，反正我个人认为，AI模型都是有一个“基础准则”的，类似数学中不能被证明但一定正确的“公理”。所以，落到同样运用机器学习方法的量化交易上，就有两个特征非常明显：

①量化交易一定要有一个明确的业绩基准，只是笼统地“希望选出最好的股票”，这种诉求量化交易是完不成的；

②量化交易极度理性，更适合在股市这种“混沌”系统中做出最优选择。

一、量化交易有哪些派别？

国内的公募量化交易团队我前面也写过几家，个人认为大体可以分为两类，一类是多因子模型派，一类是机器学习派。

所谓多因子模型，就是脱胎于2015年左右流行的多指标综合选股，彼时许多知名看盘软件都推出了类似功能。投资者可以根据需要勾选需要的指标，软件会据此筛选出同时符合所有要求的股票。当然，这一派虽然算是量化交易的雏形，但非常依赖个人主观判断，所以还是要看市场配不配合。比如2023年开年至今，市场整体呈现价值风格，如果你是用ROE、小市值等更偏成长风格的指标来筛选股票，最终收益率大概率不太令人满意。

而机器学习，至少在当下代表了量化投资的发展方向，因为其并非像多因子模型一样将指标做主观叠加、线性外推，而是利用各种非线性算法在每一个时间“微分”上取得正收益，并最终通过一个个正收益的“积分”获得长期超额回报。

国金基金的量化交易团队，就是国内非线性机器学习量化交易派的代表之一。

二、如何构建量化交易模型？

在国金基金姚加红总、马芳总的路演中，可以得知，国金基金的量化交易模型构建主要分为三步：建立特征库、构建多策略模型、输出投资组合。

所谓特征库，就是最基础的因子库，目前国金基金一共存储了约800个基础因子（变量），基本面和技术面数据大概各占一半。因为因子是中性的，所以国金基金不会对这个库进行定期剔除。除一些基础的F10因子外，国金基金主要依靠和卖方研究员交流来新增因子。至于这些因子在当前市场是否有效，则需要在下一步的模型构建里进行判断。

模型构建又可分为两小步，其中第一小步相对简单，就是把上文提到的800个基础因子排列组合成“选股”子模型。当然，简单只是相对而言，毕竟800个基础因子随机排列组合，得出的结果肯定会撑爆国金基金的服务器……所以，国金基金主要依靠对股市历史数据进行波动性分解，分离出每一阶段股市上涨个股的综合特征，进而倒推出约100个相关性较低的独立子模型，并尝试用800个基础因子去描述它们。

模型构建的第二小步就是量化交易的核心——如何确定模型有效性，并将其挑选出来纳入交易体系？很简单，直接套用最近两年的股市历史数据，计算子模型胜率和赔率，阶段性表现稳定且排名较高的子模型，就会被纳入最终的交易体系。这里需要说明的是，在给子模型“喂数据”进行训练时，国金基金会剔除掉最近两年的历史数据，这部分数据仅用于验证子模型的近期表现。

目前国金基金会将子模型分为时间类和标的类两种，其中时间类主要标记子模型在不同时间跨度上的有效性，比如小时级、交易日级、季度级等；而标的类则主要标记子模型的风格、行业、热点和个股特征。一般一个子模型的阶段夏普比例高于3，就会被纳入最终交易体系。平均下来，每个子模型的有效期大约是半年到三个季度，所以国金基金会动态调整子模型的纳入情况，以保证在当下市场环境中，获取更高的超额收益。

有了以上几个步骤，最终的投资组合输出就梳理成章了：国金基金会将被纳入最终交易体系的子模型等权叠加，最终得到具体投资标的和它们的权重占比。目前，国金基金量化交易团队的股票池有600-1000只，最终投资组合单票权重不超过1%。

有一说一，调研了这么多家公募量化投资团队，国金基金姚加红总的团队是我遇到过的，对投资思路拆解最详细的一家。

三、历史业绩

又进入到了我个人认为最无聊的历史业绩介绍环节，还是那句话，如果历史业绩差，我怎么会写，对吧？

当然，在介绍国金基金量化交易团队管理的各只基金历史业绩前，我先梳理下这些基金的对标指数和交易策略是怎样的。

由于国金基金管理的两只传统指数增强基金成立时间均不到1年，所以我们就不浪费时间分析了，下面直接取国金量化多因子股票和国金量化多策略两只基金，分析其历史业绩。

可以看出，在市场普跌时（比如2022年2-4月、2022年9-10月），国金量化多因子股票也无法避免下跌（但跌幅会小于指数）；而只要市场有结构性行情，国金量化多因子股票总能踩准上涨方向。比如2021年11月-2022年1月、2023年5月，市场走价值风格，国金量化多因子股票阶段上涨，2022年5-8月，市场走成长风格，国金量化多因子股票依然阶段上涨。

国金量化多策略除了与国金量化多因子股票一样，总能踩准阶段性行情主线外，另有一个明显特征，即其在2020年跑输沪深300，这是为何？

姚加红总在路演中提到，国金基金量化交易团队原本只管理专户产品，这几只公募产品是从2020年6月才开始接手。而在接手初期，国金基金量化交易团队只是简单将专户产品的量化交易模型做了“降频”处理，所以导致这几只公募产品的超额不明显，或者跑输对标指数。从2021年开始，国金基金量化交易团队开始为公募产品开发专门的量化交易模型，所以后续超额收益就比较稳定且优秀了。

由于沪深300和中证500指数这两年的走势都挺拉的，所以我将国金量化多策略和国金量化多因子股票的业绩与偏股混合型基金指数分别做了对比，发现它们俩是真的强！相对指数超额分别达到了近40和60个百分点！

四、量化交易的局限性

2023年以前，私募量化跑超额主要依靠三板斧：T+0交易、打新和押注超预期因子。

T+0交易公募做不了，pass。超预期因子因为这几年量化交易赛道特别卷（国内规模从几千亿猛增至破万亿），基本把自己的超额给卷没了，所以暂时也不考虑。至于打新，现在新股破发已经很常见，打新不能再被当作一个稳赚不赔的业绩增厚手段，所以也不纳入重点考虑范围。综上，国金基金的总体思路就是均衡，即不在任何一种风格、一个行业、一类因子上做过多暴露。当然，这其实也是国金基金未来超额业绩可能不理想的最大隐患——一旦市场走极致行情，他们就会阶段性跑输押注成功的那批公募基金产品。

当然，福祸相依，一次押对不代表次次都能押对，每位投资者也都有自己的投资风格，关键看哪类基金、哪种策略更满足自己要求。

标签：