年化39% 股票量化策略,请各大神指正
1、策略共5个子策略,每个子策略20股,共100股,2009.1-2022.10 年化39%,最大回撤约30%。策略全市场选股,部分策略用到市值因子,策略总体偏向小市值,每月调仓一次,换手率大概5次每年,下单可用QMT系统。
展开全文
2、量化策略最大的问题是过度拟合,过去规律有效,未来有效否?如果市场是强有效、随机漫步的,那将无法赚钱,市场赚钱的本质就是发现规律、并利用规律,价投也是一样(估值会回归)。策略的底层逻辑来自于对金融市场的理解,个人理解市场目前存在的规律,例如,
1)利润或营收增速高的股票大概率相对涨幅更好。
2)中国市场是一个周期波动向上的市场,且波动率很大,底层原因是中国是利润率不高的制造业大国,周期性强。
3)底部大概率缩量,顶部大概率放量。
4)中国大小票风格轮动过去存在,判断未来仍继续存在,散户一直存在,基金的考核机制决定基金也是一个大散户,市场整体投机大于投资。
5)基金有持仓限制,一些业务稳定且分红高的票在熊市有超额收益。
6)只要中国经济长期向好,长期来看有10%或更多的年化收益来自盈利增速,其它的收益通过轮动换股高抛低吸。
以上是个人理解市场的部分规律,按照这些规律可以制定一些相应的因子组合(规律和对应因子组合制定可能存在认知和理解的偏差)。无法直观理解经济和行为金融意义的因子一律不用,通过技巧优化的因子也不用,所用因子都是常见几十个因子里面按基本面理解组合。参数没有大范围调优,基于常识优化一下,例如PE阈值40/50/60那个相对较好。
3、灵魂拷问。那么多大机构做量化,为什么我的策略可以有效?正如那么多机构做基本面研究,为何个人投资者仍然可以做价投?
4、市场总市在变化,也明白单一策略很难长期有效,但股市长期来看还是有利润增长支持,比期货的零和博弈心理上更加安心。
ylxwyj
没有择时,一直都是满仓在跑的(年度再平衡);而且也不做期货对冲。18.1-18.10 小市值也是很惨的,亏了20%左右吧;等10月中旬,有放松并购的传言了,小盘股的“借壳”属性瞬间被激活了,就开始快速暴涨,直至2019.04左右 —— 不过是“必然的运气”罢了。
绝对收益,小市值更高;这个很正常,特别是2007.01-2019.04的十余年,小盘轻松40-60%的年化收益;但小市值的问题是资金容量太小,大钱投不进去。另外,我前面的回帖也说了“小盘策略组合平均30-35%,大盘策略平均25-30%。并且,单一大盘策略的回撤时间会很长,历史上持续1-2.5年的时间里跑输指数的情况也大都发生过”。
我觉得,你不用太关注单一策略的收益率、最大回撤,差不多就行;建议从基本面的逻辑出发,多发掘低相关性、较高流动性且使用较少参数的单一策略,然后提高整体组合的夏普比率和资金容量。功夫在诗外;虽然策略收益主要靠刷波动,但策略设计不能是 Cooking Data,还是要有强现实逻辑支撑 —— QuantMental。四合一,主要是体现低相关性逻辑的一个框架,而实盘组合的策略更多一些;当时的信息比率还只有 3,现在的版本已经可以做到 4了。
首先,你自己也说了,总体偏向小市值。对于公募基金来说,有严格的股票池筛选和轮动机制,并且每个股票入选不同的股票池,能够买入的数量也是分级且有限的。现在上市公司超过5000家了,而所有券商分析师覆盖的股票数量也就是2000多只。换句话说,大多数小市值股票,他们是基本不参与的。
其次,2016年之后,随着相关政策的出台,小市值效应是显著减弱的。而你从2016年以后的收益,我按你提供的图表算了一下,大概也就是+22%的年化收益 —— 这个数值并不是很高。我目前的策略组合,65个股票长期持有并轮动,可以做到30%+的年化收益;而且,大小盘还是相对平衡的,整体组合和中证500的跟踪误差是最小的,大概是8-9%。
最后,就是资金容量的问题 —— “韩信点兵,多多益善”,是超能力;韩信也说“刘邦最多统领10万士兵”。我们散户做出超额收益的最大优势,就是流动性带来的等权重(为什么机构采用的业绩基准都是市值加权,而不是等权重的?不就是因为他们体量太大了,买不进去嘛)。上述我自己的策略组合,测算的最大资金容量也就是1亿元左右,超过了肯定保持不了高收益;所以,百亿规模的那种量化私募,哪怕只有15%的年化收益,也是咱们是比不了的(班长和师长有可比性吗?)。嗯,你也可以自己测算一下。
不过,你说的几个规律,我都是认同的。长期看,业绩增长最多也就是给10%的年化收益;剩下的,其实都是赚市场波动的钱,无论是做趋势还是做抄底。
骆驼1978
我个人的经验,从以下几个点去判断:
1、每个策略使用了多少个独立的因子?如果超过3个,基本上属于过度拟合。
2、每个策略使用了多少组触发条件?如果超过3组,基本上属于过度拟合。
3、策略的触发频率怎样,周转次数多少,这两个值越大越可信。
4、要注意有没有使用未来函数。例如:某些历史资讯数据在每年1月1日就可以获得上市公司去年的财务数据,但真实情况是每年4月份才会有上一年度的报告。
5、要使用后复权数据,前复权会大幅虚增利润。
6、要过虑掉历史行情中涨跌停不能成交的情况。
另外,我们也可以从概率的角度来分析。
楼主说了,策略的触发因子是从几十个常见因子中选择出来的,就算50个吧,我们先假设所有因子都是无效的,预测成功率为0.5。
选择任意一个因中,连续正确预测10次概率是多少呢?
P = 0.5 ^ 10 = 0.1%。很低!
从50个因子中,选择出1个因子,连续正确预测10次的概率是多少呢?
P = 1 - (1-0.1%)^50 = 5%。提升了不少。
从50个因子中,选出2个因子过滤,连续正确预测10次的概率是多少呢?
P = 1 - (1 - 5%) ^ 2 = 9.5%。
从50个因子中,选出5个因子过滤,连续正确预测10次的概率是多少呢?
P = 1 - (1 - 5%) ^ 5 = 22.6%。
其实根本不用连续预测准确10次,只需要10次里有7次预测准确就够了,这个概率就更大了,估计可以超过70%。也就是说,从50个随机变量中选择5个指标进行过滤,有超过70%的概率可以建立一个符合历史的预测模型。如果再对指标调优的话,就更不得了。
总之:可选择在独立因子越多,过滤条件越多,参数阈值范围越窄,过度拟合的概率越大。
特别提示
本文不构成任何投资建议,仅为信息分享。任何因本文导致的投资行为发生的亏损,本公众号及作者概不承担任何责任。
集思录()是一个以数据为本的投资理财社区,专注于新股、可转债、债券、封闭基金等数据服务。我们的理念是在保证本金安全的前提下,使资产获得稳健增长。
快捷查询:
搜索微信号“jisilu8”添加我们
回复“新股”学习申购新股基础知识
评论