明汯投资:量化投资一定要避免引入“未来信息”
量化投资的主要步骤包括数据的收集和清洗、特征提取、模型开发、组合优化、回测模拟和交易执行。其中,回测是指通过对历史数据的模拟交易进行回溯和分析,以评估和优化投资策略的性能和表现。明汯投资曾作出这样的比喻:如果说数据收集是量化投资的“打桩人”,那么作为交易执行前的最后一个环节,回测模拟可以说是决定投资策略是否能够投入使用的“把关人”。
历史数据是串联量化投资各个步骤的关键词。明汯投资曾在一次分享中提到,因为时间不能倒流,证券交易数据等时间序列有时序性,且金融市场时刻存在博弈,规律具有时变特性。量化投资方法论的目的是用历史数据预测未来,所以一定要避免“未来信息”的引入,并合理评估历史回测。
上海明汯投资于2014年在上海创立。基于人才为本、科技为先的理念,坚持长期投资,明汯投资主要投资人员均为物理、数学、计算机等STEM学科背景,公司投研团队均来自于海外常春藤名校以及国内顶尖名校;明汯投资持续加大机房建设,在GPU服务器、数据库投入大量资金,始终保证硬件设备属于市场顶配水平。
根据多年积累的量化投资经验,明汯投资指出,如果在回测中使用了当时还不可用或未公开的数据,可能会导致结果出现“前视偏差”。例如,假设投资团队正在开发一个基于股票价格趋势的量化投资策略,在回测过程中,模型使用了“在日最低价的1%之内买入股票”的交易规则,在这种情况下,前述的“前视偏差”就会随之而来。因为当日市场收盘前,日最低价未知,也即在模型中引入了未来信息。在实际交易中这样的策略自然是不可能实现的,因此也不难理解,前视偏差可能会导致策略在实际交易中的表现不如回测结果所显示的“如此理想”。
明汯投资深刻认识到,数据作为量化投资的基石,其选择与应用至关重要。在回测模拟环节,既需要避免引入“未来信息”造成误导,也不应陷入过度依赖历史数据的局限。进行回测模拟时,还需注意,过度依赖历史数据可能导致模型过拟合或忽视未来可能发生的变化,因此评估历史回测的合理性和可靠性需要综合考虑多种因素,包括数据质量、回测时期、模型复杂性、市场环境等。
本平台所发布信息的内容和准确性由提供消息的原单位或组织独立承担完全责任。