金融市场是一个没有标准答案的地方。同时,金融市场也是没有标准方法论的地方。如果说哪个领域最“百花齐放,百家争鸣”,那么非金融领域莫属。
由于巨大的利益驱动,科技领域里新的发明创造总是会被率先应用到金融领域。如果说近半个世纪以来,人类最重大的创新,那就是从半导体集成电路开始的信息技术革命。在深刻改变人类的生产生活方式的同时,信息技术也必然深刻的变革着金融市场。
在这一篇中,我们谈一谈信息技术对于投资方法论的变革,即量化投资的兴起。
时代背景
我们先来看看时代背景,这样可以更好的理解量化投资兴起的缘由。
首先,计算机以及互联网的兴起,使得投资者可以更为便捷的获得投资相关的各种信息,无论是公司的新闻报道、基本信息、财务状况、重大事项,还是券商研究所对公司及其所在行业的深度研究和即时跟踪,更不用说交易时段的行情信息和突发事件。
其次,金融信息服务商的崛起,为专业投资者提供了更为丰富的金融数据。在市场中摸爬滚打过的投资者,多多少少都会试用或者购买一些金融服务。
再次,新兴的在线投研平台,让有一定计算机编程基础的投资者,可以方便的编写自己的交易策略,并高效的进行历史数据的回测,以检验策略的历史效果。
最后,金融数据分析的算法、软件、平台的诞生与发展,让海量数据的高效分析与挖掘成为可能。
正是在计算机、互联网、云计算、大数据乃至人工智能的联合推动下,量化投资及其所代表的投资方法论才迎来了蓬勃发展的契机。
什么是量化投资?
我们来看看优矿在其知识库中给出的定义:
“量化投资是借助量化金融分析方法来进行资产管理的一种投资方法,量化金融分析方法是指结合金融数据,个人经验,数学模型,计算机技术的一种复杂金融建模,分析方法。”
为什么要量化投资呢?
为什么量化投资是一种新的投资方法,它和传统方法有什么区别呢?
让我们先来看一个例子,大家都知道在地球上水往低处流。学过物理的朋友,会知道这是由于重力的作用,在高处的水由于地球引力的吸引,会自发的流向低处。对于没有学过物理的朋友,如果她善于观察,发现山坡上的水会沿着山脊流向低处,空中的雨水会滴落到地面,屋顶的水会沿着排水管道流走,从盆里泼出去的水会落下,等等。当积累到足够多的观察之后,你去问她,水是从高往低流呢,还是从低往高流呢?我想,她会基于经验说“从高往低流”。
这个小故事,说出了我们认识世界的两种基本方法,分别叫做理论型方法和经验型方法。理论型方法对世界的认知基于科学模型及其假设,这也是我们大家比较熟悉的科学范畴。比如,稳定可控并且具有长距离航程的大型飞机就是工程师应用空气动力学的一项成果。而经验型方法则认为,当我们对世界的观察足够多了以后,我们也能具备对未来的预测能力,或者说,知识来自于经验。人类基因图谱测定的科学项目就是经验科学应用的一个重要例子,这个项目研究在人类的各种特征与构成人类DNA的化学碱基对序列之间建立一种对应关系。
经验型方法能够成立的前提是需要有足够的数据。什么是足够呢?我们用数学中的函数来做个类比。
函数表达的是,对于给定的输入(自变量),其所对应的输出(因变量)是什么。输入一般定义为字母x,其取值范围称为定义域;输出一般定义为字母y,其取值范围称为值域,根据x确定y的方法称为对应法则,一般以字母f表示。
有了函数的例子,我们可以简要的说明“足够的数据”是什么意思啦。我们可以考虑在定义域内采样,记录下来一系列的数值对(x, y)。对于特定的问题而言,只要这个采样没有遗漏重要的数值对(x,y),我们就可以认定“足够”啦。那什么是“重要的数值对”?通俗来说,就是那些特别能够代表这个函数的,比如曲线端点、极值点、转折点啊,等等。
回到金融市场,如果我们积累了足够多的金融数据,根据这些数据我们能够推测相关金融数据与交易标的价格之间的“函数”大致长什么样子,那是不是我们可以据此构建出交易策略了呢?
举一个具体的例子。均线是市场上平均交易价格的代表,如果当前价格在均线之上,代表近期大多数人都在盈利,也意味着大家对于后市的看好。反之,如果当前价格在均线之下,代表近期大多数人都在亏损,也意味着大家对于后市的看空。基于这个朴素的思想,我们可以大量采样价格从均线下走到均线上(即所谓的“金叉”)时,后续的价格是涨还是跌。同理,我们同样的采样价格从均线上走到均线下(即所谓的“死叉”)时,后续的价格是涨还是跌。如果,大量的统计显示,出现“金叉”后大多数时候价格出现上涨,出现“死叉”后大多数时候价格出现下跌。那么,恭喜你,发现了一个有历史数据支持的交易策略。
当然,这个方法过于简单,但足够说明问题了。基于此,我们可以来看看量化研究的流程。
量化研究的流程
量化研究是一个系统的过程,由若干环节依次构成。
数据获取:数据挖掘所需的各类原始数据的获取,比如公司财务数据、产业两上下游、行情数据等。
数据清洗:对获取的原始数据进行格式化,并对无效数据进行清理,以方便后续的数据挖掘。
数据挖掘:采用统计、机器学习等各类算法,对清洗好的数据进行特征分析、提取与统计。
信号生成:基于挖掘出的特征,进行必要的处理,如标准化、去极值、中性化;之后,生成基础信号,并进行分组回测,计算统计特征。有时候,需要复合多个基础信号生成复杂信号。
策略生成:确定交易市场和标的范围,交易周期,调仓频率,仓位确定方法,订单类型,以及止盈止损方案等,完整的构成一个交易策略。
历史回测:尽可能选择较长的历史周期,测试生成的交易策略的历史表现。需要妥善处理股票的分红送转、涨跌停、停复牌、市场冲击、交易滑点、手续费、大单分笔成交等交易细节,期货策略还需要考虑保证金。
策略分析:核心是分析交易结果是否表明该策略具备长期、稳健的正收益,否则是个无效策略。需要仔细观察在不同市场状况下,该策略是否都应对妥当,是否有明显的短板需要改进。同时,进行策略归因分析和风险归因分析,以理解该策略所暴露的风险水平,以及收益的来源。
策略优化:基于策略分析的结果,思考策略的短板,以及可能的优化方法。核心是要避免过度优化,这是策略失效的根源之一。优化后,要再次进行策略分析,同时需要和优化前的结果进行比对,以确定优化是否有效,是否过度。
模拟交易:接入实时行情,实时获取成交回报。在此基础上,看策略是否如预期般稳健运行,是否有漏洞没有考虑到。
实盘交易:接入真实券商账户,真金白银的进行交易。
量化策略的分类
按照投资标的,可以分为:
按照收益来源,可以分为:
按照敞口的方向,可以分为:
按照操作方式,可以分为:
量化投资简史
早期理论阶段,20世纪初
1900年法国数学家Louis Bachelier发表了博士论文《投机的理论基础》,讨论了使用数学统计分析方法来研究股票波动,这篇论文基本上公认是量化投资的开端。但是,当年该理论并没有引起关注。(时代背景的重要性啊!)
价值投资,20世纪30年代
在 1929年 ~ 1933年 期间的全球性经济大萧条后,哥伦比亚大学的两位教授 Benjamin Graham和 David Dodd出版了著名的《证券分析》。书中提出了一种评估公司股价是否高估/低估的方法。即使用公司财务数据估算公司内在价值,并与公司市值做比较,以此得出公司股价是否存在溢价/折价现象,来指导基金经理进行投资管理。这种方法即“价值投资”的开端。(Benjamin Graham即是股神巴菲特当年的老师!)
现代投资组合理论,20世纪中期
1952 年,美国经济学家Harry Markowitz 提出现代投资组合理论,提出均值-方差分析方法和投资组合有效边界模型,他因此获得了诺贝尔经济学奖。现代投资组合理论为“分散投资”理念,以及投资组合优化奠定了数学基础。
资本资产定价理论(CAPM),20世纪60年代
自从 Markowitz 提出使用标准差来度量股价的波动性后,人们开始研究更多的将风险与收益结合起来的金融模型。其中资本资产定价模型(CAPM)最为成功,也是应用最为广泛的一个模型。
CAPM 认为所有股票在市场波动中都是有所暴露的,只是暴露的程度不同而已。这里所谓的暴露,是指当市场发生波动时,个股也会不同程度的跟随市场变化。为此,CAPM 定义了 beta 这样一个概念。所谓一个股票的 beta,即个股针对市场整体的风险暴露程度。
有了这个概念之后,后期在改理论基础上又发展出了很多衍生理论和分析方法,比如说分散化投资,法玛三因子模型等。CAPM 的出现让人们意识到数学在金融方面的应用潜力,此后的几十年中,数学开始在金融,经济方面大放异彩,投资方法越来越专业化,理论化,系统化,和标准化。为量化投资奠定了坚实的理论基础。
量化主动管理,20世纪80年代
有效市场假说(EMH)出现后,人们发现很多无法用 EMH 解释的现象,比如说:小市值效应,月历效应,均值回归,市场过度反应,过度波动性,高市净率股票异常效应等。这些发现让很多坚持基本面分析的投资者更加坚信价值投资理念,随着计算机技术的发展,以及金融市场数据越来越丰富规范,他们开始尝试把计算机+金融数据结合起来,把传统的分析工作移植到计算机上,甚至还涌现出了一些以此为主业的公司,其中 Barra 公司也是在此期间成立的。
量化投资成长期,20世纪末
20世纪80年代的研究吸引了不少人开始研究量化领域,更准确的说,是吸引了不少人开始用计算机+金融数据来设计模型,构建组合。这个时期最大的进步是引入了计算机技术和金融数据的规范化,人们开始慢慢在传统的规模因子、盈利因子中加入更多类型的因子;投资组合上也更加多样化,譬如从原始的纯多头策略扩展到多空对冲策略,以及多空不均衡策略等类型。其次,此期间还涌现出很多经典的投资策略,比如说当下耳熟能详的动量策略。
量化投资黄金期,21世纪初
得益于计算机技术的发展,金融数据的存储、传输更加快捷。人们可以更加高效、快捷的实现验证投资思想和构建交易策略。特别是 2000年 ~ 2007年,量化基金得到很多金融机构的重视,相对于传统投资方法,量化投资的很多优势逐渐凸显出来:比如策略本身都是基于深入研究基础之上,可信度比较高;完善的在风险和回报之间的平衡;以及不受情绪干扰,严格的遵守投资纪律等。
风云突变,2007-2009
2007年下半年开始,美国次级贷款引发的流动性危机凸现,引发金融市场动荡,以高杠杆为代表的很多量化对冲基金遭遇了量化史上最大的滑铁卢,从微薄浮盈,开始亏损,连连大跌,到最后被迫清盘。可以说 2007 到 2009 这一年多时间里,是美国量化对冲史上最风云突变的一年。
数据显示,2007年10月到 2009年03月,标普500指数从 1527 点直泻到 666 点;有的基金甚至一个月内大跌超过 50%。2007年到 2009年,美国对冲基金资产管理规模大幅下滑,将近从鼎盛时期的 2500亿美元到低谷时期的 500亿美元;其中量化对冲基金的管理规模也显著下滑。
灾后重生,稳步发展,2010年至今
自 2010 年后,量化对冲基金开始缓步恢复。其实回顾 2007 ~ 2009 金融大动荡时期,仔细反思,真正的导火索并不是对冲基金,也不是对冲基金投资、研究的方式方法,而是金融市场本身的规范存在漏洞,可能这也是一个真正健康、积极的金融市场必须要经历的阶段。
而对于对冲基金本身来说,其只需要扩充自己的投资领域,发展自己的投资策略,分散自己的投资标的,不再像之前一样向同一个方向拥堵,从而在市场不利的时候造成流动性危机,那么长久积极健康的发展是可以预期的。
国内量化投资的发展
首只量化基金诞生,2004年
2004年8月27日,光大保德信量化核心证券投资基金成立,成为国内第一只公募量化基金。从此,量化投资走入公众视野。
多因子策略诞生,2007年-2008年
2007年、2008年金融危机前后有很多海归陆续回国以后加入公募基金,她们带来了海外先进的量化投资策略,这个时期多因子选股策略逐渐在国内出现。
量化投资元年,2010年
2010年,沪深300股指期货上市,国内开始研究股指期货的实际应用。此时的量化基金终于具备了可行的对冲工具,各种量化投资策略如alpha策略、股指期货套利策略才真正有了大展拳脚的空间,可以说2010年是中国量化投资元年。大量从事量化基金研究的机构开始投入到量化策略的大潮中,一批海外量化投资人才也是在这个时期察觉到机会相继回国创业。
量化投资高速发展,2013年至2015年9月
2013年到2015年9月股指新政之前可以说是国内量化基金有史以来最风光的一段时期。2013年以来创业板、2014年下半年以来主板走出了波澜壮阔的大牛市,在此期间,买创业板、抛股指成了最流行也最拥挤的量化策略。
2014年基金业协会推行私募基金管理人和产品的登记备案制,推动了私募基金的全面阳光化,加速了私募基金产品的发行,其中自然也包括量化对冲型私募产品。
从2014年年底至2015年6月,A股经历了大半年的火爆牛市行情,随后从2015年6月中旬至2015年8月,A股又经历了几轮惨烈的下跌。股民仿佛经历了一轮过山车,市场波动巨大。中间出现过分级基金套利、可转债套利、ETF套利、期现套利等一大波的套利机会,然后在大盘暴跌的时候有一部分量化对冲基金经受住了回撤的考验。
在此期间,几乎所有的量化投资产品都取得了很好的收益,海外投资人员开始成批回归,国内量化投资机构成批涌现,国内量化投资高速发展,量化投资在公众中开始具备了较高的知名度。
量化投资多元化发展,2015年9月至今
为了应对股灾,在2015年9月2日,中金所出台了严厉的股指期货日内交易限制措施,市场流动性趋于枯竭,大量Alpha策略量化基金转型相对价值复合策略。在此情境下,市场上已经聚集起来的比较有实力的量化团队开始逐步转型,一方面,从低收益低风险的套利对冲策略,逐步向多空策略、股票多头策略、股票T+0策略转变,另外一方面,从股票对冲向商品期货、国债期货等品种的CTA策略转变,然而当时看似被动的转型,实则开辟了量化投资的新时代。
下面两张图是截止2017年11月底,巴曙松等统计的公募量化基金的管理规模和基金数量。
下图是巴曙松等统计的根据策略类型分类的公募和私募量化基金管理规模和基金数量。
目前中国的量化私募的资金管理规模仅为中国大陆所有私募资金管理规模的10%左右,量化基金的整体资金占比明显低于成熟市场约30%左右的比例,同时规模上的差距也较大。展望未来,中国的量化投资还处于起步阶段,未来的发展空间还很大。
量化投资的体会
最后,谈几点我个人从事量化投资的体会。
第一点,就像前文中“为什么要量化投资”那一节提到的两种认知世界的基本方法:理论型和经验型,量化投资也可以分为理论型和经验型。理论型的量化投资是先有成熟的投资模型,通过计算机来提高其执行的效率;经验型的量化投资是先有海量数据,然而从数据中挖掘出投资模型,除了提升执行效率,计算机更重要的是起到建立投资模型的作用。所以,有志于从事量化投资的读者,可以考虑一下从那个方向入手。方向的确定,会让后续的计算机工具、算法等软硬件的选型更聚焦。
第二点,量化投资需要大量的资本投入,仅金融数据的购买一项,我所接触到的几家以量化为重点、服务机构投资者的私募基金公司都在数百万元一年。更不用说,对于计算机硬件、软件和专业人才薪资奖金的投入了。这一点,也构成了量化投资的门槛。
第三点,量化投资、特别是股票型量化投资,对于资金管理规模是有要求的。尽管有些高频策略,资金管理规模要求不高,但相应的策略容量也很有限。要想取得统计意义上的预期回报,足够分散的投资于足够数量的投资标的,是一个关键。这一点,也符合“大数定律”的要求,同时也有效的规避了“踩雷”现象的发生。
第四点,量化投资要想执行好,对于交易工具有着更高的要求。像期货市场,交易所开放接口,可以定制交易程序,各种程序化交易大行其道,交易效率很高。股票市场,目前交易所仍未开放接口,尽管券商通过PB系统提供了一揽子交易的工具,然而综合考虑流动性、时效性等因素,与完全开放接口相比还是有很多不便。
最后,如同生命体一样,量化策略也是有生命周期的。一个有效的策略,随着参与人数的增加,其有效性会逐渐降低(退化)。一个有前提的策略,随着前提的演变,也可能从盈利走向亏损。一个套利的策略,随着获利,价差逐渐缩小,再次登场的机会也随之消失。所以,持续的研发能力是量化投资的核心。看一家量化投资公司,既要看历史业绩,还要看当前策略的实盘效果,更要看其应变市场、开发新策略的板凳深度。
总结
如果说投资是一门艺术,那么量化让它走向科学。