Top Banner
公示论文 基于产业链投资的多因子 量化策略的运用与研究 上海交通大学 系: 安泰经济与管理学院 级: B1212096 号: 1121209173 生: 业: 金融硕士 师: 吴冲锋(教授) 上海交通大学安泰经济与管理学院 2014 5
26

基于产业链投资的多因子 ... - acem.sjtu.edu.cn · PDF file基于产业链投资的多因子量化策略的运用与研究 上海交通大学 1...

Mar 03, 2018

Download

Documents

phamdiep
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: 基于产业链投资的多因子 ... - acem.sjtu.edu.cn · PDF file基于产业链投资的多因子量化策略的运用与研究 上海交通大学 1 基于产业链投资的多因子量化策略的运用与研究

公示论文

基于产业链投资的多因子

量化策略的运用与研究

学 校: 上海交通大学

院 系: 安泰经济与管理学院

班 级: B1212096

学 号: 1121209173

硕 士 生: 齐 路

专 业: 金融硕士

导 师: 吴冲锋(教授)

上海交通大学安泰经济与管理学院

2014 年 5 月

Page 2: 基于产业链投资的多因子 ... - acem.sjtu.edu.cn · PDF file基于产业链投资的多因子量化策略的运用与研究 上海交通大学 1 基于产业链投资的多因子量化策略的运用与研究

基于产业链投资的多因子量化策略的运用与研究 上海交通大学

1

基于产业链投资的多因子量化策略的运用与研究

摘 要

产业链投资法意在通过构建产业上下游公司组合来对冲公司之间的相对波

动风险,获得在风险与收益水平上具有优势的投资表现,这一点已经通过之前的

研究得到证实。但是产业链投资的方法本身是一项复杂的过程,手动选股缺乏效

率、不能发挥其最大效力。量化投资作为一种投资方法,运用数学与计算机技术

的手段,按照一定的规则进行投资、交易,具有可规模化、自动化的特点。本文

研究将量化投资法与产业链投资法进行结合,以优化产业链投资法。本文通过量

化因子模型对产业链上下游的公司进行择股,利用效果较好的单因子设计构建了

产业链投资量化多因子模型,并对其进行模拟投资测试。本文纳入了沪深 300 指

数、上证综合指数、恒生中国企业指数等一系列市场指数进行横向对比,并通过

窗口期外投资、统计抽样的方法说明了产业链量化多因子策略指数相比市场指数

具有优势。多因子量化策略与产业链投资的结合使得产业链投资法更具实际运用

价值。

关键词:产业链投资,量化策略,多因子模型,统计抽样

Page 3: 基于产业链投资的多因子 ... - acem.sjtu.edu.cn · PDF file基于产业链投资的多因子量化策略的运用与研究 上海交通大学 1 基于产业链投资的多因子量化策略的运用与研究

基于产业链投资的多因子量化策略的运用与研究 上海交通大学

2

一、 引言

(一)研究背景

产业链相关理论的研究说明了产业链上下游公司的相关性,即其产品价格相

互影响,其企业业绩具有相关性。虽然各种研究对产业链是否应该纵向整合没有

得出一致的结论,但产业链上下游公司的业绩由于产品价格的传导而出现业绩相

关波动,而且由于上游的收入往往成为下游的成本,它们的业绩在逻辑上经常出

现反向波动,这是可以得到的,刘国丰(2010)[1]通过一系列产业的列举说明了

这个现象。

产业链投资就是利用产业链这样的特性,构建产业链上下游的公司组合,以

期对冲产业链上下游公司间的相对波动风险,从而创造在收益、风险指标上更具

有吸引力的投资效果。周杨(2012)[2]整理出了中国上市公司中的上下游产业组

合,并初步证明了基于产业链构建的投资组合有较大的概率战胜市场指数。

本文将在此研究基础之上,进一步优化产业链投资的方法,结合量化投资的

方法进一步发挥产业链投资的效力,并运用不同的评价指标与方法对量化产业链

策略进行更为细致的分析。

(二)研究的目的与意义

之前的产业链投资研究结果发现,相比传统投资方法按照单个公司的经营状

况、估值、发展前景等因素来构建投资组合,产业链投资方法通过构建产业链上

下游公司组合,能够整合上下游公司的相对波动,对冲上下游公司之间的相对风

险,这样的投资方法在风险收益水平上具有优势。

但是,产业链众多,产业链上下游公司也纷繁复杂,如何有效地构建产业链

投资组合是一个值得研究的课题。

量化投资方法已经成为业界运用比较成熟的证券投资方法之一,特别是在美

国等成熟资本市场。量化投资通过定量、编程化的方法对证券进行交易、投资。

定量、可编程化的特点使得量化投资相比传统投资更为客观、更善于胜任大数据

的投资处理工作,这启发了笔者将量化投资运用于产业链投资的思路。

本文研究将量化多因子投资策略运用于产业链投资法。本文将利用多因子模

型对产业链中的公司进行择股,提升产业链投资的实际运用价值,发掘产业链投

资的效力。

股票类的主动投资是居民最为重要的投资渠道之一,也是最为重要的资产类

别配置之一。股票主动投资方法的研究对居民财富的增加以及对产业的发展都具

有重要意义,这个领域的研究本应该是百花齐放的。本文希望通过对产业链投资

以及量化投资的研究,对促进股票主动投资管理领域的研究尽微薄之力。

(三)本文的结构安排

在本文的下一章,文章将对多因子量化模型进行介绍,并对产业链投资与量

Page 4: 基于产业链投资的多因子 ... - acem.sjtu.edu.cn · PDF file基于产业链投资的多因子量化策略的运用与研究 上海交通大学 1 基于产业链投资的多因子量化策略的运用与研究

基于产业链投资的多因子量化策略的运用与研究 上海交通大学

3

化策略结合的可行性进行分析;其次本文将针对产业链投资进行单因子策略的研

究与分析,并在此之上构建适合于产业链投资的多因子模型,对其进行模拟投资

测试与研究;最后一部分将对本文的研究成果进行总结,并指出不足之处与未来

可研究的方向。

Page 5: 基于产业链投资的多因子 ... - acem.sjtu.edu.cn · PDF file基于产业链投资的多因子量化策略的运用与研究 上海交通大学 1 基于产业链投资的多因子量化策略的运用与研究

基于产业链投资的多因子量化策略的运用与研究 上海交通大学

4

二、 量化策略运用于产业链投资的可行性分析

量化投资运用数学与计算机技术按照一定的规则对金融产品进行投资决策,

具有可规模化、自动化的特点。产业链集合涵盖数量众多的产业链,如果要进行

产业链组合的投资模拟操作,我们必须针对每一条产业链的每一个行业进行选股,

如果对这些行业的公司进行量化选择,有利于我们从产业链所含行业内选出更为

优质的公司,有利于产业链投资发挥出它的最大效力。

量化多因子模型策略具备这样的特点,即可根据多个因子对一个行业内所有

的证券进行打分,并从中选择符合投资者要求的证券,比较适用于产业链投资。

(一)多因子模型方法介绍

多因子模型是目前国内外使用比较广泛的量化投资模型。多因子模型是资产

定价的模型。其与 CAPM 模型与单指数模型不同,多因子模型认为证券的价格

不仅仅取决于证券的风险,而且还取决于其他一些因素,比如各种财务因素、宏

观因素等。多因子模型的理论背景是罗斯(Stephen M. Ross)的套利定价原理

(APT)和莫顿(Robert C. Merton)基于均衡原理创立的跨期选择资本资产定价

模型(ICAPM)。多因子模型的基本形式为:

K̅𝑖𝑡 = 𝑎𝑖 + 𝑏𝑖1𝛿1𝑡 + 𝑏𝑖2𝛿2𝑡 + ⋯ + 𝑏𝑖𝑘𝛿𝑘𝑡 + 𝑒𝑖𝑡[3]………………(2.1)

其中𝛿𝑘𝑡代表第 k 个风险因素在时期 t 的变化,𝑏𝑖𝑘是资产 i 对第 k 个风险因素

的敏感度。

在实际应用中,多因子模型表现较为稳定,因为多因子模型可纳入类型广泛

的因子,在实际操作中总有一些因子能表现出有效的选股能力,因此多因子选股

方法在量化投资界中应用较为广泛。但在实际操作中,有两种方法可以具体用来

执行多因子模型法,它们分别是打分法和回归法。

第一种是打分法。打分法首先对每一个因子单独运用于股票选股的效果进行

评判,得到单因子的效用(比如单因子策略的收益、收益波动率等),再针对一

个因子对证券进行打分,继而完成证券在所有因子上的得分;然后,按照一定的

权重对证券在所有因子上的得分进行加总,就得到了该证券的总分,最终根据证

券的总得分排名构建投资组合。

第二是回归法。其用证券的历史收益率对证券的历史因子值进行回归分析,

得到各因子的系数,再用此系数结合当前的因子值对证券未来的收益率进行预判,

从而进行投资组合的构建。

两类方法各有优劣,由于打分法用交易数据进行接近真实的模拟交易回测,

在真实的投资交易中更可靠,所以使用得更多。

同时,因子的选择也是多因子模型研究的重点。一般来说,因子可分为估值

类因子、成长类因子、资本结构因子和技术面因子等。估值类因子包括市盈率、

市净率以及市销率等,成长类因子包括净资产收益率、总资产收益率、EBITDA

Page 6: 基于产业链投资的多因子 ... - acem.sjtu.edu.cn · PDF file基于产业链投资的多因子量化策略的运用与研究 上海交通大学 1 基于产业链投资的多因子量化策略的运用与研究

基于产业链投资的多因子量化策略的运用与研究 上海交通大学

5

增长率等,资本结构因子包括资产负债率、总市值等,技术面因子包括各类技术

指标。

目前,国内相关的实证研究考虑的因子还不够全,本文将引入更多的因子,

并通过打分法的方式将多因子模型运用于产业链投资,分析其投资表现。

(二)产业链投资量化策略的研究框架

下面我们对产业链投资的框架进行图解。产业链投资的方法步骤是:

1)通过行业分析、公司数据调查确定产业链,即产业链内的上下游行业;

2)构建市场上产业链的组合,并赋予每一条产业链一定的权重;

3)初始资金按照每一条产业链的权重分配,同时,分配到每一条产业链上

的资金将在产业链上、下游行业中平均分配,目的是抵消上下游行业的相对波动

风险;

4)在产业链的每一个行业内,按照一定规则进行选股操作,并用分配到该

行业的资金构建股票投资组合。

产业链投资法的投资框架如下图所示:

产业链上游行业1 产业链下游行业1

公司1 公司2 … … … …

产业链上游行业2 产业链下游行业2

公司3 公司4 … … … …

产业链上游行业3 产业链下游行业3…

… …

图 1 产业链投资方法的投资框架

Figure 1 The investment framework of industry chain investment

如上图所示,行业内公司的选择是困难的。一方面来说,如果事先确定公司,

则公司的指标在投资期限内改变,事先的选择就会失去期望的效果;另一方面来

说,如果事先确定了所投资的公司,那么“行业投资”就会演变成“公司投资”,这

是我们不希望看到的,这增加了公司层面的风险。

那么,在上述步骤中,如果我们能够运用量化投资方法,对涉及的各个公司

进行量化选股,就能显著地增加产业链投资的实际运用能力。而且,通过理论综

述可以发现,多因子模型量化投资方法是可以运用于行业选股的,因为每家上市

公司的数据都可查,我们可以得到上市公司在一段投资期中的面板数据。

(三)多因子模型指标的选取

虽然业界对于多因子模型的量化研究众多,但是国内学术界对 A 股股票的

Page 7: 基于产业链投资的多因子 ... - acem.sjtu.edu.cn · PDF file基于产业链投资的多因子量化策略的运用与研究 上海交通大学 1 基于产业链投资的多因子量化策略的运用与研究

基于产业链投资的多因子量化策略的运用与研究 上海交通大学

6

多因子模型研究数量较少,涉及的因子也较少,而且运用于产业链投资的多因子

模型目前并没有。在本文我们针对 A 股股票纳入尽可能多的因子来考虑,并根

据上一小节的方法将之运用于产业链投资。

1. 量化投资与价值投资的理念并不冲突

查尔斯•艾里斯在《投资艺术》[4]一书中运用统计分析发现标准普尔指数在长

时间内的盈利表现其实主要只在若干年份取得,借此告诫人们要遵循价值投资的

理念,谨慎地进行波段操作,笔者对此也很认同。但是运用量化投资方法是否就

意味着我们与价值投资隔断了呢?事实情况并不是这样。

其实,量化投资虽然在方法上大量运用数学与计算机技术,但其本质是投资

思维的系统化,一部分量化策略的精神内涵与传统投资方法应该说是一致的。

量化多因子模型就是这样的一种策略。多因子模型通过对股票各个因子进行

考察,发现存在价值低估的股票并进行买入,其精神内涵与价值投资是类似的。

并且,国内研究显示,价值投资的方法在我国股票市场是具有超额收益的[5][6]。

在这样的情况下,本文着重选择了能反映 A 股上市公司基本面的各种因子,包

括反映估值水平的市净率、市销率、市盈率以及股价比现金流因子,反映公司经

营水平的净资产回报率因子,以及反映公司股权结构的资产负债率等因子,同时

也包括了一些技术指标因子。

2. 选取二十个因子进行研究测试

多因子模型选股着重依靠各种因子对公司的基本面进行评判,这基于各个因

子如实地反映了公司基本面的假设。在上市公司按要求进行会计审核的情况下,

财务类因子确实能够反映公司的基本面,但是现实情况是,研究表明,我国上市

公司存在违规的“盈余管理”现象,这种做法会扭曲财务报告对于公司的解读,

并在未来对公司的价值产生负面影响[7],并且有研究显示,公司在上市之后相比

上市之前增加了盈余管理的倾向[8]。

同时,有研究显示,某些财务指标比较容易受到操控。张俊瑞(2009)[9]在

对我国制造业以及零售业的上市公司数据进行研究后发现,上述行业的上市公司

存在经营性现金流的操控,并且零售业较之制造业更为严重。同时,也有不少研

究指出我国上市公司存在利润的操控[10]。在这样的情况下,本文认为应多纳入一

些因子进入选择的范围,这样可以尽可能发现一些有效的因子,并可以视情况舍

去相对比较无效的因子。本文针对沪深股市选取了二十个因子进行研究测试,下

一章将对此作具体介绍。

Page 8: 基于产业链投资的多因子 ... - acem.sjtu.edu.cn · PDF file基于产业链投资的多因子量化策略的运用与研究 上海交通大学 1 基于产业链投资的多因子量化策略的运用与研究

基于产业链投资的多因子量化策略的运用与研究 上海交通大学

7

三、 产业链量化多因子策略的研究

本章进行产业链量化多因子策略的研究。首先我们对单行业以及单产业链的

收益风险进行测评。我们将对各个因子进行单独的分析,用单个因子进行量化择

股,分析其效果。然后本章将使用比较有效的因子建立产业链投资量化多因子模

型。最后,本章将对上述研究结果进行更为精确的分析,包括使用窗口期外投资

测试、统计抽样的方法来说明产业链投资量化策略的效果。

(一)数据的说明

本文所用到的股票数据全部为标准数据,其从 Bloomberg 和 Wind 数据库上

下载。本文从 Bloomberg 数据库中下载了 2000 年 1 月初至 2014 年 2 月底沪深股

市全部股票频率为日的数据。同时,由于量化多因子模型研究的需要,本文也下

载了以日为单位的所有股票的因子数据,这些因子包括估值因子(市盈率、市净

率、市销率等)、财务因子(净资产回报率、初始投资资本回报率)、公司结构因

子(总市值、资产负债率等)、股价因子(股价 30 天波动率、股价 90 天波动率)

以及技术因子(3 天 RSI 指标、9 天 RSI 指标)等。

具体的因子如下图所示:

表 1 存入数据库的参与研究的沪深股票单因子数据

因子类型 因子名(中文名称) 因子名(英文简称)

财务 净资产收益率 RETURN_COM_EQY

财务 初始资本回报率 RETURN_ON_INV_CAPITAL

财务 总资产回报率 RETURN_ON_ASSET

财务 总资产周转天数 ASSET_TURNOVER

财务 毛利率(可获得报告期最近 12 个月) TRAIL_12M_GROSS_MARGIN

财务 管理费用率(可获得报告期最近 12 个月) TRAIL_12M_PROF_MARGIN

公司结构 总市值 CUR_MKT_CAP

公司结构 债务比股权价值 TOT_DEBT_TO_COM_EQY

估值 股价比净现金流 PX_TO_CASH_FLOW

估值 股价比自由现金流 PX_TO_FREE_CASH_FLOW

估值 市盈率 PE_RATIO

估值 市净率 PX_TO_BOOK_RATIO

估值 市销率 PX_TO_SALES_RATIO

估值 股价比 EBITDA PX_TO_EBITDA

技术指标 3 天 RSI 指标 RSI_3D

技术指标 9 天 RSI 指标 RSI_9D

价格特征 股价 90 天波动率 VOLATILITY_90D

价格特征 股价 30 天波动率 VOLATILITY_30D

价格特征 交易量(股数) PX_VOLUME

Page 9: 基于产业链投资的多因子 ... - acem.sjtu.edu.cn · PDF file基于产业链投资的多因子量化策略的运用与研究 上海交通大学 1 基于产业链投资的多因子量化策略的运用与研究

基于产业链投资的多因子量化策略的运用与研究 上海交通大学

8

价格特征 交易量(金额) TURNOVER

值得注意的是,这里的市盈率、市销率等估值因子的当日值都指当日回溯之

前数据可获得的值,取最近可获得财务报告的 12 个月为报告期,即对最近可获

财务报告的四个季度进行加总,所以都属于历史数据。

(二)行业指数与产业链指数的风险收益对比

首先对单行业以及单产业链的收益风险进行测评,因为单个行业以及各个产

业链是产业链投资的基础,如果不对单行业以及产业链进行分析,就无法对产业

链投资有一个比较定量的认识。

1. 单行业指数的收益与风险特征

我们首先对每个行业进行单个行业的投资收益及风险测算。这里的行业为申

银万国行业分类标准 2014 版中的第三级行业,采用第三级行业来分类的原因是

使得产业链以及行业的分类可以更为细化。这里我们的投资规则为,我们等权地

持有该行业下设的公司股票,这样的投资结果相当于该行业的指数(等权形式),

并对投资期内的回报率进行收益(年化收益率)与风险(日回报率的年化标准差)

的计算,并将结果画在散点图上。

由于考虑到单个行业需要用来构造产业链,所以这里只对所含公司数大于等

于 3 的行业进行计算。投资期为 2006 年 1 月 2 日(年度第一个非双休日)到 2012

年 12 月 31 日,考虑到数据完整性,满足 2006 年 1 月 2 日已经上市的条件的公

司才能入选(这种情况下会忽略掉一些后来上市的公司)。

这样,我们可以得到如下结果:

图 2 行业指数的收益风险图

Figure 2 The data of the returns and risks of the industries’ indexes

而具体每个行业的指数收益与风险如下表所示:

0.000

0.100

0.200

0.300

0.400

0.500

0.600

0.700

0.800

0.0% 5.0% 10.0% 15.0% 20.0% 25.0% 30.0% 35.0% 40.0%

年化

日收益率标准差

年化收益率

行业指数的收益风险图

Page 10: 基于产业链投资的多因子 ... - acem.sjtu.edu.cn · PDF file基于产业链投资的多因子量化策略的运用与研究 上海交通大学 1 基于产业链投资的多因子量化策略的运用与研究

基于产业链投资的多因子量化策略的运用与研究 上海交通大学

9

表 2 行业指数的收益风险具体数据

单行业名 年化收益率 年化日收益率标准差 夏普比率

种子生产 28.0% 0.451 0.553

果蔬加工 11.0% 0.410 0.195

其他种植业 18.8% 0.428 0.369

其他农产品加工 12.8% 0.378 0.259

林业 15.0% 0.454 0.264

造纸 14.8% 0.330 0.359

饲料 20.2% 0.380 0.452

畜禽养殖 20.1% 0.389 0.438

动物保健 21.1% 0.402 0.450

调味发酵品 22.8% 0.378 0.523

乳品 25.9% 0.367 0.623

毛纺 19.0% 0.382 0.418

煤炭开采 17.2% 0.379 0.373

焦炭加工 19.9% 0.371 0.454

火电 9.7% 0.318 0.211

热电 20.9% 0.339 0.527

氮肥 13.9% 0.333 0.326

石油加工 15.9% 0.319 0.403

其他化学制品 19.6% 0.354 0.469

轮胎 14.7% 0.356 0.330

石油贸易 19.8% 0.399 0.420

日用化学产品 24.4% 0.350 0.611

纯碱 10.6% 0.418 0.181

玻璃制造 21.9% 0.378 0.500

涤纶 22.0% 0.349 0.544

棉纺 18.9% 0.345 0.461

特钢 11.8% 0.410 0.213

机床工具 17.8% 0.381 0.388

机械基础件 22.4% 0.357 0.544

磨具磨料 16.9% 0.406 0.342

制冷空调设备 28.4% 0.416 0.610

纺织服装设备 19.7% 0.352 0.473

工程机械 21.7% 0.360 0.520

冶金矿采化工设

25.7% 0.370 0.612

其它专用机械 27.5% 0.329 0.746

仪器仪表 14.3% 0.391 0.288

船舶制造 26.6% 0.463 0.511

铁路设备 23.9% 0.380 0.550

其他交运设备 20.9% 0.349 0.514

内燃机 24.9% 0.384 0.572

汽车零部件 27.6% 0.304 0.809

Page 11: 基于产业链投资的多因子 ... - acem.sjtu.edu.cn · PDF file基于产业链投资的多因子量化策略的运用与研究 上海交通大学 1 基于产业链投资的多因子量化策略的运用与研究

基于产业链投资的多因子量化策略的运用与研究 上海交通大学

10

冰箱 26.4% 0.346 0.676

空调 27.8% 0.339 0.732

其他采掘 24.1% 0.339 0.623

集成电路 24.5% 0.397 0.540

电子系统组装 26.6% 0.433 0.545

终端设备 24.4% 0.317 0.673

通信传输设备 21.7% 0.367 0.509

计算机设备 20.4% 0.373 0.465

LED 34.6% 0.414 0.764

显示器件 24.1% 0.337 0.625

乘用车 19.8% 0.384 0.438

商用载货车 16.4% 0.378 0.356

商用载客车 25.5% 0.399 0.564

男装 22.2% 0.351 0.547

其他服装 32.7% 0.686 0.433

化学原料药 26.7% 0.349 0.679

化学制剂 27.4% 0.316 0.774

参考中国央行的一系列政策,这里在计算夏普比率时规定无风险利率为 3%。

这样我们就得到了每个行业的收益风险指标,用于与后文的研究作比较。可以发

现,如上所示,将投资期起始点设立在 2006 年初,虽然经历了 2007、2008 年的

大起大落,绝大多数行业指数都获得了正收益,但是其夏普比率较低。

2. 单产业链指数的收益与风险特征

下面我们用与上一节相同的方法测算单条产业链的收益与风险指标。这里的

产业链使用上述申万三级行业来构建,构建方法为参考相关行业内公司的年报、

招股说明书等报告。我们针对每条产业链下属的行业所涉及的公司进行数据归类,

并等权地投资于行业中的公司,并且,我们也将资金等权地分配给上游行业和下

游行业。这里也规定单个行业上市公司数在 2006 年 1 月 2 日应大于等 3,否则

舍去该行业,也舍去相应产业链。

投资期仍然为 2006 年 1 月 2 日至 2012 年 12 月 31 日。以下为单条产业链的

收益与风险视图:

Page 12: 基于产业链投资的多因子 ... - acem.sjtu.edu.cn · PDF file基于产业链投资的多因子量化策略的运用与研究 上海交通大学 1 基于产业链投资的多因子量化策略的运用与研究

基于产业链投资的多因子量化策略的运用与研究 上海交通大学

11

图 3 产业链指数的收益风险图

Figure 3 The data of the returns and risks of the industry chains’ indexes

同样下面给出每条产业链具体的收益与风险指标:

表 3 产业链指数的收益风险具体数据

产业链名 年化收

益率

年化日收益率标

准差

夏普比率

产业链:种子生产->果蔬加工 21.5% 0.401 0.462

产业链:其他种植业->其他农产品加工 16.1% 0.375 0.349

产业链:林业->造纸 14.9% 0.362 0.329

产业链:饲料->畜禽养殖 20.1% 0.366 0.467

产业链:饲料->动物保健 20.6% 0.364 0.484

产业链:畜禽养殖->调味发酵品 21.5% 0.359 0.515

产业链:畜禽养殖->乳品 23.2% 0.348 0.580

产业链:畜禽养殖->毛纺 19.5% 0.353 0.468

产业链:煤炭开采->焦炭加工 18.6% 0.362 0.430

产业链:煤炭开采->火电 13.9% 0.346 0.314

产业链:煤炭开采->热电 19.1% 0.344 0.468

产业链:焦炭加工->氮肥 17.1% 0.337 0.420

产业链:石油加工->其他化学制品 17.8% 0.323 0.459

产业链:石油加工->轮胎 15.3% 0.314 0.393

产业链:石油贸易->日用化学产品 22.2% 0.345 0.557

产业链:纯碱->玻璃制造 17.2% 0.373 0.381

产业链:涤纶->棉纺 20.5% 0.335 0.522

产业链:特钢->机床工具 15.1% 0.364 0.331

产业链:特钢->机械基础件 17.9% 0.360 0.414

产业链:特钢->磨具磨料 14.5% 0.378 0.305

产业链:特钢->制冷空调设备 22.0% 0.383 0.497

产业链:特钢->纺织服装设备 16.2% 0.353 0.373

0.000

0.100

0.200

0.300

0.400

0.500

0.600

0.700

0.800

0.0% 5.0% 10.0% 15.0% 20.0% 25.0% 30.0% 35.0%

年化

日收

益率

标准

年化收益率

产业链指数的收益风险图

Page 13: 基于产业链投资的多因子 ... - acem.sjtu.edu.cn · PDF file基于产业链投资的多因子量化策略的运用与研究 上海交通大学 1 基于产业链投资的多因子量化策略的运用与研究

基于产业链投资的多因子量化策略的运用与研究 上海交通大学

12

产业链:特钢->工程机械 17.5% 0.356 0.407

产业链:特钢->冶金矿采化工设备 20.1% 0.358 0.478

产业链:特钢->其它专用机械 21.4% 0.338 0.546

产业链:特钢->仪器仪表 13.1% 0.372 0.270

产业链:特钢->船舶制造 20.8% 0.416 0.428

产业链:特钢->铁路设备 18.9% 0.365 0.436

产业链:特钢->其他交运设备 17.0% 0.350 0.400

产业链:机械基础件->内燃机 23.7% 0.351 0.590

产业链:机械基础件->汽车零部件 25.2% 0.317 0.700

产业链:制冷空调设备->冰箱 27.4% 0.356 0.686

产业链:制冷空调设备->空调 28.1% 0.371 0.677

产业链:冶金矿采化工设备->煤炭开采 21.9% 0.354 0.536

产业链:冶金矿采化工设备->其他采掘 24.9% 0.333 0.658

产业链:集成电路->电子系统组装 25.6% 0.367 0.615

产业链:集成电路->终端设备 24.4% 0.335 0.639

产业链:集成电路->通信传输设备 23.1% 0.364 0.554

产业链:集成电路->计算机设备 22.5% 0.372 0.525

产业链:LED->显示器件 30.1% 0.353 0.767

产业链:汽车零部件->乘用车 24.1% 0.328 0.645

产业链:汽车零部件->商用载货车 22.9% 0.324 0.615

产业链:汽车零部件->商用载客车 26.6% 0.323 0.730

产业链:棉纺->男装 20.6% 0.336 0.526

产业链:棉纺->其他服装 27.1% 0.452 0.534

产业链:化学原料药->化学制剂 27.1% 0.326 0.738

对比上一节的收益风险图我们可以发现,产业链指数的风险(以标准差来衡

量)小于行业的风险,而收益情况却更为集中、稳定。

3. 经过量化策略优化的单产业链指数的收益与风险特征

在上面的一节中,我们构造了每条产业链的指数,但是我们并未针对其进行

量化投资,没有进行量化策略的实施与优化。如前文所述,产业链量化策略的目

的就是要在产业链内寻找相对更为优质的企业作为投资对象,那么下面我们使用

量化投资策略改进产业链内的选股,与上一小节的投资结果进行比较。

这里针对每一条产业链运用多因子模型进行量化投资,采用的策略为后面小

节中采用的多因子策略,该策略在本章第四节中将详述。以下为经过量化优化的

单条产业链收益与风险视图:

Page 14: 基于产业链投资的多因子 ... - acem.sjtu.edu.cn · PDF file基于产业链投资的多因子量化策略的运用与研究 上海交通大学 1 基于产业链投资的多因子量化策略的运用与研究

基于产业链投资的多因子量化策略的运用与研究 上海交通大学

13

图 4 量化产业链指数的收益风险图

Figure 4 The data of the returns and risks of the quantitative industry chains’ indexes

以下为具体的经过量化策略优化的每条产业链的收益与风险数据:

表 4 量化产业链指数的收益风险具体数据

产业链名 年化收

益率

年化日收益率

标准差

夏普比率

产业链:种子生产->果蔬加工 23.4% 0.448 0.455

产业链:其他种植业->其他农产品加工 19.3% 0.422 0.386

产业链:林业->造纸 19.2% 0.409 0.395

产业链:饲料->畜禽养殖 32.6% 0.420 0.704

产业链:饲料->动物保健 27.7% 0.407 0.607

产业链:畜禽养殖->调味发酵品 31.3% 0.419 0.677

产业链:畜禽养殖->乳品 30.6% 0.422 0.655

产业链:畜禽养殖->毛纺 49.6% 0.424 1.101

产业链:煤炭开采->焦炭加工 52.5% 0.467 1.061

产业链:煤炭开采->火电 62.3% 0.425 1.396

产业链:煤炭开采->热电 78.9% 0.411 1.848

产业链:焦炭加工->氮肥 32.5% 0.405 0.728

产业链:石油加工->其他化学制品 32.0% 0.410 0.709

产业链:石油加工->轮胎 29.3% 0.388 0.679

产业链:石油贸易->日用化学产品 17.0% 0.413 0.338

产业链:纯碱->玻璃制造 22.2% 0.432 0.445

产业链:涤纶->棉纺 35.1% 0.413 0.776

产业链:特钢->机床工具 29.7% 0.425 0.627

产业链:特钢->机械基础件 50.9% 0.414 1.158

产业链:特钢->磨具磨料 23.3% 0.414 0.489

产业链:特钢->制冷空调设备 35.6% 0.420 0.776

0.000

0.100

0.200

0.300

0.400

0.500

0.600

0.700

0.800

0.0% 10.0% 20.0% 30.0% 40.0% 50.0% 60.0% 70.0% 80.0%

年化

日收

益率

标准

年化收益率

量化产业链指数的收益风险图

Page 15: 基于产业链投资的多因子 ... - acem.sjtu.edu.cn · PDF file基于产业链投资的多因子量化策略的运用与研究 上海交通大学 1 基于产业链投资的多因子量化策略的运用与研究

基于产业链投资的多因子量化策略的运用与研究 上海交通大学

14

产业链:特钢->纺织服装设备 23.9% 0.413 0.506

产业链:特钢->工程机械 20.5% 0.414 0.423

产业链:特钢->冶金矿采化工设备 27.3% 0.399 0.608

产业链:特钢->其它专用机械 32.0% 0.405 0.715

产业链:特钢->仪器仪表 24.7% 0.406 0.533

产业链:特钢->船舶制造 22.4% 0.455 0.427

产业链:特钢->铁路设备 32.9% 0.425 0.704

产业链:特钢->其他交运设备 31.8% 0.402 0.716

产业链:机械基础件->内燃机 52.0% 0.420 1.168

产业链:机械基础件->汽车零部件 54.0% 0.421 1.212

产业链:制冷空调设备->冰箱 41.5% 0.408 0.944

产业链:制冷空调设备->空调 42.7% 0.471 0.843

产业链:冶金矿采化工设备->煤炭开采 54.7% 0.450 1.148

产业链:冶金矿采化工设备->其他采掘 29.4% 0.417 0.633

产业链:集成电路->电子系统组装 32.7% 0.453 0.656

产业链:集成电路->终端设备 38.5% 0.417 0.851

产业链:集成电路->通信传输设备 33.3% 0.432 0.701

产业链:集成电路->计算机设备 32.2% 0.438 0.666

产业链:LED->显示器件 38.2% 0.419 0.840

产业链:汽车零部件->乘用车 30.4% 0.430 0.637

产业链:汽车零部件->商用载货车 44.3% 0.427 0.966

产业链:汽车零部件->商用载客车 32.9% 0.430 0.696

产业链:棉纺->男装 26.9% 0.404 0.592

产业链:棉纺->其他服装 37.5% 0.402 0.857

产业链:化学原料药->化学制剂 25.2% 0.405 0.547

我们在执行产业链量化策略时规定交易成本为千分之一,换仓时一买一卖双

边操作则总的交易成本为千分之二,这应该较为符合市场实际情况。我们可以发

现,经过量化策略优化的单产业链投资结果在收益率上大幅超越了上一小节中的

产业链指数,然而风险只有轻微提升,夏普比率则显著优于前者。

值得注意的是,在进行三次测试后(分别是行业指数、单产业链指数与量化

单产业链指数),第三组的风险靠近第一组的水平,而收益率却大幅提升,这说

明了产业链投资以及量化投资的效果。下面我们对基于产业链的量化多因子策略

进行重点分析。

(三)基于产业链投资的单因子策略研究

1. 产业链量化投资单因子模型测试方法

本文将针对产业链进行多因子模型的选股,并使用打分法,但在这之前,我

们首先对本章第一小节数据说明中的所有因子进行单因子模型测试。

在每次测试时,我们使用一个因子。当我们使用这个因子对产业链中的行业

进行选股时,我们在一个观察期的开始按照因子的值给一个行业中的公司排序,

并选择其中排名靠前的公司,并将这些公司在观察期内持有。进入下一个观察期

时,在下一个观察期的头一天重新按照因子值给公司进行排名,并重新选股。

Page 16: 基于产业链投资的多因子 ... - acem.sjtu.edu.cn · PDF file基于产业链投资的多因子量化策略的运用与研究 上海交通大学 1 基于产业链投资的多因子量化策略的运用与研究

基于产业链投资的多因子量化策略的运用与研究 上海交通大学

15

在每次选股时,我们将资金等权地分给每一个选入的公司。但是同样的,我

们在一条产业链中将资金相等地分给上游和下游。

与上一节设定相同,我们规定一个产业链中所含的每个行业里面含有的公司

数必须大于 3,否则舍弃该条产业链,因为在公司数太少甚至为 1 的情况下,量

化因子选股将变得没有意义。

考虑到这样的情况,我们在一个行业里给公司打分时,只选择排名第一的公

司。但是在总的持有期中,我们会根据指标的变化更换公司。

因为我们获得了沪深股市从 2000 年以来的日数据,所以观察期设置为一个

星期,这是对比一星期、一个月以及其他频率后作出的结果。如前文所述,我们

执行量化策略时规定交易成本为千分之一,换仓时一买一卖双边操作则总交易成

本为千分之二。

2. 单因子模型测试结果

基于上面的设定我们对本章第一小节中的每个因子进行单因子模型测试,投

资期设为 2006 年 1 月 2 日至 2012 年 12 月 31 日,并舍去相对作用较小的因子。

下面为单子模型测试结果(将其按照夏普比率排序):

表 5 基于产业链投资法的量化单因子模型测试结果

因子名 年化收益

年化标准

夏普比率 最大回撤 盈利指数

PX_TO_BOOK_RATIO 44.6% 0.365 1.140 90.1% 3.409

RSI_9D 40.9% 0.346 1.096 107.5% 2.647

CUR_MKT_CAP 40.7% 0.345 1.091 89.7% 3.155

PX_TO_SALES_RATIO 33.3% 0.343 0.882 100.1% 2.442

PE_RATIO 33.2% 0.348 0.870 107.6% 2.282

PX_TO_CASH_FLOW 31.1% 0.348 0.809 104.2% 2.249

RSI_3D 29.3% 0.346 0.760 122.4% 1.833

VOLATILITY_90D 23.3% 0.292 0.695 109.6% 1.625

ASSET_TURNOVER 26.1% 0.337 0.685 111.9% 1.821

VOLATILITY_30D 21.7% 0.297 0.628 112.6% 1.508

RETURN_COM_EQY 22.5% 0.328 0.595 116.9% 1.556

RETURN_ON_ASSET 21.9% 0.324 0.581 118.6% 1.493

PX_TO_FREE_CASH_FLOW 21.8% 0.339 0.557 110.0% 1.642

TRAIL_12M_GROSS_MARGIN 21.9% 0.342 0.552 123.4% 1.471

TRAIL_12M_PROF_MARGIN 20.7% 0.327 0.540 126.2% 1.355

RETURN_ON_INV_CAPITAL 19.8% 0.331 0.509 113.5% 1.471

PX_TO_EBITDA 19.8% 0.353 0.478 128.8% 1.340

TOT_DEBT_TO_COM_EQY 18.6% 0.332 0.470 120.2% 1.332

可以发现,一些因子展现出了比较强的盈利能力。表中的最大回撤指的是在

投资期中发生的最大回撤,盈利指数指投资期内的总回报除以投资期内的最大回

撤,这个值衡量了总收益与最大回撤的比例关系,具有实际参考价值。显然,各

个因子的最大回撤值都是比较大的,这与我国股票市场在 2007、2008 年经历的

暴涨与下跌有关。

Page 17: 基于产业链投资的多因子 ... - acem.sjtu.edu.cn · PDF file基于产业链投资的多因子量化策略的运用与研究 上海交通大学 1 基于产业链投资的多因子量化策略的运用与研究

基于产业链投资的多因子量化策略的运用与研究 上海交通大学

16

那么沪深 300 指数的表现与上述单因子策略相比如何呢?下面我们同样给出

同时期内沪深 300 指数的指标,投资期如前文一样为 2006 年 1 月 2 日至 2012 年

12 月 31 日,如下所示:

表 6 相同设置下沪深 300 指数的结果

年化收益率 年化标准差 夏普比率 最大回撤 盈利指数

沪深 300 指数 15.4% 0.301 0.413 117.4% 1.140

可以看到,如果基于一定的因子进行选股,产业链投资业绩大多优于沪深 300

指数,某些排名靠前的因子优势非常明显。这说明单因子策略、产业链投资是具

有优势的。下面我们进一步进行多因子模型的设计与构建。

(四)基于产业链投资的量化多因子模型的设计与构建

经过单因子测试后,一些因子显示出了优异的选股能力。下面研究如何对这

些因子进行组合、优化。如前文所述,量化投资方法的本质是将投资理念通过数

学与计算机技术来反映,但是,数学与计算机技术是手段,而不是目的。

通过某一因子进行选股来进行量化投资可能会有一些偏颇,因为上市公司的

情况非常复杂,一个因子不能对公司的情况进行完整客观的描绘。所以,笔者思

考,能否通过一系列指标的筛选来最终确定产业链上下游应该选择的公司,通过

多种因子的筛选来更好地选择公司。

1. 单因子产业链投资的详细绩效表现

我们首先对单个因子的选股效果进行细致地观察。这里的单个因子选取上文

中因子效果较好的因子。上一节中,选股因子最好的因子包括 RSI_9D(9 天 RSI

指标)、PX_TO_BOOK_RATIO(市净率)、CUR_MKT_CAP(总市值)、PE_RATIO

(市盈率)等。我们针对 CUR_MKT_CAP(总市值)和 PE_RATIO(市盈率)进

行详细研究。

为了方便比较,我们将沪深 300 指数、上证综合指数、恒生指数、恒生中国

企业指数以及摩根士丹利泛太平洋(不包含日本)指数纳入进来进行比较(这些

指数在 2006 年 1 月 2 日都标准化为 100)。为了增强选股力度,这里规定一个

行业所含上市公司数最少为 5,否则舍弃该条产业链。如前文所述,产业链上下

游的行业在一个观察期(以周为单位)的开始(周一)选取按照该因子值排行最

优的公司。对于总市值指标这里选取总市值较小的公司,因为相关研究已经证明

中国股市存在“小盘股效应”[11]。

以下是总市值因子的产业链投资表现(由于单因子量化产业链指数后期净值

较高,为了便于观察,所以单列单因子量化产业链指数值在右轴,投资期为 2006

年 1 月 2 日至 2012 年 12 月 31 日):

Page 18: 基于产业链投资的多因子 ... - acem.sjtu.edu.cn · PDF file基于产业链投资的多因子量化策略的运用与研究 上海交通大学 1 基于产业链投资的多因子量化策略的运用与研究

基于产业链投资的多因子量化策略的运用与研究 上海交通大学

17

图 5 总市值单因子量化产业链策略结果图

Figure 5 The performance of the single-factor industry chain investment: market capitalization

以下是市盈率因子的产业链投资业绩表现(投资期为 2006 年 1 月 2 日至 2012 年 12

月 31 日):

图 6 市盈率单因子量化产业链策略结果图

Figure 6 The performance of the single-factor industry chain investment: price/earnings ratio

可以发现,虽然单因子策略的累积收益率在绝大多数时期内优于市场指数,

但是其盈利不是特别稳定,特别是基于总市值因子的产业链投资结果在 2011 年

春季以后出现了较大亏损。但是通过观察我们可以发现,每个因子显示出的盈利

能力是不同的,在不同时期的作用也不一样。

那么,我们是否可以组合各个因子,使产业链投资变得更为稳定?这是有希

0

500

1000

1500

2000

2500

0

100

200

300

400

500

600

700

指数

值总市值单因子量化产业链策略,右轴为产业链指数

沪深300指数

上证综合指数

恒生指数

恒生中国企业指数

摩根士丹利泛太平

洋(不包含日本)

指数单因子产业链指数

0

200

400

600

800

1000

1200

1400

1600

0

100

200

300

400

500

600

700

指数值

市盈率单因子量化产业链策略,右轴为产业链指数

沪深300指数

上证综合指数

恒生指数

恒生中国企业指数

摩根士丹利泛太平

洋(不包含日本)

指数单因子产业链指数

Page 19: 基于产业链投资的多因子 ... - acem.sjtu.edu.cn · PDF file基于产业链投资的多因子量化策略的运用与研究 上海交通大学 1 基于产业链投资的多因子量化策略的运用与研究

基于产业链投资的多因子量化策略的运用与研究 上海交通大学

18

望改进的,因为单一因子无法全面反映公司的情况,多个因子组合更加符合人们

的投资习惯。

2. 多因子产业链投资策略的研究与分析

产业链量化策略的一个重要目的便是选择上下游中资质较好的公司,而单一

因子无法全面反映相关上市公司的情况。那么,本文思考建立基于多因子的产业

链选股模型。

结合前面单因子模型的测试结果,本节考虑使用总市值、市盈率以及技术指

标共同构建多因子选股模型。多因子模型的思路是:第一,在行业内选择市值较

小的公司;第二,在选出的市值较小的公司中选择出市盈率较低的公司,这就在

很大一部分程度上规避了公司估值过高的风险;第三,在第二步选出的公司中再

从中选择出 RSI(九天)指标中相对较小的公司,通过技术指标来决定最终的投

资操作。其选股模型如下图所示:

产业链上游行业 产业链下游行业

公司1 公司2 公司3

第一次选股:若干个因子综合打分

公司1 公司3

… … … …

… … … …

第二次选股:若干个因子综合打分

公司3 … … … …

第三次选股:技术指标打分

公司3

… … … …

公司9

公司3、公司9等资金投

资组合

图 7 产业链量化多因子选股框架

Figure 7 The framework of industry chain multi-factor stocks selecting model

如上图所示,我们首先对产业链上游行业进行选股,然后对产业链下游行业

进行选股,选出的股票再等权(等资金)组合,作为这条产业链这个观察期内的

持仓。与上一小节一样,我们规定行业所含公司数最少为 5,第一次选股我们留

下 5 个公司,第二次选股我们留下 2 个公司,再在第三次选股时最终选择一个公

司。

这样的投资逻辑更符合传统投资的习惯。如前文所述,量化投资中数学、统

Page 20: 基于产业链投资的多因子 ... - acem.sjtu.edu.cn · PDF file基于产业链投资的多因子量化策略的运用与研究 上海交通大学 1 基于产业链投资的多因子量化策略的运用与研究

基于产业链投资的多因子量化策略的运用与研究 上海交通大学

19

计与计算机技术毕竟只是工具,真正的思想由投资人来设定。我们用以上框架进

行投资,投资期仍设置为 2006 年年初至 2012 年年末。投资结果如下图所示:

图 8 多因子量化产业链策略结果图

Figure 8 The performance of the multi-factor industry chain investment

如果我们对比现在的表现与之前单因子模型的表现,我们可以发现多因子模

型的累积收益要明显优于单因子模型,下面我们对产业链多因子模型的投资业绩

进行更为细致的研究与分析。

(五)产业链投资量化多因子模型的投资绩效分析

1. 样本外的测试结果

在之前的研究与分析中,我们的投资期都设置为 2006 年初至 2012 年年底,

下面我们运用与上文相同的量化多因子产业链投资方法观察其在 2013 年年初至

2014 年 2 月底的表现。

令多因子产业链指数在 2013 年年初为 100,同样我们将其它 5 个市场指数

在 2013 年年初时归为 100。以下就是产业链量化投资策略 2013 年以来的投资表

现:

0

500

1000

1500

2000

2500

3000

0

100

200

300

400

500

600

700

指数

多因子量化产业链指数,右轴为产业链指数沪深300指数

上证综合指数

恒生指数

恒生中国企业指

摩根士丹利泛太

平洋(不包含日

本)指数单因子产业链指

Page 21: 基于产业链投资的多因子 ... - acem.sjtu.edu.cn · PDF file基于产业链投资的多因子量化策略的运用与研究 上海交通大学 1 基于产业链投资的多因子量化策略的运用与研究

基于产业链投资的多因子量化策略的运用与研究 上海交通大学

20

图 9 多因子量化产业链策略 2013 年以来窗口期外投资表现

Figure 9 The performance of the multi-factor industry chain investment during the out of sample

period, from the beginning of the year 2013

如图所示,2013 年年初以来产业链多因子量化投资策略的累积收益一直在

各指数上方,并且优势明显,这说明了产业链量化多因子策略的实际运用价值。

2.运用统计取样方法与市场指数相比较

下面我们更为具体地将产业链多因子量化模型投资的结果与各市场指数进

行对比,我们取 2006 年 1 月 2 日至 2014 年 2 月 28 日的投资结果进行评判。

在此期间,产业链多因子模型以及各市场指数的投资结果为:

表 7 产业链量化多因子模型相比市场指数的具体投资结果

年化收益率 年化收益

率标准差

夏普比率 最大回撤

盈利指

产业链多因子量化策略 46.6% 0.334 1.306 65.8% 5.632

沪深 300指数 10.5% 0.290 0.261 117.4% 1.027

上证综合指数 6.9% 0.267 0.148 117.3% 0.743

恒生指数 5.2% 0.266 0.083 95.4% 0.765

恒生中国企业指数 7.7% 0.342 0.137 123.6% 0.907

摩根士丹利泛太平洋指

数(除日本)

5.3% 0.229 0.102 102.7% 0.646

可以看到,产业链多因子量化策略在统计指标上明显优于各市场指数。值得

一提的是,在最大回撤值这个指标上,产业链多因子量化策略也优于各市场指数,

而且优势明显,这从一个侧面说明产业链多因子量化策略指数比市场指数风险更

小。而在用于测度总收益与最大回撤值的比率的盈利指数上,产业链多因子量化

策略也具有非常明显的优势。

下面,我们对产业链多因子量化策略指数进行统计抽样,以观察在不同的投

0

20

40

60

80

100

120

140

160

180

2013/1/1 2013/4/1 2013/7/1 2013/10/1 2014/1/1

指数

值多因子量化产业链指数2013年以来相对于市场表现

单因子产业链指数

沪深300指数

上证综合指数

恒生指数

恒生中国企业指数

摩根士丹利泛太平洋

(不包含日本)指数

Page 22: 基于产业链投资的多因子 ... - acem.sjtu.edu.cn · PDF file基于产业链投资的多因子量化策略的运用与研究 上海交通大学 1 基于产业链投资的多因子量化策略的运用与研究

基于产业链投资的多因子量化策略的运用与研究 上海交通大学

21

资期,产业链多因子量化策略指数相对于各指数的收益情况。在 2006 年年初至

2014 年年初这一段时间内,我们采用滚动抽样的方式,抽取时间间隔为 30 天、

90 天、180 天以及 365 天(在实际操作中,按照交易日计算,我们取 21、63、

126 以及 252 个交易日数据)的产业链多因子量化指数的数据以及其它市场指数

的数据。

若抽取样本次数为 N,而在这 N 次中单因子产业链指数的总收益如果战胜某

市场指数 K 次,那么我们说在该条件下单因子指数战胜此市场指数的概率为 K/N。

首先我们看 30 天(即 21 个交易日)的抽样平均结果,最右侧一栏显示了该

种抽样方法的 K/N 值(投资测试期为 2006 年 1 月 2 日至 2014 年 2 月 28 日):

表 8 30 天滚动取样结果

绝对收益

率均值

年化标

准差均

年化夏普

比率均值

最大回

撤值均

盈利

指数

均值

战胜该

市场指

数概率

产业链多因子量化策略 3.8% 0.30 1.77 0.083 1.76

沪深 300指数 1.2% 0.26 0.49 0.074 1.27 64.9%

上证综合指数 0.9% 0.24 0.33 0.068 1.22 64.7%

恒生指数 0.6% 0.22 0.18 0.063 0.89 59.6%

恒生中国企业指数 0.9% 0.29 0.30 0.083 0.93 58.8%

摩根士丹利指数 0.6% 0.19 0.23 0.059 1.13 58.4%

以下是 90 天的滚动抽样结果(投资测试期为 2006 年 1 月 2 日至 2014 年 2 月

28 日):

表 9 90 天滚动取样结果

绝对收

益率均

年化标

准差均

年化夏

普比率

均值

最大回

撤值均

盈利指

数均值

战胜该

市场指

数概率

产业链多因子量化策略 12.5% 0.32 1.81 0.163 1.47

沪深 300指数 4.3% 0.27 0.57 0.151 0.94 79.1%

上证综合指数 3.0% 0.25 0.39 0.139 0.93 77.0%

恒生指数 2.0% 0.23 0.22 0.125 0.72 63.5%

恒生中国企业指数 3.0% 0.30 0.31 0.166 0.76 63.7%

摩根士丹利指数 2.0% 0.20 0.27 0.122 0.94 63.0%

以下是 180 天滚动抽样结果(投资测试期为 2006 年 1 月 2 日至 2014 年 2 月

28 日):

表 10 180 天滚动取样结果

绝对收

益率均

年化标

准差均

年化夏

普比率

均值

最大回

撤值均

盈利

指数

均值

战胜该

市场指

数概率

产业链多因子量化策

28.7% 0.32 1.94 0.235 1.47

Page 23: 基于产业链投资的多因子 ... - acem.sjtu.edu.cn · PDF file基于产业链投资的多因子量化策略的运用与研究 上海交通大学 1 基于产业链投资的多因子量化策略的运用与研究

基于产业链投资的多因子量化策略的运用与研究 上海交通大学

22

沪深 300指数 10.6% 0.28 0.70 0.233 0.87 83.1%

上证综合指数 7.3% 0.25 0.48 0.217 0.75 86.9%

恒生指数 4.3% 0.24 0.23 0.188 0.82 72.5%

恒生中国企业指数 6.3% 0.31 0.32 0.255 0.73 75.2%

摩根士丹利指数 4.6% 0.21 0.30 0.187 0.88 73.2%

以下是一年期滚动抽样结果(投资测试期为 2006 年 1 月 2 日至 2014 年 2 月

28 日):

表 11 一年期滚动取样结果

绝对收

益率均

年化标

准差均

年化夏

普比率

均值

最大回

撤值均

盈利指

数均值

战胜该

市场指

数概率

产业链多因子量化策略 68.7% 0.33 1.99 0.334 1.64

沪深 300指数 26.7% 0.29 0.83 0.360 1.07 87.4%

上证综合指数 17.5% 0.26 0.56 0.340 0.93 87.3%

恒生指数 7.6% 0.25 0.18 0.289 0.75 80.2%

恒生中国企业指数 12.5% 0.33 0.29 0.390 0.65 84.9%

摩根士丹利指数 9.2% 0.22 0.28 0.289 0.85 81.8%

对比不同的抽样期我们可以发现,随着抽样期的加长,产业链多因子模型的

总收益随之增加,其战胜沪深 300 指数的概率也随着抽样期的加长而增大。由于

沪深 300 指数、上证综合指数与量化策略指数相关度更高,所以不难理解产业链

多因子量化策略战胜这两个市场指数的概率也更大。

Page 24: 基于产业链投资的多因子 ... - acem.sjtu.edu.cn · PDF file基于产业链投资的多因子量化策略的运用与研究 上海交通大学 1 基于产业链投资的多因子量化策略的运用与研究

基于产业链投资的多因子量化策略的运用与研究 上海交通大学

23

四、 总结及未来可研究的方向

(一)研究成果总结

产业链投资中产业链上下游企业的择股是一个值得研究的问题。产业链集合

中涵盖的产业链数量众多,产业链下设行业所涵盖的公司也非常多,任何人为手

动的选股方法缺乏效率、不能发挥产业链投资的最大效力。量化投资作为一种投

资方法,运用数学与计算机技术的手段对金融产品进行投资、交易,具有可规模

化、自动化的特点。本文思考将量化策略运用于产业链投资选股方法。

本文通过量化因子策略对产业链上下游的企业进行择股,并对其相关的策略

构建、策略效果进行了较为详尽的分析。本文对二十个单因子运用于产业链投资

的效果进行了测试,分析其单独使用时的效用,并且利用了效果较好的单因子设

计、构建了产业链投资量化多因子模型,并通过此模型进行模拟投资研究。研究

纳入了沪深 300 指数、上证综合指数、恒生中国企业指数等一系列市场指数进行

比较。

研究表明,产业链投资量化多因子策略的累积收益在绝大部分时间里优于各

市场指数。并且,本文通过窗口期外投资以及统计抽样的方法,说明了产业链量

化多因子策略形成的指数相比市场指数具有明显优势,量化策略与产业链投资的

结合使得产业链投资更具实际运用价值。

(二)未来可研究的方向

本文在研究股票投资过程中略去了在投资测试期起始点之后上市的公司,这

不是实际投资操作中惯用的做法,更为细化的研究应该实时包括新上市的公司,

将其纳入产业链投资组合的选择。同时,在产业链行业的选择上还可以进一步细

化。本文的研究重点是产业链投资的量化多因子策略,所以未能对上述议题进行

更深入一步的研究,不过这些问题可以作为未来研究的重点。

Page 25: 基于产业链投资的多因子 ... - acem.sjtu.edu.cn · PDF file基于产业链投资的多因子量化策略的运用与研究 上海交通大学 1 基于产业链投资的多因子量化策略的运用与研究

基于产业链投资的多因子量化策略的运用与研究 上海交通大学

24

参考文献

[1] 刘国丰. 基于产业链的投资组合策略研究. [D]. 上海交通大学, 2010

[2] 周杨. 基于产业链的投资组合系统及应用. [D]. 上海交通大学, 2012

[3] 刘桂梅, 杨晨 (2010). "金融危机下 Fama-French 多因子模型在中国债券市

场的应用."[J]浙江大学学报: 理学版 37(4): 396-400

[4] Ellis, Charles D., and John Lescault. Winning the loser's game.[M] McGraw-Hill

Audio, 2004

[5] 黄惠平,彭博. "市场估值与价值投资策略."[J] 会计研究 10 (2010): 4O-47

[6] 孔蕾,中国股票市场价值投资策略的实证研究[D],浙江大学,2013

[7] 蔡春, et al. (2012). "盈余管理方式选择, 行为隐性化与濒死企业状况改善

——来自 A 股特别处理公司的经验证据."[J]会计研究(9): 31-39

[8] 吴联生, et al. (2007). "避免亏损的盈余管理程度: 上市公司与非上市公司的

比较."[J]会计研究 2: 44-51

[9] 郭慧婷, 张俊瑞,徐萍. "中国上市公司经营现金流操控程度研究——基于制造

业和批发零售业上市公司的数据."[J]山西财经大学学报 4 (2010): 106-113

[10] 徐明亮, 李亮 (2008). "上市公司利润操控的主要手段及分析."[J]现代农业

(1): 95-97

[11] 何承丽,瞿海华. "沪市小盘股效应分析."[J] 财会月刊: 综合版 9 (2011): 11-13

Page 26: 基于产业链投资的多因子 ... - acem.sjtu.edu.cn · PDF file基于产业链投资的多因子量化策略的运用与研究 上海交通大学 1 基于产业链投资的多因子量化策略的运用与研究

基于产业链投资的多因子量化策略的运用与研究 上海交通大学

25

THE APPLICATION AND RESEARCH OF THE

MULTI-FACTOR QUANTITATIVE STRATEGY

BASED ON THE INDUSTRY CHAIN INVESTMENT

ABSTRACT

The purpose of industry chain investment is to establish portfolios made up with

companies across the industires in an industry chain, so as to diminish the relative

risks among the industries of the chain and obtain a better investment result on the

measurement of returns and risks, which has been verified by the former researh.

However, the industry chain investment itself is a complicated process, and any

manual method of stocks picking would result in a lack of efficiency. Quantitative

investment as a method, applies mathematics and computer technology to invest and

trade financial products with disciplines, which is scalable and can be applied to the

industry chain investment. This paper aims to apply the quantitative strategy on the

industry chain investment. We use the quantitative factor-model to pick the stocks

across the industries in an industry chain, and we design and implement a multi-factor

model based on the single factors which have good performances during the

backtesting scenarios. The paper uses various market indexes including CSI 300 index,

Hang Seng China Enterprises Index, Shanghai Composite Index and so on to compare,

and also incorporates out-of-sample testing and statistical sampling to demonstrate the

effect of the multi-factor quantitative strategy based on the industry chain investment,

which proves the validity of industry chain quantitative investment strategy and

demonstrates that the combination of multi-factor quantitative strategy and industry

chain investment makes industry chain investment closer to the real application.

KEY WORDS: industry chain investment, quantitative strategy, multi-factor model,

statistical sampling