Rö S 分析探索中国股票市场的非线性
《预测》1999 年第 2 期 ·理论与方法研究·
R ?S 分析探索中国股票市场的非线性X
徐龙炳 陆 蓉
(上海财经大学金融学院 200083)
摘 要 本文应用 R ?S 分析法研究了中国股票市场
的非线性, 实证结果表明上海股票市场与深
圳股票市场均存在着状态持续性, 波动呈现
集群性, 股价指数所构成的时间序列呈现非
线性。其原因在于信息以非线性的方式呈
现, 人们也以非线性的方式对信息作出反
应, 并最终通过市场交易活动反映在股价指
数上, 其结论隐含着一定的政策意义。
关键词 R ?S Hurst 指数 状态持续性 非线性
1 引言
关于中国股票市场的有效性问题, 国内许多学者
进 行了大量的研究, 但与所接受的理论相反的是, 随
机游走模型并没有很好地刻划市场特性, 同时广为传
授 的 有 效 市 场 假 说 (Efficient M arket Hypo thesis,
EM H ) 也没有很好地得到实证支持。市场有效并不一
定意味着服从随机游走, 但随机游走确实意味着市场
有效。
EM H 认为, 价格已经反映了所有可以得到的信
息。市场行为者的买卖信息都反映在市场的价格之
中, 只有不可预见的事件才会影响股票的价格变化。
但随机事件对股票价格的影响可能是正向的, 也可能
是负向的, 因此股票价格的变动是可预测的趋势部分
与 不可预测的随机游走部分之和。即, 今天的价格变
化 来源于今天未预料的信息, 昨天的信息不再重要,
从而今天的收益与昨天的收益无关, 即收益是独立
的。如果收益是独立的, 那么它们是随机变量, 并且服
从随机游走。此即 EM H 的随机游走解释。然而有效市
场假说并没有很好地得到实证支持。
问题在于价格以何种形式来呈现市场信息, 人们
又以何种方式对信息作出反应, 以线性的或是非线性
的?进一步地, 中国股票市场是否存在文献[6 ] 中所说
的 状态持续性?或是存在逆状态持续性?本文在文献
[1 ] 的 基 础 上, 运 用 R ?S 分 析 (Rescaled Range
A nalysis, 重新标度极差分析) 方法[9 ] 实证研究中国
股票市场的非线性、Hurst 指数 H 及状态持续性问
题, 以此进一步揭示中国股票市场的内在特性。
2 R?S 分析法
R ?S 分析法是Hurst 在大量实证研究的基础上提
出的一种方法, 后经过多人努力逐渐完善。Hurst 是一
位水文专家, 从 1907 年起从事尼罗河水坝工程研究。
在长达 40 多年的研究中, 主要研究水库控制的问题。
通 过大量的实证研究, 他提出了一种新的统计量:
Hurst 指数 H , 并由此发展了 R ?S 分析方法。
在 40 年代, Hurst 基于对有偏的随机游走所进行
的深入研究, 结合 R ?S 分析方法, 发现许多自然现象
的统计确实能很好地由有偏的随机游走来刻划。
M andelbro t[11 ] 也在 60 年代、70 年代对此进行了广泛
探讨。M andelbro t 称之为分数布朗运动, 现在一般称
之为分维时间序列。
若 A是时间序列的分数维, 则有 A= 1
H , 其中 H
= Hurst 指数。
更进一步地, 关联尺度函数 C (t) 满足 C (t) =
22H - 1 - 1, 其中 H = Hurst 指数。
当 H = 1?2 时, 对任何 t 值, 均有C (t) = 0, 而这
正是独立随机过程所必须的条件。然而当 H ≠ 1?2
时, 不管 t 取何值, C (t) ≠ 0。分数布朗运动的这一特
征, 导致了状态持续性或逆状态持续性。
当 H > 1?2 时, 存在状态持续性; 反之当 H <
1?2 时存在逆状态持续性。应用R ?S 分析法, 可以确定
信息的两个重要方面, Hurst 指数 H 和平均的周期长
度。周期的存在对于进一步的讨论分析具有重要意
·95·
X 本研究得到江苏省教委人文社科研究基金(98SJB790005) 和上海财经大学 211 科研基金资助
收稿日期: 1998201228
义。当 H ≠ 1?2 时, 概率分布不再是正态分布; 当 1?2
< H < 1 时, 时间序列是分形。分维时间序列不同于
随 机游走, 它是有偏的随机过程, 其偏离的程度取决
于H 大于 1?2 的程度, 并且随着H 逐步逼近 1 状态持
续性逐步增强。
对于一个具有状态持续性的时间序列来说, 具有
长 期记忆效应的特征。从理论上来说, 今天所发生的
一 切将一直影响未来。用混沌动力学的术语来说, 即
存在着对初始条件的敏感性。不管以什么时间尺度进
行标度, 这种长期记忆效应都会发生。
值得指出的是, R ?S 分析法是十分有效的工具,
不 必假定潜在的分布是高斯分布, 仅仅独立就可以。
这样R ?S 分析法的研究对象就不仅包括正态分布, 而
且也包括非高斯独立过程, 如学生 2t、# 及其它分布。
R ?S 分析法是非参数分析法, 这样对于所讨论的分布
的形状就没有什么特别要求。对于一个系统来说, H
= 1?2 意味着一个独立过程。但当H = 1?2 时, 却并不
能说明时间序列是一个高斯随机游走, 仅表明不存在
长期记忆[6 ]。
R ?S 分析法可以表述为[6, 8, 9 ]:
(R ?S ) n = C ? nH (1)
其中 n 为样本观察数, R 表示重新标度的极差, S 表示
标准差, H 表示 Hurst 指数, C 为常数。
由此 可 得 Hurst 指 数 H 的 估 计, 首 先 作 出
log (R ?S n) 关于 log (n) 的图, 然后用最小二乘法回归
求出斜率, 即得出 Hurst 指数 H 。
一般情形下, 以下列的方程作为研究对象, 即
log (R ?S n) = log (C ) + H ? log (n) (2)
关于R ?S 的检验问题, 取高斯分布情形作为原假
设, 不仅因为高斯情形容易, 而且有效市场假设
(EM H) 也是基于高斯情形, 并把它作为零假设。
基于二项分布的原假设, Hurst 得到随机游走是
方程(1) 的一种特殊情形[9 ], 即
(R ?S ) n = (n? P?2) 015 (3)
其中 n 为观察值个数。
Feller 也得到了相似的结果[7 ]:
E (R ′(n) ) = (n? P?2) 015 (4)
V ar (E (R ′(n) ) ) = (P2?6 - P?2) ? n (5)
其 中 R ′是修正的极差, 即去掉样本均值后的累积偏
差。
方 程 (3)、(4) 是原假设为布朗运动下的标准假
设, 这样极差随时间的平方根增加。由于 Feller 以修
正 的极差作为研究对象, 而不是重新标度的极差, 从
而其结果与蒙特卡罗(M onte Carlo) 模拟得到的结果
大不相同。
当 n 较小时, 关于 R ?S 统计的系统偏差的估计,
A nis 和L loyd[2 ] 提出了如下的方程:
E (R ?S n) = {# [015? (n - 1) ]?( P ? # (015
? n) ) }? ∑
n- 1
r= 1
(n - r) ?r (6)
当 n 较大时, 方程(6) 失去意义。然而用 Sterling
函数, 方程(6) 可以简化为:
E (R ?S n) = (n? P?2) - 015 ? ∑
n- 1
r= 1
(n - r) ?r (7)
当 n > 300 时, 可用方程(7) 进行估计。但当 n 逐
渐增大时, 方程(7) 接近方程(4)。从实际结果来看, 当
n < 20 时,A nis 和L loyd 所提出的方程(6) 与蒙特卡
罗 模拟的结果有一定的偏差。为此, Peters 对方程
(6)、(7) 进行了修正[12 ], 得到方程 (8) , 这一结果与蒙
特卡罗模拟的结果几乎完全一致。
E (R ?S n) = ( (n - 015) ?n) ? (n? P?2) - 015 ?
∑
n- 1
r= 1
(n - r) ?r (8)
对于R ?S 的期望值E (R ?S ) n 的估计, 一般采用方
程(8)。在 E (R ?S ) n 的基础上就可以估计出 Hurst 指
数 H 的期望值 E (H ) n。由于 R ?S 的取值是一个随机
变量, 服从正态分布, 因此也希望 H 的取值服从正态
分布, 这样 Hurst 指数 H 的方差即为:
V ar (H ) n = 1?T (9)
其中 T 为样本观察总数。由此可见, var (H ) n 并不依
赖 n、H , 仅仅依赖样本观察总数 T。
在作出 log?log 的基础上, 可以容易地观察出在
何 处发生突变, 并进一步估计出周期长度。下面的统
计量V n 最初由 Hurst 在 1951 用于检验稳定性, 但也
可 以很好地用于估计周期长度。值得指出的是, 当有
噪声出现时, 统计量V n 尤其显得出色。
V n = (R ?S ) n? n (10)
如果R ?S 统计以时间的平方根标度, 那么这个比
率V n 产生一条水平线。换句话说, 对于独立的随机过
程 来说, 统计量V n 关于 log (n) 是平坦的。另一方面,
对于具有状态持续性的过程来说, R ?S 以大于时间的
平方根标度 (H > 015) ,V n 关于 log (n) 向上倾斜; 反
之, 对于具有逆状态持续性 (H < 015) 的过程来说,
V n 关于 log (n) 向下倾斜。当V n 图形形状发生改变时,
就产生突变, 长期记忆过程消失。
3 实证研究
为了消除原始数据自相关的影响, 必须对原始数
据进行处理。对于资本市场来说, 分析对数收益的
A R (1) 的残差更能揭示数据的内在特性。A R (1) 残差
可 以用于消除或降低线性依赖性程度, 即自相关性。
·06·
因为线性依赖性会偏离 Hurst 指数 H 或容易导致第
一类错误的发生。通过取A R (1) 的残差, 可以降低偏
离程度并希望由此降低结果的不显著性程度。此过程
通常称为预白噪声处理或消去趋势法。消去趋势法并
非 适用于所有统计检验, 因为对于某些统计检验, 消
去趋势法也许会掩饰其重要的信息。
然 而, 对于 R ?S 分析, 消去趋势法将消除序列自
相关, 同时也可以消除通货膨胀性的增长。但是, 相对
于通货膨胀性增长问题来说, 短期记忆问题更需要引
起 重视。对于短期记忆过程, 研究的对象是高频率的
数据, 如每天的收益率等; 对于通货膨胀性增长问题,
研究的对象低频率的数据, 如 50 年中每月的收益率。
由于中国股票市场仅有几年的历史, 因此本文的目的
在于揭示短期记忆特性。
本文选取上海股票市场的上证综合指数每日的
收盘指数和深圳股票市场的深圳成分指数每日的收
盘指数作为研究对象。样本区间的选取必须考虑到实
分析时样本总观察数 T (注: 有时可能是 T - 1, 或 T
- 2, 取决于对原始数据进行何种预处理。本文是T -
2 的情形。) 有较多的因子 n, 从而也就可以通过回归
估计出 Hurst 指数 H 。具体的样本区间如下:
上证综合指数 1990 年 12 月 19 日 —1998 年 10 月
5 日, 共计 1952 个交易日;
深圳成分指数 1991 年 4 月 3 日 —1998 年 9 月 24
日, 共计 1902 个交易日。
若原始数据所构成的时间序列以{P t} 表示, 则得
到对数收益的序列:
S t = log (P t?P t- 1)
其中S t 表示 t 时的对数收益, P t 表示 t 时的股价指数。
以 S t 作为因变量, S (t- 1) 作为自变量, S t 对 S (t- 1)
进行回归分析, 得到 S t 的A R (1) 残差序列:
X t = S t - (a + b? S (t- 1) )
此时时间序列X t 的长度为 T - 2, 这样问题为对
序列 X t 进行 R ?S 分析。
首先对 T - 2 进行因子分解使得A ? n = T - 2,
这样把时间序列 X t 分成每组有 n 个观察值的A 个子
样本。从 n ≠ 1, 2 的第一个因子 n 开始, 对每个子样本
计算其重新标度后的极差 R 和标准差 S , 从而得到A
个 R ?S , 由此求出其平均值, 并记为(R ?S ) n。对下一个
因子n 重复上述过程直至n = (T - 2) ?2。最后用方程
(2) 就可以估计出 Hurst 指数 H , 并由此进一步分析
周期性问题。
对于上证综合指数和深圳成分指数, 进行上述
R ?S 分析得到下列基本结果(图 1)。
但是, 由图 1 可以明显地看出, 当n = 195 时, 统计
量V n 停止增长, 反映出周期长度为 n = 195。由此, 对
于方程(11) 必须分段进行重新估计, 得到下列结果。
图 1
当 3 F n F 195 时,
log (R ?S n) = - 01181 + 01661? log (n)
(010079) (010051)
R 2 = 01999 S. E = 010109 DW = 11733
从而 H = 01661, 代入关联尺度函数 C (t) 得到 C (t)
= 22H - 1 - 1 = 01250。
当 325 F n F 975 时,
log (R ?S n) = 01436? log (n)
(011264)
R 2 = 01856 S. E = 010474 DW = 11990
从而 H = 01436, 代入关联尺度函数 C (t) 得到 C (t)
= 22H - 1 - 1 = - 01085。
E (R ?S ) n 关于 log (n) 回归得到 Hurst 指数 H 的
期望值 E (H ) n = 01570。
这样, 对于上海股票市场来说, 存在着状态的持
续性, Hurst 指数 H = 01661, 同时也有一个 n = 195
的周期, 其关联尺度为 25à 。
对于深圳股票市场来说, 存在着状态的持续性,
Hurst 指数 H = 01643, 其关联尺度为 2119à (图 2)。
图 2
用最小二乘回归得到下列结果:
log (R ?S n) = - 01178 + 01643? log (n)
(010114) (010061)
·16·
R 2 = 01999 S. E = 010016 DW = 01861
从而 H = 01643, 代入关联尺度函数 C (t) 得到 C (t)
= 22H - 1 - 1 = 01219。
E (R ?S ) n 关于 log (n) 回归得到 Hurst 指数 H 的
期望值 E (H ) n = 01567。
4 结果分析
本文应用R ?S 分析法, 实证研究了中国股票市场
的非线性及状态持续性问题, 以此进一步揭示中国股
票市场的内在特性。
通过以上的分析, 得到下列的基本结论:
(1) 上海股票市场存在着状态的持续性, 其
Hurst 指数 H = 01661, 同时也有一个 n = 195 的周
期, 其关联尺度为 25à ; 对于深圳股票市场来说, 也存
在着状态的持续性, 其Hurst 指数H = 01643, 其关联
尺度为 2119à 。
(2) 上海股票市场与深圳股票市场的股价指数所
构 成的时间序列均呈现非线性。这样, 中国股票市场
的非线性为人们导出一个在Bo ldrin 和M ontrucchio
意义下的政策函数提供了可能性。
(3) 与 EM H 的结论不同的是, 中国股票市场并
没有呈现出随机游走的特性, 其实也并不是一个独立
过 程, 而是表现出相互依存的关系, 因为其关联尺度
不 等于零。其原因在于信息以非线性的方式呈现, 人
们也以非线性的方式对信息作出反应, 股价波动也呈
现非线性, 所有这些最终都通过市场交易活动反映在
股价指数上, 使得股价指数所构成的时间序列呈现出
非线性。
(4) 股票市场所具有的状态持续性特征使得股票
市 场具有一定的风险性, 表现为价格的连续涨跌, 呈
现出波动的集群性, 即内生变量的大幅度波动集中在
某 些时段上, 而小幅波动则集中在另一些时段上, 其
过程本身隐含着一定的政策意义。投资者能否以及如
何从股市获得最大收益, 在一定程度上依赖于投资者
对股票市场特性的深刻认识。
(5) 研究表明, 上海股票市场与深圳股票市场都
具有非线性, 并且上海股票市场股价的关联程度为
25à , 深圳股票市场股价的关联程度为 2119à 。这表
明中国股票市场的历史信息将对股市产生一定的影
响, 对投资者来说, 也就具有某种意义下的预期。
经济学家们有充分的实际理由检测出宏观数据
中的非线性, 并且他们也一直很清楚估计参数和评估
政 策 干 预 的 技 术 的 重 要 性。Bo ldrin 和
M ontrucchio (1986) 的结论表明, 人们能够在一个非
线性决定的模型中导出一个政策函数, 从线性观点来
看, 它确实好像是从一个对数线性随机增长模型中导
出的。值得指出的是, 为使这一信息有用, 就有必要估
计 现有的非线性。本文的实证研究表明, 中国股票市
场呈现出非线性, 其Hurst 指数H > 0. 5, 从而表现出
具有状态持续性的特征。
(R ?S 的计算程序由李星毅同志编写, 同时笔者
也用著名的 SA S 语言、MA TLAB 语言分别编写了
R ?S 的计算程序; R ?S 期望值 E (R ?S ) n 的估计采用
MA TLAB fo r W indow s 软件; 本文的有关统计分析
采用 Econom etric V iew s(Eview s) 软件。
本文在研究过程中一直得到导师戴国强教授的
悉心指导, 计算程序的编写得到李星毅同志的大力帮
助, 一并致谢。)
参 考 文 献
1 徐龙炳. 探讨资本市场有效性的一种有效方法: 分
形市场分析. 财经研究, 1991(1).
2 A nis A A , L logy E H. The expected value of the
adjusted rescaled hurst range of independent na2
tional summ ands. B iom etrika, 1996, 63.
3 Bo ldrin M , M ontrucchio L. O n the indeterm inacy
of cap ital accum ulation paths. Journal of Econom ic
Theo ry, 1986, 40: 26~ 39
4 B rock W A. D istinguishing random and determ in2
istic system s. Journal of Econom ic Theo ry, 1986,
40
5 Fam a E F. Efficient cap ital m arket: a review of
theo ry and emp irical wo rk. Journal of F inance,
1970, 25.
6 Feder J F rachals. Plenum Press,N ew Yo rk, 1998.
7 Feller W. The asymp to tic distribution of the range
of sum s of independent varibles. A nnals ofM athe2
m atics and Statistics, 22, 1951.
8 Hurst H E, B lack R P, Sim aika Y M. Long2term
sto rage: an experim ental study,London. 1965.
9 Hurst H E. The long2term sto rage capacity of
reservo irs. T ransactions of the Am erican Society
of C ivil Engineer 116, 1951.
10 KendallM G. The analysis of econom ic tim e se2
ries, Part I: Price. Journal of Royal Statistical So2
ciety 96, 1953, in Coo tner P, ed. The Random
Character of Stock M arket Prices. Cam bridge,
MA :M. I. T. Press, 1964.
11 M andelbro t B. The pareto2levy law and the dis2
tribution of incom e. International Econom ic Re2
view , 1, 1960.
12 Peters E E. F ractal structure in the cap ital m ar2
kets. F inancial A nalysts Journal, July?A ugust
1989.
·26·
Rö S 分析探索中国股票市场的非线性.pdf