Cuscore
统计量——Q=Σ[y(t)-βt]t ,由Box and Luceno 博士于1987提出,属于
统计过程控制量SPC( Statistical Process Control),主要运用于地质学,气象学,以及
资本市场(股票,外汇等)价格图形技术分析与工厂产品(轴承,
滚轮等)误差范围控制。Cuscore统计量主要通过对随机过程中的样本数据的趋势变化率来控制各种信号。
研究方法
趋势变化识别
对于一个已知分布的
随机过程,图一. 显示了一系列
样本函数的基本趋势,
斜率为1.0,同时一个斜率为1.3的变化(突变)移动,从时间10的地方开始出现。为了识别出样本函数随机变量的趋势变化,将Cuscore统计量定义为
Q=Σ[y(t)-βt]t ;其中y(t)是一系列的
观测值,β是
斜率(也就是观察的
时间序列值在每个时间单位的变化率),t为时间指数。Cuscore值形成的图形如图二所示。
这种统计识别方法揭露和展示了
斜率上的变化所呈现出来的证据。当斜率从初始值1.0增加30%变为1.3,其变化的幅度应该很明显的。30%已经很接近1/3的程度,是一个很大的变化,应该引起我们的注意,但我们很难在图一中t=10的地方识别出变化趋势。
带噪声数据趋势识别
当
观测值并没有落在指定的
数学曲线上时,如图三加入了随机的噪声,并依然按照30%的变化率转变,Cuscore统计量比无噪声数据显现了更强的趋势增强信号。
量的分析
在图四中,ABC这条线是一个趋势变化的原型。第一个线段AB的
斜率为0.5,而第二个线段BC的斜率为1.5。虚线BD是直线AB的延长线。虚线AE与直线BC平行,斜率也是1.5。当斜率发生变化,
观测值就会偏离基础模型(也就是没有斜率变化)的期望值。顺着直线BC,y的值超过了直线BD的期望值,随着时间地不断增加。在图五中,我们根据Q值的累计偏差,就可以得到如曲线1所示的图形。
现在我们假设事先不知道直线AB与BC的
斜率,也不知道在B点的斜率发生了变化。假设我们最好的理解是,从A点开始应该出现一个1.0的斜率,如直线AC所示。在图五中,Cuscore统计量显示为曲线2的图形。Cuscore统计量的图形差异极大。根据这个假设的基础模型,得到的偏差序列,可以明显看出趋势的斜率发生了变化。
实际运用
数据监控
对
自相关数据的监控,可先对
数据拟合一个合适的
时间序列模型,然后运用此模型来消除
自相关性,对
残差进行
统计过程控制 监控。 但是这些
控制图都忽略了故障表征的
动态特性。因此,我们使用Cuscore统计量来进行预期信号的识别。
首先,构建如下模型
ai = ai( yi,xi,γ) i = 1,2,…,l (1)
其中yi是
观测值,xi是已知的输入变量,γ 是失控信号的某个未知参数,ai ~ N( 0,σ2a) ,则
对数l = - 1/2σ2a*Σai^2+ c
其中c 为不依赖于γ 的常数。 则有效得分统计量为
为令式(1)中γ = γ0时ai的取值,di为探测信号(detector) 。 将Cuscore 统计量定义为
Q =Σai0*di
当Cuscore 统计量用于监控过程信号时,使用下面的公式监控Cuscore 统计量的正向和负向变化
如果Qt+或Qt-超限,就认为过程失控
金融序列变化率识别
为了在一个股票的价差序列中,为了识别出其中的突变移动,可以运用Cuscore统计量增加的速率来找到突变的
时间节点。
首先,为了量化金融
时间序列的变化率,我们使用
指数加权移动平均(EWMA,Exponentially Weighted Moving-Average),来计算局部的平均值(实际操作中应当平移几个时间单位长度)
在图六中,EWMA一直低估了实际的序列值;这是
移动平均值或者指数加权移动平均值的显著特征,他们的目的不是用来描述持续的趋势。因此,从序列的一开始,Cuscore统计量逐渐变大。Cuscore统计量就是新的
斜率与旧的斜率(直线BC-BD之间的垂直差异)之间的差异,如图六中的p-q所示。以估计的水平来说,从初始
趋势线AB延长到BD产生p-q,会被EWMA产生的p-r取代,这个
偏差值很小。斜率变化后,会降低Cuscore统计量的变化灵敏度。也就是说,延迟平均值的更新,可以恢复Cuscore统计量的灵敏度。如图六中,在Cuscore统计量从p-r增加到p-s,非常接近我们想要的p-q。