混合模型(hybrid model)是几种不同模型组合而成的一种模型。它允许一个项目能沿着最有效的路径发展。也可定义为由固定效应和随机效应(随机误差除外)两部分组成的统计分析模型。如由几个高斯分布混合起来的模型叫
高斯混合模型,几个线性模型混合在一起的模型叫线性混合模型。一般的,被模拟的系统几乎不可能按照一种模式一步一步地进行,会受到很多外界因素的干扰。而混合模型能够适应不同的系统和不同情况的需要而提出一种灵活多样的动态方法。混合模型分为分析、综合、运行和废弃四个阶段,各阶段的重叠为设计员提出了模型选择。
概念
混合模型是一个
统计模型,包含fixed effects和random effects两种效应的混合。
在
统计学中,混合模型是代表一个大群体中存在子群体的概率模型,不要求被观察的数据集认同个人观察属于哪个子群体. 一般,混合模型符合代表大群体观察结果的概率分布的混合分布. 然而,当有关问题的混合分布关系到大群体到其子群体的起源性质时,混合模型常被用来做统计推断,关于小群体的性质,而没有子群体的认同信息。
有些方法实现混合模型的步骤涉及到做子群体认同归属的假设到个人观察结果(或者子群体的权重), 在这种情况下这些步骤可以看着是一类
非监督学习或者聚类过程. 并不是所有的推断过程都会涉及这些步骤。混合模型不应该与组合数据的模型混淆, 比如说 数据的一部分的和被约束到一个常数上。
定义
混合模型被定义为:
(i=1,2,...,N;t=1,2,...,T)
其中:
y(i,t)为北回归变量(标量);
α为截距;
X(i,t)为k*1阶回归变量列向量(包括k个回归量);
β为k*1阶回归系数列向量;
ε(i,t)为误差项(标量).
分类
固定效应模型
应用前提是假定全部研究结果的方向与效应大小基本相同,即各独立研究的结果趋于一致,
一致性检验差异无显著性。因此,
固定效应模型用于各独立研究间无差异,或差异较小的研究。
固定效应模型指实验结果只想比较每一自变量项之特定类目或类别的差异及其与其他自变项之特定类目或类别间交互效果,而不想依此推论到同一自变项未包含在内的其他类目或类别的实验设计。
随机效应模型
随机效应模型是经典的线性模型的一种推广,就是把原来固定的回归系数看作是随机变量,一般都是假设来自正态分布。如果模型里一部分系数是随机的,另外一些是固定的,一般就叫做混合模型。
随机效应有压缩的功能,而且可以使模型的
自由度df变小。这个简单的结果对高维数据分析的发展起到了至关重要的作用。事实上,
随机效应模型就是一个带惩罚项penalty的一个线性模型,引入正态随机效应就等价于增加一个二次惩罚。著名的
岭回归ridge regression就是一个二次惩罚,它的提出解决了当设计
矩阵不满秩时最小二乘估计LSE无法计算的问题,并提高了预测能力。
因此,引入
随机效应或者二次惩罚就可以处理当参数个数p大于观测个数n的情形,这是在分析高维数据时必须面对的问题。当然,二次惩罚还有一些特点,如:计算简便,能选择相关的predictor,对前面的几个主成分压缩程度较小等。
特点
混合模型的特点是:无论对任何个体和界面,
回归系数α和β都相同。如果模型是正确假定的,解释变量与误差项不相关,即cov(X(i,t),ε(i,t))=0,那么无论是N趋于无穷还是T趋于无穷,模型参数的混合最小二乘估计量pooled OLS都是一致估计量。