- 无标题文档
查看论文信息

中文题名:

 含随机转变点的双线性分段潜变量增长模型    

姓名:

 余楚漪    

保密级别:

 公开    

学科代码:

 071201    

学科专业:

 统计学    

学生类型:

 学士    

学位:

 理学学士    

学位年度:

 2016    

学校:

 北京师范大学    

校区:

 北京校区培养    

学院:

 数学科学学院    

第一导师姓名:

 张淑梅    

第一导师单位:

 北京师范大学统计学院    

提交日期:

 2016-05-25    

答辩日期:

 2016-05-16    

外文题名:

 A Linear-Linear Piecewise Latent Growth Model with Unknown Random Change-Points    

中文关键词:

 双线性分段潜变量增长模型 ; 随机变点 ; 蒙特卡洛马氏链模拟    

外文关键词:

 RCP-PLGM ; random change-points ; Metropolis-within-Gibbs sampling for Bayesian inference    

中文摘要:
在心理学等多个领域中,将对发展趋势的研究成为纵向研究。它既能研究总体的发展趋势,也可以检测不同个体的区别。潜变量增长模型(Latent Growth Model, LGM)是一类常被用于纵向数据研究中的模型。LGM中定义了一类潜变量,他们描述了在各时间点上的重复测量所反映出的总体变化趋势[1]。这些潜变量使得LGM可以在总体与个体两种水平上进行分析。 LGM中只存在一段符合某个特定函数形式的发展阶段[1][2]。但是在一些案例中,个体的发展轨迹由多个阶段组成,每个阶段各自服从不同的函数形式。在这种情形下,使用单阶段的LGM估计会存在明显不足。分段潜变量发展模型(Piecewise Latent Growth Model, PLGM)是LGM的一个扩展,它允许在发展轨迹中定义两个、甚至更多的发展阶段。PLGM的模型参数可能在每个发展阶段中有所不同[3]。因此PLGM可以用来探究在发展过程中某一个特质的变化情况,并对每个发展阶段进行拟合。在干预试验中,研究人员可以使用PLGM检测在干预前后被试在该特征的发展上是否存在显著差异,并且研究干预前后的发展分别遵循哪种规律。 在PLGM中,把连接两个阶段的时间点称为转变点[5]。研究者可以根据实际应用中的背景知识与经验事前为转变点赋一个定值,也可以将其作为一个待估参数放入模型中参与估计。但无论是在那种情形下,都是假设所有个体共享一个转变点,就是说转变点不随个体而变化。 但是在一些情形下,不同个体发生转变的时间点是不同的,此时将群体的转变点设置为某一个公共的点并不合适。所以对转变点分布情况的估计是纵向数据研究过程中的重要环节,研究者不仅需要知道群体的公共变点的值,还需要了解每个个体变点的分布情况。本文中将提出一个新模型,解决涉及到此类个体转变点分布的问题。 本文提出了含随机转变点的双线性分段潜变量增长模型(Linear-Linear Piecewise Latent Growth Model, Linear-Linear RCP-PLGM),它可视为一种广义的分段潜变量增长模型。Linear-Linear RCP-PLGM向PLGM中补充了待估计的随机转变点,并假设这些转变点独立同分布于正态分布: 此处 为个体 在时间点 的测量值, 和 分别为第一段的截距与斜率潜变量, 与 分别为第二段的截距与斜率潜变量。 , , , 之间相互相关。 为重复测量时点,并且假设对于每个个体 ,总共的观测时间点个数均为 。 表示第 个个体的转变点。Linear-Linear RCP-PLGM中假设 独立同分布于均值为 ,方差为 的正态分布,即: 从转变点的定义可以看出,Linear-Linear RCP-PLGM更改了以往PLGM中将转变点设为群体统一参数的假设,使其随着个体的不同而变动。这样的设置将研究范围从对群体公共转变点位置研究,扩展为对个体转变点的分布研究,使得研究者对研究对象的总体情况有了更好的把握。 本文选择贝叶斯理论下的蒙特卡洛马氏链算法对模型进行估计,具体选择了Gibbs抽样算法。在确定了Linear-Linear RCP-PLGM中各参数的先验并推导出其满条件分布后,发现转变点的后验条件密度形式十分复杂,导致在Gibb迭代过程中,无法直接对转变点进行抽样: 此时需要利用Metropolis-Hastings算法(M-H算法)实现对转变点的抽取,此种将M-H算法镶嵌入Gibbs抽样算法的综合算法称为Metropolis-within-Gibbs抽样算法[14]。值得一提的是,在每次Gibbs迭代中只需实现M-H算法中的一次扫描,由于此时参数的联合分布仍未所获得马氏链的平稳分布,所以Metropolis-within-Gibbs抽样算法的有效性与Gibbs抽样算法的有效性一致[15]。 在模拟试验中,本文假设变点服从正态分布,模拟了转变点分布由稀疏到密集(变点方差 取值为0.1,0.5,2)、样本量从小到大(取90,300,1000三种情形)共九种组合的双线性发展数据的模拟情形。并以均方误差MSE为指标判断Linear-Linear RCP-PLGM对参数的估计情况。 结果显示Linear-Linear RCP-PLGM在九种情形下的表现都比较好。不过随着变点越来越分散,Linear-Linear RCP-PLGM对各个参数的估计效果会有略微下降。同时随着样本量的增加,估计效果显著提升,但小样本(例如样本量等于90)已经足够为Linear-Linear RCP-PLGM提供一个较好的估计效果。 本文同时比较了在转变点分布由稀疏到密集(变点方差为 取值为0.1,0.5,2)的三种模拟情形下含公共转变点模型Linear-Linear PLGM与含随机转变点模型Linear-Linear RCP-PLGM的估计效果。结果显示在群体转变点分布较为集中(变点方差 取值为0.1)时,两个模型的估计效果没有显著差异,然而随着群体变点越来越分散,原有模型Linear-Linear PLGM的估计效果要显著劣于新模型Linear-Linear RCP-PLGM。这说明虽然随着变点分布分散,Linear-Linear RCP-PLGM的估计效果会略有下降,但是与原有含公共变点的分段潜变量增长模型相比,在个体转变点差异较明显时,本文提出的Linear-Linear RCP-PLGM仍为最好的选择。 最后文章对一组实际的阅读数据进行了实例研究。我们采用ECLS-K (Early Childhood Longitudinal Study-Kindergarten Cohort)提供的儿童阅读能力纵向数据。这组数据涵盖了于1998年进入幼儿园的约两万名美国儿童从幼儿园到八年级的阅读能力。从中提取出样本量大小为2145的完整阅读数据,并计算了含公共转变点模型Linear-Linear PLGM与含随机转变点模型Linear-Linear RCP-PLGM对这组数据的AIC,BIC值。AIC与BIC结果显示Linear-Linear RCP-PLGM对这组数据的拟合结果优于Linear-Linear PLGM。这是由于Linear-Linear RCP-PLGM关注了每个个体的转变点分布,从而实现了对个体轨迹的更好估计。结果显示该研究中儿童阅读能力的转变点集中在二年级上学期,并且从群体中的转变点从一年级下学期到二年级下学期均有分布,不过变点分布相对集中。潜变量均值向量 值估计结果显示从总体上看,阅读能力在第一阶段发展较为迅速,在第二阶段发展变缓。潜变量协方差矩阵 值说明个体在阅读能力初值与第一阶段阅读能力发展速度上差异较为明显,而在第二阶段不同个体阅读速度增长均趋于平缓并且不再有较大差异。根据这些结果,教育者制定更加实际的阅读干预计划,比如在一年级下学期到二年级下学期转变点集中时期持续对儿童阅读能力进行干预,或减轻二年级以后儿童阅读能力的训练强度等等。 关于Linear-Linear RCP-PLGM的研究还可以在其他几个方面进行进一步发展。首先可以假设模型不再服从双线性假设,可以设置不同阶段服从不同函数形式的发展轨迹,例如二次——线性函数形式的发展,或线性——指数形式的发展。其次是可以往Linear-Linear RCP-PLGM中注入其他的协变量,例如性别协变量或组别协变量,使得新模型实现对不同组别中个体的变点分布估计。
外文摘要:
Latent growth models (LGM) can describe the growth trajectory in longitudinal data analysis. The piecewise latent growth model (PLGM), an extension of the LGM, allows the specification of each growth phase to conform to a particular functional form of the overall change process. An interesting feature of PLGM is the time point at which the response function transitions from one phase to another, known as the change-point. The change-point can be settled as a priori or can be estimated, but it is always considered to be a constant for all different individuals. This assumption is not practical in situations where different persons transit at different time points. So in this study, a Linear-Linear Piecewise Latent Growth Model with unknown random change-points (Linear-Linear RCP-PLGM) is proposed. Linear-Linear RCP-PLGM can be viewed as a generalized model of PLGM. It regards It regards change-points of each subject as random variables, and assumes that they are independent and identically distributed to normal distribution. MCMC method for Bayesian inference, specifically a Metropolis-within-Gibbs sampling method, was used to estimate the parameters in RCP-PLGM. Manipulated conditions with different densities of change-points were considered in simulation studies to test the performance of Linear-Linear RCP-PLGM and the comparison between PLGM and RCP-PLGM is given. In addition, Linear-Linear RCP-PLGM was illustrated to analyze a longitudinal study of early childhood reading ability. The results of the empirical data analysis provide the key information of change-point of the childhood reading ability.
参考文献总数:

 0    

插图总数:

 0    

插表总数:

 0    

馆藏号:

 本071601/1623    

开放日期:

 2016-05-25    

无标题文档

   建议浏览器: 谷歌 360请用极速模式,双核浏览器请用极速模式