| 倾向评分配比的概念及其原理 |
|
3.倾向评分配比法
配比.或称匹配,是指选择某些特征上与处理组一致的对照,排除这些因素的混杂作用,从而凸显研究因素的效应。配比是控制混杂偏倚的常用方法。配比又分为频数配比和个体配比。频数配比(frequency matching)又称为成组配比,是指在选择对照时要求对照组某些重要混杂因素的分布与处理组总体一致。比如研究某处理组在人群中的效应时,如果处理组中男性占30%,则选择对照组时,男性也要占30%。个体配比(individualmatching)是以个体为单位进行的匹配,即处理组的每一个个体与对照组一个或几个个体在某些特征(配比变量)上相同。如果1个处理组个体对应1个对照,则为1:1配比,又称配对,这是个体配比研究最常见的形式。如果1个处理对象配2个或2个以上对照,这为1:m,配比,如1:2; 1:3,
1)倾向评分配比的概念
倾向评分配比(propensity score matching, PSM)就是利用倾向评分值从对照组中为处理组每个个体寻找一个或多个背景特征相同或相似的个体作为对照,最终两组的混杂变量也趋于均衡可比,属于一种个体配比的方法。与传统的个体配比方法相比,倾向评分配比的优势是同时匹配许多混杂因素时不增加匹配的难度。传统的分层匹配的方法要根据每个变量取值分层后进行匹配,如果需要平衡的变量个数或水平较多,分层数将成倍增加,往往难以实现。马氏配比是通过计算两个观察对象的马氏距离进行配比,随着配比维数的增加,不但运算量大大增加,而且马氏距离均值也增加,使配比效果下降。而倾向评分配比将所有的协变量综合为一个尺度变量,因此协变量个数增加并不会增加配比的难度。尽管倾向评分配比能够同时平衡较多的变量,但其永远只局限于已知的混杂变量,而许多未知的混杂变量可能仍然会对最终的结果产生影响。因此,其组间均衡性不可能完全达到随机对照研究的均衡性。
2)倾向评分配比的原理
目前利用倾向评分进行配比的具体方法较多,如最邻配比法( nearest neighborhood matching )、马氏矩阵配比法( Mahalanobis metric matching) , Radius配比法(Radiusmatching), Kernel配比法(Kernel matching)和局部线性回归配比法(local linear regression matching)等。一些配比方法(如最邻配比法、马氏矩阵配比法、Radius配比法)需要规定匹配精度以增加配比准确性。本书主要介绍文献中应用较多的最邻配比法和马氏矩阵配比法。
最邻配比法是从对照组中寻找出1个或多个与处理组个体倾向评分值最相近的个体作为配比对象,是倾向评分配比最基本,也是最简单的一种形式。
其具体方法是:首先,根据协变量计算倾向评分值,将处理组观察对象与对照组分开。然后,将两组观察对象按照倾向评分值大小排序,从处理组中依次选出1个研究对象,从对照组中寻找倾向评分值与处理组对象最相近的1个对象作为配比个体。如果对照组中同时有2个或2个以上倾向评分差值相同的个体,则按随机的原则进行选择。配比成功的对象从源人群中移去,然后进人下一个处理对象的配比过程,直到处理组中的对象全部完成匹配。配比时一般应规定配比精度,如倾向评分值相差<0. 01或<0.001。如果研究者希望某个重要变量精确匹配,则可以先根据该变量(如性别)分层后,分别对每层人群进行单纯倾向评分配比,然后将配比人群合并,这样最终的两组研究人群中该变量分布完全相同。这一方法可以确保重要变量精确匹配,但要求精确匹配因素及其因素水平很少,而且样本量足够大。
马氏矩阵配比是通过矩阵计算两个观察对象的马氏距离的一种匹配方法。倾向评分配比与马氏配比结合后可以增加个别重点变量平衡的能力。具体结合方法有两种:一种是把倾向评分值作为一个变量同其他重点平衡的变量一起估讨4马氏距离,然后进行马氏配比;另外一种是首先在一定精度的倾向评分差值范围内选择对照组中全部可以匹配的对象,然后根据少数重点变量计算马氏距离,选择马氏距离最小的对象作为最终的对照。这一方法要求计算马氏距离的变量不能太多,实现过程比较复杂。
3)倾向评分配比对资料的要求
要想合理应用倾向评分配比,研究者必须首先明确所获取的资料是否适合进行倾向评分配比。一般来说,倾向评分配比适合于下列几种情况:
(1)处理因素(或病例)在人群中的比例远低于非处理因素(或对照),这样能保证有足够的对照人群可供选择和配比,对照人群越大,配比效果越好。
(2)需要平衡的因素较多。如在畸形儿基金会(March ofDimes)一项关于过期分娩儿童的研究中,平衡因素加上交互项目多达20个,而且许多变量差异非常显著。
(3)研究的结局变量的调查难度较大或费用较高,选择部分可L匕的观察对象无疑会保证研究的可行性和结果的准确性。
|