您现在正在浏览:首页 > 职教文章 > 职教论文 > 多水平模型及其对肝癌患者住院费用影响因素的分析

多水平模型及其对肝癌患者住院费用影响因素的分析

日期: 2011-6-1 15:15:41 浏览: 0 来源: 学海网收集整理 作者:

                  作者:骆华萍 郜艳晖 张丕德 

【摘要】  目的:探讨多水平模型及其在肝癌患者住院费用影响因素中的应用。方法:选取广州市某三甲医院2003~2008年的肝癌住院患者1659例为研究对象,以肝癌患者为第一水平,医院科室为第二水平,拟合两水平模型进行住院费用的影响因素分析。结果:该数据在医院科室间存在聚集性,应用多水平模型后得到抢救情况、手术情况、住院天数为肝癌患者住院费用的影响因素。其中手术情况和住院天数为随机效应,其他变量为固定效应。讨论:多水平模型适用于层次结构数据,具有众多优点。学海网(www.xuehai.net)从医院科室角度来控制肝癌患者的住院费用更有效。

【关键词】  多水平模型; 肝癌; 住院费用; 影响因素

在日常研究中,资料往往呈多水平结构,如学生镶嵌于班级,班级镶嵌于学校,形成了一个多水平的结构,学生为第一水平,班级为第二水平,学校为第三水平。传统的回归分析和方差分析都是假设观察值之间是相互独立、方差齐性及正态分布,而多水平结构的资料常存在组内相关的问题,即同一水平的组内个体会存在一定的相近或相似的特征,另外由于组单位有不同的背景和环境,变异性较大,故很难满足方差齐性的要求,此时用传统的统计方法不再适合,须用多水平模型来分析。多水平模型(multilevel midel) 又叫分层模型(hierarchical model),允许观测值间相关和方差不齐性,可以同时测量个体水平变异和组水平变异,用于具有层次结构或嵌套式结构的数据[1],此外,对于过度离散的二分类资料、纵向资料、重复测量资料也可以进行分析处理[2]。多水平模型在80年代初期提出以来,已经引起来广泛的关注,现在在教育学、心理学、医学、社会学等领域有了一定的发展和应用。

  肝癌是我国常见的肿瘤,近年来其发病率呈上升的趋势。肝癌的恶性程度高,生存期短,5年存活率低,与其他疾病相比,肝癌患者的住院费用往往是偏高的。研究肝癌住院费用的影响因素,可为控制高昂的住院费用提供一定的理论依据和参考。但是由于医院里同一科室的功能(如ICU收治重病病人)与设备(如医生和医疗器械)等都是相同的,肝癌患者的病情、诊疗、护理也会存在着相似性,所以其住院费用会存在着聚集性。本研究考虑了医院同一科室个体间不独立的特性,采用多水平模型来分析处理数据。

  1 方法原理

  以下以两水平模型为例。两水平模型的层次结构中第一水平表示个体单位,第二水平表示组单位,见图1。

  图1 两水平模型层次结构图

  拟合两水平模型一般分为3个步骤:第1步为拟合空模型,第2步将第二水平的解释 变量纳入空模型,第3步将第一水平的解释变量纳入第一水平模型。

  空模型是仅包含截距项的模型。运行该模型可知道组内相关系数(Intra??Class Correlation Coefficent,ICC),从而知道是否存在组内相关性。其公式为:

  ICC=σ2μ0σ2μ0+σ2ε

  其中,σ2μ0 为组内方差,代表个体间的变异程度,σ2ε 为组间方差,代表组间的变异程度。ICC的值在0~1之间,当ICC趋于1时,说明组间的变异程度相对于组内来说很大,资料的层次结构明显,需要应用多水平模型来处理,当ICC趋于0时,说明组内各个个体趋于相互独立,没有组内聚集性,这时多水平模型就可以简化成一般的回归模型。

  两水平模型其第一水平的模型形式为:

  Yij=αj+βjxij+εij (1)

  εij~N(0,σ2ij)

  j为组单位数,j=1,2,3,…k;i为个体单位数,i=1,2,3,…,n;yij 为第j组的第i个个体的结局变量;αj 为截矩项,表示第j组结局变量的总平均水平;xij 为第二水平的解释变量;βj 表示xij 的偏回归系数;εij 为总残差项,表示第一水平组内的变异。

  第二水平模型是将(1)式的偏回归系数(αj、βj )定义为wj 的线性函数:

  αj=γ00+γ01wj+μ0j (2)

  βj=γ10+γ11wj+μ1j (3)

  μ0j~N(0,σ20j) μ1j~N(0,σ21j)

  γ00 表示为第j组第二水平的平均水平,γ10 表示βj 的平均值水平,γ01 、γ11 分别为 wj的偏回归系数,wj 为第二水平的解释变量。第二水平模型可有多个解释变量,各个第二水平模型的解释变量可以不同,μ0j 、μ1j 分别为第二水平模型(2)(3)的残差项,表示第二水平组间的变异。其中 COV(εij, μ0j)=0,COV(εij, μ1j)=0 ,COV(μ0j, μ1j)=σ2μ01 ,表示观测值在组间是相互独立的,但是在个体间可能存在相关。

  将(2)、(3)式带入(1)式,得到:

  yij=γ00+γ01wj+γ10xij+γ11wjxij+μ0j+μ1jxij+εij (4)

  其中γ00+γ01wj+γ10xij+γ11wjxij 为固定效应,μ0j+μ1jxij+εij 为随机效应。如果只有截距项有随机效应而所有解释变量都为固定效应,则称为方差成分模型。

  以上为基本的两水平模型形式,该模型也可以将解释变量表示为随机效应部分和固定效应部分,第一水平模型为:

  yij=αj+τxij+βjzij+εij (5)

  τ为第一水平的固定斜率,即解释变量xij 对结局变量yij 的影响是不随着第二水平的变化而变化的。 βj为第一水平的随机斜率,表示解释变量zij 对结局变量yij 的影响是随着第二水平的变化而变化的。

  这里第二水平模型与(2)、(3)式相同。将(2)、(3)代入(5)式,得到:

  yij=γ00+γ01wj+τxij+γ10zij+γ11wjzij+μ0j+μ1jzij+εij (6)

  分步骤建立多水平模型有助于我们理解多水平模型,但是在实际及软件应用中一般是同时进行多水平模型的个体水平和组水平的参数估计过程。

  本研究使用EXCEL2003整理数据,SAS9.1.3进行数据处理。两水平模型使用SAS的MIXED过程进行拟合。多水平模型的参数估计方法有很多,较常用的有最大似然估计法(maxinmum likelihood,ML)和限制最大似然估计法(restricted maximum likelihood,REML),两者不同之处为以不同的残差项为基础,ML以残差项 为基础,而REML以 为基础[3]。本研究采用REML方法来估计参数。

  2 资料来源

  资料来源于广州市某三甲医院信息系统(“广东省统计病案管理系统”)的病历资料,本研究采用ICD??10编码,选取编码为C22.001(原发性肝癌)的病例,收集该医院2003~2008年的住院患者共1659例(男1440例,女219例)。主要摘录患者的一般情况(病案号,性别,年龄,婚姻状况),入院情况,疗效,付款方式,抢救情况,手术情况,住院天数,住院费用(总费用)等。

  本研究根据医院科室功能和患者例数情况,归纳为21个科室。住院费用、住院天数都是非正态分布的资料,经对数变换后进行分析。肝癌患者的平均年龄为52岁,为了使模型截距有意义,对年龄进行总体均数中心化,即将年龄减去总体均数。X表示第一水平解释变量,W表示第二水平解释变量。本研究中用到的变量定义及赋值情况见表1。表1 变量定义及赋值情况注:*手术科室和抢救科室包括外科和重症监护科等科室,非手术非抢救科室包括内科、中医科等科室。

学海网(www.xuehai.net)

  3 结果与分析

  本研究将以医院科室为第二水平,肝癌患者个体为第一水平,拟合住院费用影响因素的两水平模型。

  3.1 拟合空模型

  从表2可知截距项的方差(σ2μ0 =0.0504)和残差的方差(σ2τ =0.1962),P值皆小于0.05,有统计学意义。得到组内相关系数ICC=0.05595/(0.05595+0.1937)=0.22411,表明在结局变量中约有22.41%的变异是由医院科室的不同而起的。这说明该医院各个科室间的肝癌住院费用确实存在着差异,同一科室的肝癌患者住院费用有相似性。因此,该数据须用多水平模型。表2 肝癌患者住院费用空模型参数方差估计结果

  3.2 空模型纳入第二水平解释变量

  空模型中引入科室分区变量。结果显示截距项、科室分区和总残差方差均有统计学意义(P<0.05),说明科室功能的不同会在一定程度上造成医院科室间住院费用的差异,见表3。表3 肝癌患者住院费用第二水平模型参数估计结果注:* 固定效应部分的统计量值为t值,随机效应部分为z值。以下相同。

  3.3 第一水平模型纳入第一水平解释变量

  第一水平模型引入性别、年龄、婚姻状况、入院情况等变量。结果显示抢救情况、手术情况、住院天数有统计学意义(P<0.05),而性别、年龄、婚姻状况、入院情况、疗效、付款方式等皆无统计学意义,说明在同一科室的肝癌患者的住院费用主要受抢救情况、手术情况、住院天数的影响。LR检验有统计学意义(χ2=2036-249=1778 ,v=13-3=10,P<0.001),说明模型拟合良好,见表4。表4 肝癌患者住院费用固定效应和随机效应参数估计结果

  3.4 考虑随机效应解释变量的多水平模型

  以上是把第一水平的解释变量全部假设为固定效应变量,即认为解释变量对结局变量的效应在组间是无差异的,但是在实际中有些解释变量对结局变量的影响是会随着组单位的不同而变化的,即还需要确定第一水平解释变量是否有随机效应。结果显示手术情况(X8)、住院天数(X9)为随机效应,并且各随机效应之间无相关关系,见表5。可将手术情况与住院天数纳入第二水平模型,多水平模型的随机效应部分变为(μ0j+μ8jX8ij+μ9jX9ij+εij )。表5 肝癌患者住院费用随机效应的方差/协方差

  4 讨论

  本研究结果显示肝癌患者的住院费用在该医院科室间确实存在聚集性,即同一科室的住院费用较相近,不同科室间的住院费用差异较大。重症监护科和外科科室人均住院费用较高(分别为65458元、34839元),内科科室较低(15537元)。这说明具有手术、抢救、特护功能的医院科室,由于其所购置的医疗设备较完善先进,医护人员的水平相对较高,患者也有较多的治疗和检查的项目,故住院费用会相对增高。换言之,随着医院科室功能、医疗设备、医护人员和床位的不同,各个科室间肝癌患者的住院费用是有所不同的。因此,在医院科室的层次结构上来分析肝癌患者住院费用的影响因素,更准确,更有现实意义。

  通过多水平模型分析得到肝癌患者住院费用的影响因素有抢救情况、手术情况、住院天数,这与其他研究的结果[4~6]略有不同。其中住院费用常见的影响因素付款方式在本研究影作用不明显,原因可能为该医院患者的付费方式中为其它项的占52%,这表示患者的付费方式并非为单一的,多数为几种付费方式混合,故在本研究中未显出有意义的结果。住院天数越长,药费、床位费和护理费等也会相对的增加,总的住院费用自然会越高。有抢救和手术情况时,由于医疗耗材较多,且会伴随着输血、输氧和心电监护等较昂贵的治疗和护理方法,故住院费用自然也会增高。因此,在保持肝癌患者的治疗质量的前提下,缩短其住院时间、减少抢救和手术的医疗耗材和非必要的特殊治疗和护理,是降低肝癌患者住院费用的重要措施。当然,住院费用还受医疗服务机构的级别、诊疗技术、设备和当地医疗保险政策等因素的影响,肝癌患者肿瘤的大小、病情轻重、转移程度等不同也会造成住院费用的不同。这些本研究都没有探讨,今后还需要进一步分析研究。

  多水平模型是在固定效应模型和随机效应模型等方差成分分析上发展起来的[7],同时还充分考虑了层次结构数据的信息,具有很多的优点。第一,允许观察单位之间不独立和方差不齐,从而可以修正一般回归分析引起的参数标准误估计偏倚的问题。第二,可将解释变量和随机误差分解到个体水平和组水平上,从而可以研究结局变量在组内和组间的变异情况。第三,可同时考虑随机效应和固定效应。第四,可分析稀少数据和缺失数据。对于稀少数据,可利用收缩估计(shrinkage estimation)方法或bootstrap多层模型来分析处理,此外,多水平模型的参数估计方法(如ML法)也可以处理随机缺失数据。第五,可应用于纵向数据、重复测量数据和文献综述。纵向数据和重复测量数据可以测量结局变量随时间发展而产生的个体间和个体内的变异;文献综述是将各个文献作为组单位来研究,从而可以探讨造成各个研究结果异同的影响因素。当然,多水平模型由于模型较复杂,模型参数多,不够简约等,故也有一定的局限性。

  现今的多水平模型不单止在理论上有所发展,其软件应用也日渐多元化。现在的多水平模型软件有专用软件MLWIN、HLM、VARCL等,非专业软件SAS、SPSS等。SAS软件有灵活和功能相对完善的应用模块,对于连续和离散型结局变量模型、纵向模型和特殊的数据比如有大量零值的数据都可以处理,所以是分析处理多水平模型的有力工具。多水平模型是20世纪统计分析方法的一大飞跃性发展,其理论和系统日渐成熟,今后必将推动多元统计方法的快速发展。

【参考文献】
   1 吴晓云,曾庆,周燕荣.多水平模型的最新进展.数理医药学杂志,2003,16(2):152~154.

  2 王艳梅,王洁贞,丁守銮等.多水平模型在纵向研究资料中的应用.山东大学学报(医学版),2007,45(3):658~661.

  3 王济川,主编.多层统计分析模型——方法与应用.北京:高等教育出版社,2008,28.

  4 周丽,刘启贵,宋桂荣,等. 肝肿癌病人住院费用分析.中国医院统计,2001,8(2):101~102.

  5 张义华,王增珍. 恶性肿瘤患者年住院费用研究.中国卫生经济,2006,25(12):72~73.

  6 黄少敏,李玲,郑锴,等.综合医院住院费用的影响因素分析:医院案例分析?经济科学,2006,5:120~128.

  7 何岳娟,多水平分析的产生与发展.国外医学卫生学分册,1998,28(6):368~372.

学海网(www.xuehai.net)

返回顶部