您现在正在浏览:首页 > 职教文章 > 职教论文 > 基于非参数交叉证实判别分析法建立社区脑膜炎诊断模型

基于非参数交叉证实判别分析法建立社区脑膜炎诊断模型

日期: 2011-6-1 17:50:37 浏览: 0 来源: 学海网收集整理 作者:

          作者:刘娟 崔树起 吕 曼 路孝琴 罗艳侠 贾忠伟 闫宇翔 郭秀花 

【摘要】  目的: 建立适用于社区中脑膜炎与其他中枢神经系统疾病的鉴别诊断模型。方法:采用不等带宽核密度估计的非参数判别分析,对中国典型病例大全近四年内符合纳入标准的161例脑膜炎和161例非脑膜炎患者完整的病例资料进行分析。结果: 经交叉证实法得到脑膜炎组的判别正确率为83.95 %,对照组为71.25 %,总的判断正确率87.64 %。同时对资料进行logistic回归和人工神经网络模型进行分析,并进行与人工神经网络和logistic回归所建立的模型进行比较。结论: 非参数判别分析建立的脑膜炎诊断模型是理想模型。学海网(www.xuehai.net)

【关键词】  非参数判别; 交叉证实; 诊断模型; 脑膜炎

脑膜炎是由病原体引起的中枢神经系统严重的感染性疾病。由于发病原因复杂,诊断难度大,病程凶险且可造成流行,因此,在亚洲一些地区,流行性脑膜炎是15岁以下的孩子死亡的主要原因之一。流行性脑膜炎在流行强度较大的时候会导致3000~10000人死亡[1]。脑膜炎早期的症状不具有特异性,因此在社区医生水平有限的情况下很难得到重视,而大部分的脑膜炎都是急性的,尤其是流行性脑脊髓膜炎,一旦没有及时诊断,对病人的生命和愈后都会造成很大的影响。因此,建立适合于社区的脑膜炎初筛诊断模型对提高社区卫生服务能力是很有意义的。

  1 资料和方法

  1.1 资料来源

  在互联网上系统检索国内信息量最大且有高影响力的《中国期刊全文数据库》(CNKI) 及其新近开发的含有100多万病例的医学数据库《中国典型病例大全》(Medical Case),以医学主题词表中的“脑膜炎”为关键词,以“病例报告、病例分析”为副关键词,检索2005年1月~2009年3月的相关临床病例。

  1.1.1 脑膜炎病人纳入标准 ①数据库中有完整症状、体征和实验室检查记录,及临床诊断明确的脑膜炎病例、病案;②年龄≥3周岁;③首次发病或首次因脑膜炎住院的患者;④发病前无肢体瘫痪或脑与脑神经功能障碍等的患者。

  1.1.2 对照组病人选择标准 ①数据库中有完整症状、体征和实验室检查记录及临床诊断明确,并有治疗记录的其他相关的同期非脑膜炎的中枢神经系统病例、病案;②病人≥3周岁且与脑膜炎病例年龄相近。

  1.1.3 病例排除标准 ①患有严重并发症;②患有严重精神疾病、痴呆者;③交叉重复的病案;④多脏器功能衰竭等严重病人;⑤由其他医院转院过来的病人;⑥医院获得性脑膜炎病人(如因手术感染所致)。

  1.1.4 质量控制 对病例筛选和数据录入进行质量控制:①制定统一标准选择病例;②建立数据库,统一调查项目;③双录入,及时纠错;④注明资料出处,从病例筛选、数据录入、统计分析等各步分别进行核准。

  1.2 研究方法

  1.2.1 数据挖掘 数据挖掘是一个利用各种分析工具在海量数据中发现模型和数据间关系的过程[2]。临床医学上大量的数据中蕴含着丰富的信息。利用数据挖掘技术, 通过数据训练集所训练得到的算法模型能够有效应用于疾病诊断, 并获得很高的准确率。尤其是临床上大量的数据都还为得到挖掘利用,本研究对《中国期刊全文数据库》和《中国典型病例大全》两个数据库中收集回顾近四年符合纳入标准的161例脑膜炎和161例非脑膜炎患者完整的病例资料进行判别分析研究。

  1.2.2 判别分析 判别分析是根据已得到的一批分类明确的样品,建立较好的判别函数,使产生错判的事例最少,进而对给定的一个新样品,判断它来自哪个总体。判别分析近年来在自然科学、社会学及经济管理学科中都有广泛的应用。在医学上也已逐步用于疾病的诊断。本研究采用不等带宽核密度估计的非参数逐步判别分析。下面介绍不等带宽核密度估计的非参数判别分析的主要步骤:

  首先建立判别对象x 与j 类中判别对象Y间的平方距离函数:

  D2(X,Y)=(X-Y)COV-1j(X-Y)

  (X-Y) :对象X与j 类中对象Y的各相同指标差值向量;COV-1j(X-Y) :对象X与j 类中各对象Y的各相同指标差值的协方差矩阵之逆矩阵。

  其次求出判别函数:

  F(X / j)=n-1jSUiMexp(-5D2(X,Yji/ |R2)

  D2(X,Yji) :对象 X与j 类中第i 个对象Yji 间的平方距离;R2 :各指标分别与分类变量间相关系数的平方之均值。

  然后计算后验概率:

  Pr(j / j)=PRIOPjF(X| j) / SUkMPRIORkF(X|k)

  PRIORk 为k 类的先验概率。

  最后将判别对象判入后验概率大的类别中[3]。

  1.2.3 统计学方法 应用SAS9.0软件编程建立非参数判别分析模型,对322例病例组和对照组资料进行判别归类,最后采用交叉验证法来验证判别函数的功效。

学海网(www.xuehai.net)

  2 结果

  2.1 变量赋值和单因素结果

  单因素分析与判别指标的选择,首先选取以下症状或体征作为自变量进行数据录入和单因素分析。表1 判别分析引入变量赋值表

  分类变量(病案中明确检查诊断为依据) g :g = 1 (脑膜炎) 、g= 0(非脑膜炎) 。对上述症状体征采用单因素卡方检验进行比较,在脑膜炎患者中,多数病人具有发热、头痛、脑膜刺激征,在病例组中发生频率均比对照组高,差异有统计学意义(P<0.05),在161例病人中有127例(78.88%)有发热;124例(77.02%)有头痛;118例(73.29%)有脑膜刺激征。而对照组的161例病人中发热的病人有49例(30.43%);90例(55.90%)有头痛;43例(26.09%)有脑膜刺激征。因此采用发热、头痛和脑膜刺激征作为自变量建立判别函数。

  2.2 判别分析中训练集和测试集的选择

  训练样本为322例数据中按年龄排序,然后每间隔一例取一例为训练样本,病例组中81例,对照组中80例共161例数据。测试样本为:322例数据中除去161例训练样本剩余的161例数据,其中病例组80例,对照组81例。

  2.3 交叉证实结果

  2.3.1 本研究采用不等带宽核密度估计的非参数判别分析,对训练样本进行判别分析,采用交叉证实法(Cross validation)来检验判别函数所建立的模型的判别效果,可以得到诊断模型的灵敏度为65.4%,特异度为76.3%,阳性预测值为73.6%,阴性预测值为68.5%,调整一致性为71.0%。判别结果见表2。表2 判别分析模型诊断模型脑膜炎训练样本

  2.3.2 应用判别结果 用根据训练样本所建立的判别函数对剩下的161例测试集进行判别分析,得出测试样本的灵敏度为71.3%,特异度为84.0%,阳性预测值是81.4%,阴性预测值是74.7%,调整一致性为77.9%。得到判别结果见表3。表3 判别分析模型诊断脑膜炎测试样本与金标准比较

  3 讨论

  国外已有的辅助医生进行快速筛检的脑膜炎诊断三联征有:澳大利亚的“发热、呕吐、头痛”[4];而国际上更多用的是“发热、颈强直、意识状态改变”[5]。本研究将发热、头痛及脑膜刺激征作为诊断脑膜炎的三联征,并用非参数判别的方法建立判别函数来检测“发热、头痛和脑膜刺激征”作为脑膜炎诊断三联征的效果,得出此诊断模型的灵敏度是71.3%,特异度是84.0%,阳性预测值是81.4%,阴性预测值是74.7%;与金标准的诊断符合率为77.9%,说明该三联征的诊断效果已比较理想。但实际效力如何还有待于临床实践的检验。

  非参数判别分析方法的应用并不多见,但是对于自变量主要为二分类的资料,作者认为应选用非参数的判别分析,本研究采用不等带宽核密度估计的非参数判别分析,对训练样本判别对象,采用交叉证实法(Cross validation)来检验判别效果:在161测试样本中,80 例脑膜炎病人有68例判为脑膜炎,13 例错判为非脑膜炎,判别正确率为83.95 %;81 例非脑膜炎病人有57例判断为非脑膜炎,有23 例错判为脑膜炎,判别正确率为71.25 %;总判别正确率=87.64 %,判别效果良好。

  以上研究结果表明,基于网络数据库的资料进行三联征的研究是可行的,应深入进行有关的研究工作。然而,用网络数据库中的资料进行研究也有一定的缺点,例如在病历报告或病例分析中的症状、体征常不描述,或虽已描述但不完整,且易受作者主观取舍的影响。另外由于发表在中国典型病例大全上的脑膜炎病例数量有限,在以后研究的过程中应尽量增大样本量来减小偏倚。

【参考文献】
    1 R′emy Teyssou , Erwan Muros??Le Rouzic. Meningitis epidemics in Africa: A brief overview. Vaccine2007,25: A3~A7.

  2 David Martens, Liesbeth Bruynseels, Bart Baesens. Predicting going concern opinion with data mining. Decision Support Systems, 2008, 45: 765~777.

  3 高歌, 王艾丽, 曹晓韵. 非参数逐步判别分析在脑中风分类诊断中的应用.数理统计与管理, 2004, 23(5): 48~51.

  4 John Murtagh. A safe diagnostic strategy. John Murtagh''s General practice (4th ed). McGraw??Hill Education Australia & New Zealand, 2007.

  5 Diederik van de Beek, Jan de Gans, Lodewijk Spanjaard,et al. Clinical features and prognostic factors in adults with bacterial meningitis. N Engl J Med, 2004, 351: 1849~59.

学海网(www.xuehai.net)

返回顶部