化验结果诊断模型问题重述与分析,共13页。
人们到医院就诊时,通常要化验一些指标来协助医生的诊断。本题给出了人们是否患某种疾病时通常要化验的几种指标以及其检验值。表1是确诊病例的化验结果,其中1-30号病例是已经确诊为患该种疾病的化验结果;31-60号病例是已经确诊为健康人的结果。表2是某些就诊人员的化验结果,但未确诊其是否患有该种疾病。根据已知数据,需要解答如下问题:
1) 问题:根据表1中的数据,提出一种简便的判别方法,判别属于患者或健康人的方法,并检验你提出方法的正确性。
分析:
根据表1当中60个化验结果,将Zn、Cu、Fe、Ca、Mg、K、Na看成是七个指标,则前30个为该疾病患者的指标值,后30个为健康人的指标值, 可以将这些数据进行标准化处理,再采用主成分分析方法,将多个指标转化为几个综合指标,当给定一个患者的各指标值时,可以算出各综合指标的得分,当这些得分满足一定条件时,如根据正负值可以判定为健康或疾病。
2) 问题:按照(1)提出的方法,对表2中的15名就诊人员的化验结果进行判别,判定他们是患该种疾病的病人还是健康人。
分析:
由(1)中已有的综合指标,根据给定的15名就诊人员的指标值计算出综合指标的得分,以此判断他们的健康状况。
3) 问题:能否根据表1的数据特征,确定哪些指标是影响人们患该疾病的关键或主要因素,以便减少化验的指标。并根据你给出的结果,重复2的工作。
分析:
为了确定哪些指标是影响该疾病的主要因素,则需要确定出哪些因素在判别中起的权重最大,可以考虑采取回归模型,通过去除一些变量,然后比较各组的显著性与正确率,正确率最高的那组中的变量即为影响该疾病的主要因素。