逻辑回归应用于预测因变量为二分类变量的情况:这个客户是否会流失?病人是否会康复?Logistic回归是基于线性回归发展来的,适用因变量为二分类变量的情况,主要应用于:1.影响因素的分析 2.结局的预测(等同于回归分析)
1.基本表达式
2.本次分析目的和涉及相关术语
本次分析主要探讨低出生体重儿的影响因素,预测一个婴儿为低体重出生儿的概率
下表是可能影响低出生体重儿出生的因素:
1三个检验
walds检验 考察单一自变量与因变量的关系
似自然比检验 直接比较两个模型的-2倍对数自然值,对比两个模型的最终结果选择是否纳 入相应参数
比分检验 比较纳入前后,对结果的影响程度,(条件)适合与筛选变量
3.spss分析的操作步骤
分析→回归→二元logistic → 选入相关参数
4.结果解读
1 第一个表 简单的汇总统计 没有确实189个案例全部是有效数据
第二个表 由于逻辑回归的结果介于0 和1之间 将结果编码为0和1,p值越大表示越婴儿有可能为低体重出生儿
第三个表是只有常数项时模型预测结果,可以看到只有常数项时,模型的整体正确率为68.8
2 表一 只有常数项时的结果和参数的取值
表二 中分数这一项为比分检验的结果(在原有模型的基础上加入SMOKE,是否会使 得的模型有所改善) 显著性表示这个改善是否有统计学意义,可以看到大部分变量的 改善都是有统计学意义的
表三表示新模型和只有常数项的模型相比较模型的改善情况,也能看到模型的改善程度 越来越大
3.表一 -2倍的对数似自然值 这个数目越小模型的效果越好 cox和nage为为r方检验参考 意义不大 可以看到随着步骤的推进,模型的效果越来越好了。
表二 是模型预测的准确率 ,可以看到模型的整体准确率不断的提高到71.4%
4. 表一 我们用的向前法中的LR根据似自然比(模型整体参数的变化),可以看到模型的参数由一个变量到三个变量 ,和加入变量后变量的取值和显著性还有 比分比数值
表二向前法既增加变量又删减变量,这个表是表示删除变量后自然比的变化 ,删除plt发现模型变化很大,故不可删除
5. 表一 (向前LR)考虑进也考虑出 向后法只出不进;LR似自然比检验比较模型总体参数
向前条件 比分检验用于变量的筛选
表二 表示向前法变量的筛选情况 ,在步骤一种ht 的显著性最高,考虑将ht纳入模型,步 骤二将lwt 变量也纳入模型,后面的变量somke 显著性接近0.1为了保持模型的简单性,没有纳入(具体是否纳入要考虑专业人员的意见)