血型配对表图 学习统计学第八天——Logistic回归

时间:2023-08-17 作者:免费算命网 来源:网络收集

逻辑回归

Logistic回归建模的目的是发现可能的风险因素并比较多个因素对结果的影响。 线性回归更注重变量之间的定量依赖性,以进行预测和控制。

1.二项Logistic回归

二项Logistic回归的因变量是二分类变量,自变量可以是任何形式的数据。 二项式Logistic回归是Logistic回归的基础。 掌握二项式Logistic回归就可以基本理解有序Logistic回归和多项式Lo​​gistic回归,并且二项式Logistic回归应用广泛。

优势比(Odds Ratio,OR):它可以用作相对风险的估计。

研究某种疾病的复发情况,收集患者的疾病严重程度、治疗方法、年龄和血型,有助于探索疾病复发的危险因素。

分析思路:先进行单因素分析,选择有意义的自变量,然后进行多因素分析。 同时,为防止单因素分析中剔除一些有意义的自变量,将单因素分析中的检验水平设置为P。

本病例研究的因变量为疾病复发(0:未复发,1:复发),影响因素包括疾病严重程度(0:不严重,1:严重),治疗方法(0:传统治疗,1:新治疗)治疗)、年龄(岁)、血型(1:A型、2:B型、3:O型、4:AB型)。

注意,线性回归X回归系数的含义是X每单位变化Y的平均变化,Logistic回归系数的含义是X每单位变化LogitP的平均变化,没有专业实用性意义。

上述变量中​​,血型是一个无序的多类别数据。 血型变量设置1、2、3、4只是血型代码,它们是相等的。 建立模型时,不能用1、2、3、4代入模型。 您应该设置虚拟变量。

虚拟变量个数=类别个数-1。血型有4个类别,所以设置3个虚拟变量可以代表4个血型。

以下是以A型血为对照构建的三个虚拟变量D1、D2和D3。 三个虚拟变量的不同组合对应不同的血型。 虚拟变量设置:D1=0、D2=0、D3=0,表示A型; D1=1、D2=0、D3=0,表示B型; D1=0、D2=1、D3=0,表示AB型; D1=0、D2=0、D3=1,表示O型。

分析结果中,每个指标变量都有一个估计系数,β1、β2、β3分别代表B型血、AB型血、O型血的人与A型血的人相比,患白血病的优势比。 数字 ln (OR)。 相应地,有3个OR值:OR1表示B型血的人患白血病的风险是A型血的人的OR1倍; OR2是指AB型血的人患白血病的风险是A型血的人的两倍; OR3 是指O型血的人患白血病的风险是A型血的人的OR3倍。

Logistic回归系数β的显着性:β与优势比OR密切相关,也与暴露因子x的量化方法(如服用雌激素)密切相关:

(1) 当x为二水平时,设暴露时x = 1,未暴露时x = 0,ln(OR) = logitP1-logitP0=(a+ β*1)-(a+ β*0) = β。 ln(或)=β

(2) 当x为水平变量时,按水平顺序取1、2、...,一般以最小或最大水平作为参考组,OR表示x增加时的优势比一级。

(3)当x为连续变量(如年龄)时,OR表示x增加1个单位(如1岁)时的优势比; x 还可以在分析之前进行分级(例如分为几个年龄组)。

(4)当x为多类别变量时,如研究血型与白血病的关系时,血型变量有4类,分别用1、2、3、4表示,但由于每一类是独立的,没有等级差异,因此分析时需要将x转化为三个虚拟变量或指示变量(x1,x2,x3)。

步:

1.首先做复发与疾病严重程度的相关性分析。 分析—回归—二元Logistic,如图17-1所示,将发病率(Y)放入因变量中,将疾病严重程度(X)放入自变量框中,点击“确定”运行。

血型配对表图 学习统计学第八天——Logistic回归

由于单变量分析是变量筛选,只看主要结果,如图17-2所示,发现疾病严重程度的Wald检验,P=0.035

2、继续一一筛选治疗方法(0:传统治疗,1:新治疗)、年龄(岁),步骤同上。 因为血型(1:A型,2:B型,3:O型,4:AB型)分类顺序乱了,所以情况有所不同。 在上述基础上,在“虚拟变量设置”中增加“分类”设置步骤。

结果:本例4个单因素均显着,可进入多因素分析模型。

血型配对表图 学习统计学第八天——Logistic回归

注:虚拟变量中,若有一个具有统计显着性,则所有虚拟变量都必须进入模型血型配对表图,称为虚拟变量同入同出原则。

3、多变量分析:多变量分析:分析—回归—二项式Logistic回归,首先如图17-6所示进行操作,将“分类”设置中的虚拟变量设置框中的X4放入,以最后一个为参考。 如果想设置为引用第一个,修改即可。

保存设置血型配对表图,如图17-7所示,勾选“概率”和“组成员”,这一步可以保存每个病例的预测概率以及预测发病和不发病的结果。 选项设置,勾选“EXP(B)可信区间”,即OR值的95%可信区间。

血型配对表图 学习统计学第八天——Logistic回归

血型配对表图 学习统计学第八天——Logistic回归

4.

血型配对表图 学习统计学第八天——Logistic回归

上图是分类代码,它告诉我们如何设置虚拟变量,因为我们设置了最后一张作为比较,所以我们选择O型血作为参考。

血型配对表图 学习统计学第八天——Logistic回归

上图为模型测试结果及分类表,图(A)为综合测试,P

血型配对表图 学习统计学第八天——Logistic回归

最终的模型如上图所示,可以看出四个变量均具有统计显着性。

Logistic回归方程意义不大。 更重要的是随后的EXP(B)及其95%可信区间,它显示了自变量对因变量的风险。 例如OR(病情程度)=3.864,95%置信区间为1.176-12.691,也就是说重症复发风险是轻症复发风险的3.864倍,95%置信区间为1.176-12.691倍。

2.序数Logistic回归

二项式 Logistic 回归是因变量为二元 (0-1) 变量时的 Logistic 回归。 当研究的因变量为分级数据(序数数据)时,如果治疗结果为无效、好转、痊愈,则病情有轻、中、重三个级别,此类数据需要使用有序逻辑回归模型。

一名研究人员研究性别和两种治疗方法对某种疾病疗效的影响。 疗效分为3个等级,具体分配如下: 性别:男=0,女=1; 新疗法=1,旧疗法=0; 疗效:1=显着,2=有效,3=无效。 尝试分析一下。

研究的因变量为分级数据(疗效:1=显效,2=有效,3=无效),两个自变量为二元数据(性别:男=0,女=1;新疗法=1, oldtherapy=0;),初步符合有序Logistic回归,注意分析中的并行性测试,并行性测试的目的是验证自变量的不同取值对因变量,如果不同,则认为不能进行有序Logistic回归。

血型配对表图 学习统计学第八天——Logistic回归

上图展示了案例处理总结和模型拟合信息。 图(A)告诉我们因变量的三个水平的分布。 图(B)当方程只包含截距时,-2对数似然比为48.354,最终模型为25.487,-2对数似然比越小越好,表明模型拟合后拟合效果更好添加自变量项,最终模型卡方检验P=0.000

血型配对表图 学习统计学第八天——Logistic回归

上图显示了拟合优度检验和伪 R 方。 图(A)本例中,两次拟合优度检验P值均大于0.05,效果不佳。 不过,这两种方法都有各自的缺陷,并且没有似然比卡方是准确的。 图(B)伪R平方,类似于线性回归的R2。

血型配对表图 学习统计学第八天——Logistic回归

血型配对表图 学习统计学第八天——Logistic回归

上图显示了参数估计和平行线检查的结果。 根据结果​​,可以得到两个方程。 两个方程的常数项不同,系数一致。 系数的解释与前述Logistic回归相同。 但需要注意的是,二项式Logistic回归可以直接得到EXP(B),即OR和95%置信区间。 Ordinal Logistic软件没有这个选项,OR值需要手动或者软件计算。 平行线检验,卡方=0.674,P=0.714>0.05,符合平行线假设,本例可以使用有序Logistic回归。 如果不是,则需要将疗效水平视为多重无序分类,即下一节的多重Logistic回归。

3.多元逻辑回归

当因变量为连续变量时,可采用线性回归来求关系; 当因变量是分类变量的二元分类时,可以使用二项式Logsitic来查找关系; 当因变量为分级数据时,可以使用有序Logistic回归来查找关系; 当因变量为分类变量中的多项无序分类时,可以使用本节中的多项Logistic回归。 在二项Logistic回归的基础上,多项Logistic回归的基本思想是选择无序分类中的一个作为控制,形成多个二项Logistic。

案例:研究者随机选取了三个不同年级,研究不同性别对学生学习方式偏好的影响。

这个例子有两个自变量,年级和性别; 一个因变量:学习风格。 其中,年级变量有3个级别(1、2、3),性别有2个级别(1:男,2:女),学习方式变量有3个级别(1:自学,2:小组) ,3:class),这3个级别是无序分类。 要求列出主要模型拟合结果; 列出主要参数估计结果,并给出合理解释。

当不考虑因素之间的相互作用,只考虑主效应时,选择主效应模型。 如果考虑因素之间的交互作用,则选择全因子模型; 当因素较多且采用逐步回归时,可以选择自定义步进。 本例选择主效应模型。

血型配对表图 学习统计学第八天——Logistic回归

上图显示了案例摘要和模型拟合信息。 图(A)显示了因变量案例的数量及其构成比。 图(B)显示似然比检验。 卡方=25.732,P=0.000

血型配对表图 学习统计学第八天——Logistic回归

上图是伪R平方和似然比检验:图(A)是伪R平方,三个伪R平方的值都比较小,伪R2取0到1之间的值,而越接近1,模型的预测效果越好。 图(B)显示了模型系数检验的结果。 发现截距项无意义,年级和性别两个自变量有统计学意义,P=0.029和P=0.000。

血型配对表图 学习统计学第八天——Logistic回归

参数估计,如上图所示,从结果可以得到2个方程。

Logit(P自学/班级)=0.220+0.381×年级-0.909×性别

Logit(P组/班级)=0.055+0.238×年级-0.806×性别

Logistic回归方程实际意义不大,OR值的解释更重要。 以方程自学为例,发现每升一级,选择自学的风险比上课高1.463倍。 选择自学的风险是男生的0.403倍,这意味着女生更喜欢学习而不是自学。

4.条件逻辑回归

在设计阶段,为了控制潜在混杂因素的干扰,提高比值比的估计精度,对于每个符合入组条件的病例,根据匹配因素找出一个或多个非病例作为对照(即混杂因素),然后对病例和对照的既往暴露史进行分析。 正如我们了解了配对设计的四表数据的配对t检验和卡方检验一样,如果使用配对(或匹配)设计来研究多个因素对因变量的影响这两类,可以用条件Logistic回归来分析。 条件逻辑回归模型表示为:logit P = β1×x1+ β2×x2+…+ βm×xm。

条件Logistic回归对于探索危险因素更有效,但它不适合疾病预测,因为匹配的数据不再是来自现场的真实数据。

一些研究人员采用1:1匹配的方式来研究感冒、流感疫苗接种和吸烟之间的关系。 变量赋值有感冒(0:不感冒,1:感冒),吸烟(0:不吸烟,1:吸烟),疫苗接种(0:接种疫苗,1:未接种疫苗)。

在这个例子中血型配对表图,使用了1:1匹配,因变量是你是否感冒,自变量是吸烟和流感疫苗接种。 条件Logistic在SPSS中的实现比较复杂,但是通过COX回归实现比较简单。 本例中使用COX回归来实现。 COX回归实现条件Logistic回归的格式必须参考下图(条件Logistic回归COX实现的数据格式),其中添加了box部分,是一对,其中一个是cold case,另一个是a控制。 最后需要添加一个虚拟时间变量,control的时间为2,case的时间为1。

血型配对表图 学习统计学第八天——Logistic回归

本例使用COX回归方法来实现条件Logistic回归,因此只看主要结果。 如下图所示,本例中吸烟与感冒没有关系,P=0.068,接种疫苗与感冒有关系,P=0.012,EXP(B)即OR=2.858,即数未接种流感疫苗的人感染流感的风险是接种流感疫苗的人的 2.858 倍。

血型配对表图 学习统计学第八天——Logistic回归

概括

1.Logsitic的具体类型,二项式Logistic回归、有序Logistic回归、多元Logsitic回归和条件Logistic回归,其中最重要的是二项式Logistic回归。 一是因为它最常用,二是因为它是理解后续Logistic回归的基础。 有序Logistic回归和多项式Lo​​gsitic回归实际上都分为多个二项式Logistic回归,但有序Logistic回归是一种累积分割方法【以职称为例,高级/非高级,(高级+中级)/初级】,而多项式Lo​​gistic回归Logsitic回归直接就是多对一的分割方法【以血型为例,A/O、B/O、AB/O】。

2.对于线性回归,我们更关注回归方程,以获得变量之间的定量依赖关系。 对于Logistic回归,我们更注重发现风险因素,并根据OR值进行判断。

3、目前Logistic回归建模理论上也是从单因素开始,在发现有意义变量的基础上再进行多因素分析。 同时,当研究中的自变量数量不是很多时,可以直接将多个自变量放入模型中进行检验,无需经过单变量检验和筛选的步骤。

4.条件Logistic回归对于探索危险因素更有效,但它不适合疾病预测血型配对表图 学习统计学第八天——Logistic回归,因为匹配的数据不再是来自现场的真实数据。

5、SCI论文中的统计分析有P值表示趋势,一般用在回归分析中,以识别和确定自变量和因变量之间的线性趋势关系。 常见于Logistic回归、COX回归和线性回归。 你一定会问,自变量本身就是测量数据,为什么不能直接代入模型进行分析,线性回归结果解释为自变量增加1个单位时Y变化了多少个单位(线性) ; Logistic/COX,自变量单位增加 1,结果事件的风险 (OR/HR)。 在许多情况下,如果自变量增加 1 个单位,Y 可能不会有太大的变化或风险。 如下图所示,当微球蛋白增加1mg/L时,患病风险可能不会有太大变化。

血型配对表图 学习统计学第八天——Logistic回归

为了增加模型发现风险的能力,对于年龄,有时我们将10岁分为一组; 然而,一些生化指标如何划分呢? 所以我们使用四分位距(Q),我们通过四分位距对自变量X进行分组,可以分为4组,我们Q1=1; Q2=2; Q3=3; Q4=4,见上图; P代表趋势值,它是如何计算的? 就是将原来的x转化为等级变量,将1、2、3、4代入模型中血型配对表图 学习统计学第八天——Logistic回归,以1为参考,Logistic回归得到的P值就是趋势P。 上图第二行,还有一个P值。 这是如何计算的? 试想一下,为什么我们认为 X 和 Y 是线性的? 如果不符合线性,就必须按照电平的线性来分析,这是错误的。 为了保险起见,我们还需要将成绩(1、2、3、4)再次作为分类变量,在模型中设置虚拟变量进行分析,并以1为参考,得到3个比较P值。

6、很多情况下,Per 1 Sd也会出现在文章中。 每1sd是指原始数据增加1个标准差时效应大小发生的风险。 在这种情况下,是人力资源部。 但这怎么可能呢? 1 个标准差是多少? 如何实现这样的统计分析呢? Per 1 sd的实现其实就是将原始数据标准化,保存为新的变量X。由于新变量X是标准化数据,所以它的均值和标准差分别为0和1。然后让X进入模型进行分析。 请问大家,此时X每增加一个单位,增加效应大小的风险为HR。 因为标准差为1,所以此时X增加1个单位,即Per 1 sd。 1=每 1 个标准差。 即,自变量每次增加 1 个标准差。

7、同级等价原则:建立回归模型时,若Y为测量数据,则X为测量数据,分析效果会更好。 当然,当Y为测量时血型配对表图 学习统计学第八天——Logistic回归,X可以是任何形式; 当Y为等级数据时,此时X为等级效果或者分类会更好; 当Y为二分类时,X为等级或者分类效果较好。 在国外很多文章中,当Y是二元分类时,虽然X实际上是一个测量,但研究人员会让它以测量和等级的形式进入模型进行分析,然后讨论结果; 当Y是二元分类时,虽然X实际上是一个等级,但研究人员会让它以层次和分类的形式进入模型进行分析,然后讨论结果。 让我们仔细看看它的含义!

可能的情况

01

单因素分析是有意义的,但多因素分析是没有意义的。 这就是所谓的“单一而不存在”。 单个因素的显着性并不意味着该因素和 Y 一定有意义。 该因素很可能受到其他因素的影响。 与 Y 有关。

例如,小A和小B是工厂工人。 小A每天生产60双鞋,小B每天生产60双鞋。 现在工厂举办技能大赛。 小A参加了,小B没有参加。 小B每天给小A的工作量是60双鞋,而小A有120双鞋,所以小A被评为技术能手。 第二年再次举办比赛,小A和小B都参加了。 小B没有把自己的工作量交给小A,所以小A没有被选中。 第一年,小A因为小B的功劳而被评级,扣除B的影响力后,小A只是一个凡人,毫无意义。

因此,当我们单独研究某个因素时,得到的结果可能会掩盖一些信息。 扣除这些信息后,结论可能会被推翻!

02

无非就是一个,就是单因素分析是没有意义的,但是在多因素分析中,这个因素是有意义的。

比如,小A平时学习很努力,但是今天他考试不及格。 别人都认为小A的学习成绩不好,但事实是小A昨天帮助了别人。 他扶起一位摔倒的老太太,并将老太太送往医院。 那些彻夜等待,第二天早上来学校参加考试的,如果没有老太太因素的干扰,即扣除了这个因素的影响,也纳入模型中,那么小A的等级就可以体现出来了。

因此,统计分析或多变量分析的结果更加可信。

武松. SPSS实战与统计思维


版权说明:以上内容来自网友投稿,若有侵权请联系



★文章来自爱算卦网,未经允许不得转载!★

精彩推荐

星座运势

白羊座
  • 今日
  • 明日
  • 本周
  • 本月
  • 本年
今日运势平稳
今天不论做什么进展都颇为顺畅,工作效率加快,过程得心应手,来也能紧...[详情]
白羊座
白羊座
3日21日-4月20日
查看详解
2022年
    1月
      1日
        ? 相濡以沫
        白羊女
        白羊男

        大师亲算

        • 命中注定另一半
        • 八字精批
        • 八字合婚书
        • 姓名配对
        • 紫薇斗数
        • 塔罗牌爱情圣三角
        • 恋人星座合盘
        • 七世情缘
        • 爱情运势
        • 易起名
        • 祈福点灯3

        免费八字算命

        2000年
          1月
            1日
              0时
                大师算命

                在线查询

                属鼠的人性格
                • 属鼠的人性格
                • 属牛的人性格
                • 属虎的人性格
                • 属兔的人性格
                • 属龙的人性格
                • 属蛇的人性格
                • 属马的人性格
                • 属羊的人性格
                • 属猴的人性格
                • 属鸡的人性格
                • 属狗的人性格
                • 属猪的人性格
                属鼠女
                • 属鼠女
                • 属牛女
                • 属虎女
                • 属兔女
                • 属龙女
                • 属蛇女
                • 属马女
                • 属羊女
                • 属猴女
                • 属鸡女
                • 属狗女
                • 属猪女
                属鼠男
                • 属鼠女
                • 属牛女
                • 属虎女
                • 属兔女
                • 属龙女
                • 属蛇女
                • 属马女
                • 属羊女
                • 属猴女
                • 属鸡女
                • 属狗女
                • 属猪女
                A型血
                • A型型血
                • B型型血
                • AB型型血
                • O型型血
                • 熊猫型型血
                A型血女
                • A型型血女
                • B型型血女
                • AB型型血女
                • O型型血女
                • 熊猫型型血女
                A型血男
                • A型型血男
                • B型型血男
                • AB型型血男
                • O型型血男
                • 熊猫型型血男
                由字脸型
                • 由字脸
                • 甲字脸
                • 申字脸
                • 田字脸
                • 同字脸
                • 王字脸
                • 圆字脸
                • 目字脸
                • 用字脸
                • 风字脸
                眉毛有痣
                • 眉毛有痣
                • 眼角有痣
                • 下巴有痣
                • 肩膀有痣
                • 耳朵有痣
                • 鼻子有痣
                • 手心有痣
                • 脚底有痣
                • 胸口有痣
                • 嘴角有痣
                • 脖子有痣
                婚姻线
                • 婚姻线
                • 事业线
                • 智慧线
                • 生命线
                • 财运线
                • 成功线
                • 上进线
                • 障碍线
                • 健康线
                • 活力线
                • 烦恼线
                • 纵欲线
                • 宠爱线
                • 创作线
                • 希望线
                • 努力线
                • 不测线
                • 人缘线

                解签算卦