SPSS回归分析,因变量为固定值1,自变量和因变量为变化值该如何分析?

逻辑(Logistic)回归分析——补充
全国服务热线:400-627-0012
逻辑(Logistic)回归分析——补充
发布时间: | 来源: | 责任编辑:嗵嗵e研
逻辑回归(Logistic Regression)是在临床研究中应用最为广泛的统计方法之一,很多研究会在单因素分析的基础上,进行一定的多因素分析(如线性回归或逻辑回归)。在嗵嗵e研网站上已经有逻辑回归的SPSS操作介绍了,这里仅对其作一补充。
逻辑回归是分类资料统计分析的一种重要方法,是一种研究多水平(包括两水平)的反应变量与其影响因子(又称自变量)间关系的回归分析。
这里简单解释一下几个概念:
1、分类资料是指所得数据是分类的,不完全连续的;可分为有序分类和无序分类,有序分类如疾病的预后(未改善、改善和痊愈),无序分类如研究对象的职业(工人、农民、知识分子等)。
2、反应变量就是我们常说的因变量,顾名思义就是因别人的变化而变化的量,比如研究某病预后的影响因素,这里的预后就是因变量。
3、自变量(影响因子),通俗地说就是不因别人变化而自己变化的量,比如上例中某病预后的影响因素就是自变量,如病人的年龄,疾病分期分型,处理方式等等。下面我们针对逻辑回归的常见问题作一讨论。
1、为什么会有非条件和条件逻辑回归?
按照研究设计的不同,可将逻辑回归分为成组资料的非条件逻辑回归和配对资料的条件逻辑回归两类。成组资料是指组与组之间是相互独立的,没有针对每一个病例去寻找他特定的对照,它是相对于配对资料而言的。配对资料是指研究设计之初,根据潜在的影响因素如性别、年龄等将病例与对照配成对子,可以是一个病例配一个对照,也可以是一个病例配n个对照。对于成组资料,采用的是非条件逻辑回归;对与配对资料,采用的是条件逻辑回归,两者之间有着明显的区别。
按照因变量分类数的多少,可将非条件逻辑回归分为二分类逻辑回归和多分类逻辑回归两类,二分类是指因变量只有两个分类(如是否发生出血),多分类是指因变量有三个及以上分类(如按照出血量的不同,分为轻度、中度和重度出血)。
在实际工作中我们最为常用的还是“二分类非条件逻辑回归”,即因变量是两个分类的,研究设计不是病例与对照配对设计的,而是常规的成组设计。
2、逻辑回归需要多大的样本量?
在实际工作中,经常遇到仅有20-30个病人的资料去做逻辑回归的,这样回归结果可能存在样本量不足的问题。那么在逻辑回归的计算中到底需要多少样本量呢?
对于逻辑回归样本量的确定,有一些计算公式和工具表可供参考。一般认为非条件逻辑回归样本容量应为自变量个数的5-10倍,即如果你纳入5个自变量那么样本的总例数应该大于25-50人。较为严格的要求是,在因变量的各个水平中,例数最少的水平的样本数也应该是自变量个数的5-10倍。比如有200个研究对象,其中患病40个,未患病160个,想研究患病的影响因素,那么逻辑回归可纳入的自变量个数为40/10=4个。也有教材指出,经验上非条件逻辑回归中各组的人数应该至少有30-50例(摘自《医学统计学》第三版p293,人民卫生出版社,主编孙振球)。
对于条件逻辑回归而言,配对组数不应&50组,且总体的样本量应该大于纳入方程的自变量个数的20倍以上。逻辑回归的所有统计推断都是建立在大样本基础之上的,因此要求有足够的样本量来支持其回归结果的可信度。
3、如何判断逻辑回归模型拟合的好坏?
通常我们在分析自己的数据时,会遇到不同的分析方法会跑出不同的逻辑回归结果,那么哪个结果更好呢?或者是在多大的程度上,我们能够说明自己在逻辑回归中寻找出的影响因素是对的呢?这就需要我们对逻辑回归模型拟合的效果进行一定的判断。
常见的逻辑回归模型效果判断指标有对数似然值、伪决定系数、模型预测的正确率和ROC曲线。具体如下:
(1)对数似然值,逻辑回归是通过极大似然法求解的,极大似然取值在0-1之间,可利用-2倍的对数似然值来表示模型的拟合好坏,其值越小越接近于0,说明模型拟合效果越好;
(2)伪决定系数,跟线性回归一样,逻辑回归也存在决定系数,称为伪决定系数。它是由似然函数计算而来的,它的值越接近于1说明回归拟合的越好。在SPSS的结果中存在两种伪决定系数,分别是1989年Cox和Snell提出的伪决定系数(取值范围为0≤R2&1)和1991年Nagelkerke提出的最大调整决定系数(取值范围为0≤R2≤1),两者选一即可。
(3)模型预测的正确率,显然对因变量结局预测的准确程度也可以反应模型的效果。SPSS在Logistic回归过程中会给出模型预测的列联表,这也是模型拟合好坏的判断依据之一。同时在SPSS中用户还可以自定义模型预测的概率标准(默认是0.5)。
(4)ROC曲线,在获得每一个研究对象的预测概率之后,我们可以通过制作ROC曲线来判断一下,取不同的预测概率值时,预测的准确率会有何种变化。
4、用SPSS做逻辑回归分析的注意事项
(1)自变量和因变量的变量名最好都是英文的。在做逻辑回归时,如果自变量或因变量的变量名中含有中文字符或括号可能会导致逻辑回归结果非常迥异,而且错误的莫名其妙,且不同版本的SPSS出错的形式还不尽相同。建议在所有的统计分析中,变量名均需要修改为英文格式。
(2)当自变量中有多分类名义变量时,应该将其设为哑变量进行处理。
(3) 如果某连续性自变量可以将因变量的两组完全分开时(如某自变量在病例组中的的最小值大于该自变量在对照组中的最大值时),该自变量不应该被纳入回归方程。
(4)如果某分类自变量在因变量的某一组中取值完全一致时(如在病例组中某自变量取值均为1,而在对照组中自变量的取值有0也有1),该自变量不应该被纳入回归方程,否则该自变量的p值特别大,且不会被剔出方程,OR值接近0或无穷大。
简单介绍相关性分析
非完美金标准偏倚(Imperfect Gold Standard Bias)
针对辅助疗法评价的add-on设计及合理的假设建立方法
京卫计网审[2015]第0523号&&&&&&京ICP备号&&&&&&京ICP证160408号
&&&&&&Copyright (C) 2014 北京易康医疗科技有限公司版权
全国免费咨询热线
400-627-0012苹果/安卓/wp
积分 170, 距离下一级还需 90 积分
权限: 自定义头衔
道具: 彩虹炫, 雷达卡, 热点灯, 雷鸣之声, 涂鸦板, 金钱卡, 显身卡, 匿名卡下一级可获得
权限: 签名中使用图片
购买后可立即获得
权限: 隐身
道具: 金钱卡, 雷鸣之声, 彩虹炫, 雷达卡, 涂鸦板, 热点灯
开心签到天数: 32 天连续签到: 19 天[LV.5]常住居民I
新手刚开始使用SPSS,比如因变量Y,问卷对应Y有5个问题,自变量X有8个问题,如果对X和Y进行回归分析,是先分别计算出X和Y的平均数在做回归吗?还是先做主成分分析。非常感谢!
支持楼主:、
购买后,论坛将把您花费的资金全部奖励给楼主,以表示您对TA发好贴的支持
载入中......
还是有点不明白& && && && && && && && && && && && && && &&&& && && && && && && && & & &
& && && && && && && && && && && && && &
& && && && && && && && && &&&& && && && && && && && &
& && && && && && && && && && && && && && && && && &&&
& && && &&&& && && && && &&&& && &&&& && && &
& && && && && && && & & && && && && && && && && && & & && && && &
& && && && && && && && && && && && && && && && && && && && && && && && && && && &
如果Y是多分类有序变量,用有序logistic回归分析。如果为无序分类,则用多分类logistic 回归分析。
建议你去看SPSS相关教材中,有关logistic回归分析的内容。最好去下载张文彤教授的SPSS培训视频录像,他讲得最好。
高级班才有这个内容。本想直接送你,但无法上传这么大的附件。
本人觉得SPSS因子分析并不怎样好用!
gxnnhgm66 发表于
建议你去看SPSS相关教材中,有关logistic回归分析的内容。最好去下载张文彤教授的SPSS培训视频录像,他讲得 ...非常感谢!
wanderzhou 发表于
非常感谢!请教哪里有下?谢谢
zuobanbian007 发表于
请教哪里有下?谢谢书论坛里就有:
视频没有下。
论坛好贴推荐
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
如有投资本站或合作意向,请联系(010-);
邮箱:service@pinggu.org
投诉或不良信息处理:(010-)
京ICP证090565号
京公网安备号
论坛法律顾问:王进律师SPSS回归分析作业_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
SPSS回归分析作业
上传于||暂无简介
阅读已结束,如果下载本文需要使用1下载券
想免费下载本文?
下载文档到电脑,查找使用更方便
还剩19页未读,继续阅读
你可能喜欢谁能帮忙讲解一下分类变量的回归分析?自变量和因变量都为分类变量,请问怎样用SpSS做回归分析?谁能帮忙讲解一下分类变量的回归分析?自变量和因变量都为分类变-知识宝库
你可能对下面的信息感兴趣义项指多义词的不同概念,如的义项:网球运动员、歌手等;的义项:冯小刚执导电影、江苏卫视交友节目等。
回归分析(regression analysis)是确定两种或两种以上间相互依赖的定量关系的一种统计分析方法。运用十分广泛,回归分析按照涉及的自变量的多少,分为回归和多重回归分析;按照因变量的多少,可分为一元回归分析和分析;按照和之间的关系类型,可分为分析和分析。如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是,则称为分析。
出版社 社会科学文献出版社
出版时间 日
书 名: 回归分析作 者:谢宇出版社: 出版时间: 日ISBN: 4开本: 16开定价: 45.00元
《回归分析》源于作者多年在教授回归分析的课程讲义,从基本的统计概念讲起,对分析的基本假定、回归中的统计推论和回归诊断做了详尽的介绍,同时还涵盖了很多在社会科学中对实际研究非常有用的内容,包括虚拟变量、交互作用、辅助回归、多项式回归、样条函数回归和阶跃函数回归等。此外,《回归分析》还涉及通径分析、纵贯数据模型、多层线性模型和Iogit模型等方面的内容。
谢宇,密歇根大学OtisDudleyDuncan杰出教授,同时也是密歇根大学社会学系、统计系和中国研究中心教授,社会研究院(ISR)人口研究中心和调查研究中心,调查研究中心量化方法组主任;长江学者特聘讲座教授。2004年当选美国艺术与科学院院士和“中央研究院”院士,2009年当选美国国家科学院院士。其研究领域包括:社会分层、、人口学、科学社会学和中国研究。主要著作有:《分类数据分析的统计方法》、《科学界的女性》、《美国亚裔的人口统计描述》、《社会学方法与定量研究》、《婚姻与同居》等。
第1章 基本统计概念1.1 统计思想对于社会科学研究的重要性1.2 本书的特点1.3 基本统计概念1.4 随机变量的和与差1.5 期望与的性质1.6 本章小结第2章 统计推断基础2.1 分布2.2 估计2.3 2.4 本章小结第3章 一元线性回归3.1 理解回归概念的三种视角3.2 回归模型3.3 回归直线的拟合优度3.4 假设检验3.5 对特定X下y均值的估计3.6 对特定X下y单一值的预测3.7 简单线性回归中的非线性变换3.8 实例分析3.9 本章小结第4章 线性代数基础4.1 定义4.2 矩阵的运算4.3 特殊矩阵4.4 4.5 矩阵的逆4.6 行列式4.7 矩阵的运算法则4.8 向量的期望和协方差阵的介绍4.9 矩阵在社会科学中的应用4.10本章小结第5章 5.1 多元线性回归模型的矩阵形式5.2 多元回归的基本假定5.3 多元回归的估计5.4 0LS的解读5.5 多元回归模型方差的估计5.6 多元回归参数估计量方差的估计5.7 模型设定中的一些问题5.8 标准化回归模型5.9 cHIP88实例分析5.10 本章小结第6章 多元回归中的统计推断与假设检验6.1 统计推断基本原理简要回顾6.2 统计显著性的相对性.以及效应幅度6.3 单个回归系数反=0的检验6.4 多个回归系数的联合检验6.5 回归系数线性组合的检验6.6 本章小结第7章 和F检验7.1 一元线性回归中的分析7.2 多元线性回归中的方差分析7.3 方差分析的假定条件7.4 F检验7.5 判定系数增量7.6 拟合优度的测量7.7 实例分析7.8 本章小结第8章 辅助回归和偏回归图8.1 回归分析中的两个常见问题8.2 辅助回归8.3 变量的对中8.4 偏回归图8.5 排除忽略变量偏误的方法8.6 应用举例8.7 本章小结第9章 因果推断和路径分析9.1 相关关系9.2 因果推断9.3 因果推断的问题9.4 因果推断的假设9.5 因果推断中的原因9.6 路径分析9.7 本章小结第10章 多重共线性问题10.1 多重共线性问题的引入10.2 完全多重共线性10.3 近似多重共线性10.4 多重共线性的度量10.5 多重共线性问题的处理10.6 本章小结第11章 多项式回归、样条函数回归和阶跃甬数回归11.1 多项式回归11.2 样条函数回归11.3 阶跃函数回归11.4 本章小结第12章 虚拟变量与名义自变量12.1 名义变量的定义与特性12.2 虚拟变量的设置……第13章 交互项第14章 异方差与广义第15章 纵贯数据的分析第16章 多层线性模型介绍第17章 回归诊断第18章 二分因变量的logit模型词汇表参考文献后记
回归分析是应用极其广泛的之一。它基于观测数据建立变量间适当的依赖关系,以分析数据内在规律,并可用于预报,控制等问题。方差齐性线性关系效应累加变量无测量变量服从多元观察独立模型完整(没有包含不该进入的变量、也没有漏掉应该进入的变量)误差项独立且服从(0,1)正态分布。现实数据常常不能完全符合上述假定。因此,统计学家研究出许多的回归模型来解决线性回归模型假定过程的约束。研究一 个或多个随机变量Y1 ,Y2 ,…,Yi与另一些变量X1、X2,…,Xk之间的关系的统计方法。又称多重回归分析。通常称Y1,Y2,…,Yi为因变量,X1、X2,…,Xk为自变量。回归分析是一类数学模型,特别当因变量和自变量为线性关系时,它是一种特殊的线性模型。最简单的情形是一个自变量和一个因变量,且它们大体上有线性关系,这叫一元线性回归,即模型为Y=a+bX+ε,这里X是自变量,Y是因变量,ε是随机误差,通常假定随机误差的均值为0,为σ^2(σ^2大于0)σ2与X的值无关。若进一步假定随机误差遵从正态分布,就叫做正态线性模型。一般的情形,差有k个自变量和一个因变量,因变量的值可以分解为两部分:一部分是由自变量的影响,即表示为自变量的函数,其中函数形式已知,但含一些未知;另一部分是由于其他未被考虑的因素和随机性的影响,即随机误差。当函数形式为未知参数的线性函数时,称线性回归分析模型;当函数形式为未知参数的非线性函数时,称为非线性回归分析模型。当自变量的个数大于1时称为多元回归,当因变量个数大于1时称为多重回归。回归分析的主要内容为:①从一组数据出发确定某些变量之间的定量关系式,即建立数学模型并估计其中的 未知参数。估计参数的常用方法是。②对这些关系式的可信程度进行检验。③在许多自变量共同影响着一个因变量的关系中,判断哪个(或哪些)自变量的影响是显著的,哪些自变量的影响是不显著的,将影响显著的自变量选入模型中,而剔除影响不显著的变量,通常用逐步回归、向前回归和向后回归等方法。④利用所求的关系式对某一生产过程进行预测或控制。回归分析的应用是非常广泛的,统计软件包使各种回归方法计算十分方便。在回归分析中,把变量分为两类。一类是因变量,它们通常是实际问题中所关心的一类指标,通常用Y表示;而影响因变量取值的的另一变量成为自变量,用X来表示。回归分析研究的主要问题是:(1)确定Y与X间的定量关系表达式。这种表达式成为回归方程;(2)对求得的回归方程的可信度进行检验;(3)判断自变量X对Y有无影响;(4)利用所求得的回归方程进行预测和控制。
根据预测目标,确定自变量和因变量
明确预测的具体目标,也就确定了因变量。如预测具体目标是下一年度的销售量,那么销售量Y就是因变量。通过市场调查和查阅资料,寻找与预测目标的相关影响因素,即自变量,并从中选出主要的影响因素。
建立回归预测模型
依据自变量和因变量的历史统计资料进行计算,在此基础上建立回归分析方程,即回归分析预测模型。
进行相关分析
回归分析是对具有的影响因素(自变量)和预测对象(因变量)所进行的分析处理。只有当变量与因变量确实存在某种关系时,建立的回归方程才有意义。因此,作为自变量的因素与作为因变量的预测对象是否有关,相关程度如何,以及判断这种相关程度的把握性多大,就成为进行回归分析必须要解决的问题。进行,一般要求出相关关系,以的大小来判断自变量和因变量的相关的程度。
检验回归预测模型,计算预测误差
回归预测模型是否可用于实际预测,取决于对回归预测模型的检验和对预测误差的计算。回归方程只有通过各种检验,且预测误差较小,才能将回归方程作为预测模型进行预测。
计算并确定预测值
利用回归预测模型计算预测值,并对预测值进行综合分析,确定最后的预测值。
研究的是现象之间是否相关、相关的方向和密切程度,一般不区别自变量或因变量。而回归分析则要分析现象之间相关的具体形式,确定其因果关系,并用数学模型来表现其具体关系。比如说,从相关分析中我们可以得知“质量”和“用户满意度”变量密切相关,但是这两个变量之间到底是哪个变量受哪个变量的影响,影响程度如何,则需要通过回归分析方法来确定。一般来说,回归分析是通过规定因变量和自变量来确定变量之间的因果关系,建立回归模型,并根据实测数据来求解模型的各个参数,然后评价回归模型是否能够很好的拟合实测数据;如果能够很好的拟合,则可以根据自变量作进一步预测。例如,如果要研究质量和用户满意度之间的因果关系,从实践意义上讲,会影响用户的满意情况,因此设用户满意度为因变量,记为Y;质量为自变量,记为X。根据图8-3的,可以建立下面的线性关系: Y=A+BX+§式中:A和B为待定参数,A为回归直线的截距;B为回归直线的斜率,表示X变化一个单位时,Y的平均变化情况;§为依赖于用户满意度的随机误差项。在SPSS软件里可以很容易地实现线性回归,回归方程如下: y=0.857+0.836x回归直线在y轴上的截距为0.857、斜率0.836,即质量每提高一分,用户满意度平均上升0.836分;或者说质量每提高1分对用户满意度的贡献是0.836分。上面所示的例子是简单的一个自变量的线性回归问题,在数据分析的时候,也可以将此推广到多个自变量的多元回归,具体的回归过程和意义请参考相关的统计学书籍。此外,在SPSS的结果输出里,还可以汇报R2,F检验值和T检验值。R2又称为方程的确定性系数(coefficient of determination),表示方程中变量X对Y的解释程度。R2取值在0到1之间,越接近1,表明方程中X对Y的解释能力越强。通常将R2乘以100%来表示回归方程解释Y变化的百分比。F检验是通过方差分析表输出的,通过显著性水平(significant level)检验回归方程的线性关系是否显著。一般来说,显著性水平在0.05以下,均有意义。当F检验通过时,意味着方程中至少有一个回归系数是显著的,但是并不一定所有的回归系数都是显著的,这样就需要通过T检验来验证回归系数的显著性。同样地,T检验可以通过显著性水平或查表来确定。在上面所示的例子中,各参数的意义如表8-2所示。表8-2 线性回归方程检验指标显著性水平意义R0.89“质量”解释了89%的“用户满意度”的变化程度F276.820.001回归方程的线性关系显著T16.640.001回归方程的系数显著示例 SIM手机用户满意度与相关变量线性回归分析我们以SIM手机的用户满意度与相关变量的线性回归分析为例,来进一步说明线性回归的应用。从实践意义讲上,手机的用户满意度应该与产品的质量、价格和形象有关,因此我们以“用户满意度”为因变量,“质量”、“形象”和“价格”为自变量,作线性回归分析。利用SPSS软件的回归分析,得到回归方程如下:用户满意度=0.008×形象+0.645×质量+0.221×价格对于SIM手机来说,质量对其用户满意度的贡献比较大,质量每提高1分,用户满意度将提高0.645分;其次是价格,用户对价格的评价每提高1分,其满意度将提高0.221分;而形象对产品用户满意度的贡献相对较小,形象每提高1分,用户满意度仅提高0.008分。方程各检验指标及含义如下:指标显著性水平意义R20.89“质量”和“形象”解释了89%的“用户满意度”的变化程度F248.530.001回归方程的线性关系显著T(形象)0.001.000“形象”变量对回归方程几乎没有贡献T(质量)13.930.001“质量”对回归方程有很大贡献T(价格)5.000.001“价格”对回归方程有很大贡献从方程的检验指标来看,“形象”对整个回归方程的贡献不大,应予以删除。所以重新做“用户满意度”与“质量”、“价格”的回归方程如下: 用满意度=0.645×质量+0.221×价格对于SIM手机来说,质量对其用户满意度的贡献比较大,质量每提高1分,用户满意度将提高0.645分;用户对价格的评价每提高1分,其满意度将提高0.221分(在本示例中,因为“形象”对方程几乎没有贡献,所以得到的方程与前面的回归方程系数差不多)。方程各检验指标及含义如下:指标显著性水平意义R0.89“质量”和“形象”解释了89%的“用户满意度”的变化程度F374.690.001回归方程的线性关系显著T(质量)15.150.001“质量”对回归方程有很大贡献T(价格)5.060.001“价格”对回归方程有很大贡献
应用回归预测法时应首先确定变量之间是否存在相关关系。如果变量之间不存在相关关系,对这些变量应用回归预测法就会得出错误的结果。正确应用回归分析预测时应注意: ①用定性分析判断现象之间的依存关系;②避免回归预测的任意外推;③应用合适的数据资料;
{{each(i, video) list}}
{{if list.length > 8}}
查看全部 ${list.length} 期节目
{{if _first}}
内容来源于
{{if list && list.length}}

我要回帖

更多关于 spss自变量和因变量 的文章

 

随机推荐