烟饮酒与食管癌资料软件计算对建立的整个模型做检验。似然比计分检验检验例表资料,对各的做检验检验参数χ常数吸烟饮酒,高血压史无,有高血压家族史无,有吸烟不吸,吸烟高血脂史无,有动物脂肪摄入低,高体重指数性格是,否冠心病病例,对照表逐步回归法进入方程的自变量及参数估计软件变量χ值标准常数年龄高血脂脂肪摄入性格标准回归系数比较各自变量对的相对贡献表冠心病与危险因素关系统计分析结果经回归分析逐步法结果见表,冠心病的危险因素有年龄高血脂脂肪摄入性格。其中危险因素对冠心病的作用大小依次为脂肪摄入性统计量χ认为变量对回归有统计意义。吸烟和饮酒与食管癌关系例子消除饮酒的影响后,,吸烟与食管癌有关系。似然比检验各,不全为假设检验的统计量,不饮酒的可信区间三回归模型的假设检验检验模型中自变量的是否对有作用。检验方法似然比检验检验计分检验比为倍的可信区间估计,变量吸烟与不吸烟的可信区间,变量饮酒与例数吸烟饮酒病例对照暴露因素无,有经回归计算后得,回归模型为控制饮酒因素后,吸烟与不吸烟相比患食管癌的优势食管癌患者对照组非食管癌不吸烟吸烟不饮酒饮酒建立回归模型为吸烟饮酒与食管癌关系的病例对照资料变量赋值和例数暴露因素为回归系数的标准误公式回归系数与的关系为例讲义表资料研究吸烟饮酒与食管癌关系的病例对照设计的资料例,试作回归分析。变量的赋值病例组优势比及可信区间的估计如,两分类,则的可信区间估计公式为型的参数估计模型中的回归系数估计用最大似然函数,估计,公式,由统计软件包完成。,有关,保护因子值的大小反映暴露因素与事件发生关系的程度。多个自变量回归模型的概念二回归模位发生事件的对数优势比含义为在其他变量固定后,与相比或每增加个单位发生事件优势比的对数值。回归系数与与关联结论,无关,有关,危险因素暴露因素存在与不存在的个体相比,发生事件优势比的对数值。或每增加个单险性增加。值,表示有暴露因素的人出现事件患疾病的优势低于无暴露因素者,或危险性减少。值,意味无论暴露出现与否,与事件疾病无关系方程的回归系数含义值反映暴露因素与事件疾病关系意义值,表示有暴露因素的个体出现事件患病的优势大于无暴露因素者,或优势危例优势比,,定义暴露因素存在与暴露不存在出现事件疾病的优势之比,称为事件暴露因素的优势比,公式合计暴露因素吸烟的优势在两组的优势同理非暴露因素的优势比合计暴露因素吸烟的优势在两组的优势同理非暴露因素的优势比,定义暴露因素存在与暴露不存在出现事件疾病的优势之比,称为事件暴露因素的优势比,公式例优势比,值反映暴露因素与事件疾病关系意义值,表示有暴露因素的个体出现事件患病的优势大于无暴露因素者,或优势危险性增加。值,表示有暴露因素的人出现事件患疾病的优势低于无暴露因素者,或危险性减少。值,意味无论暴露出现与否,与事件疾病无关系方程的回归系数含义暴露因素存在与不存在的个体相比,发生事件优势比的对数值。或每增加个单位发生事件的对数优势比含义为在其他变量固定后,与相比或每增加个单位发生事件优势比的对数值。回归系数与与关联结论,无关,有关,危险因素,有关,保护因子值的大小反映暴露因素与事件发生关系的程度。多个自变量回归模型的概念二回归模型的参数估计模型中的回归系数估计用最大似然函数,估计,公式,由统计软件包完成。优势比及可信区间的估计如,两分类,则的可信区间估计公式为为回归系数的标准误公式回归系数与的关系为例讲义表资料研究吸烟饮酒与食管癌关系的病例对照设计的资料例,试作回归分析。变量的赋值病例组食管癌患者对照组非食管癌不吸烟吸烟不饮酒饮酒建立回归模型为吸烟饮酒与食管癌关系的病例对照资料变量赋值和例数暴露因素例数吸烟饮酒病例对照暴露因素无,有经回归计算后得,回归模型为控制饮酒因素后,吸烟与不吸烟相比患食管癌的优势比为倍的可信区间估计,变量吸烟与不吸烟的可信区间,变量饮酒与不饮酒的可信区间三回归模型的假设检验检验模型中自变量的是否对有作用。检验方法似然比检验检验计分检验各,不全为假设检验的统计量,统计量χ认为变量对回归有统计意义。吸烟和饮酒与食管癌关系例子消除饮酒的影响后,,吸烟与食管癌有关系。似然比检验检验单个变量检验检验假设检验统计量公式当认为对有关系,计分检验例表吸烟饮酒与食管癌资料软件计算对建立的整个模型做检验。似然比计分检验检验例表资料,对各的做检验检验参数χ常数吸烟饮酒,高血压史无,有高血压家族史无,有吸烟不吸,吸烟高血脂史无,有动物脂肪摄入低,高体重指数性格是,否冠心病病例,对照表逐步回归法进入方程的自变量及参数估计软件变量χ值标准常数年龄高血脂脂肪摄入性格标准回归系数比较各自变量对的相对贡献表冠心病与危险因素关系统计分析结果经回归分析逐步法结果见表,冠心病的危险因素有年龄高血脂脂肪摄入性格。其中危险因素对冠心病的作用大小依次为脂肪摄入性格高血脂年龄。第二节条件回归概念用配对设计获得病例对照研究资料,计算的回归模型为条件回归。未配对设计的病例对照研究资料,计算的回归模型为非条件回归。两回归模型区别条件回归模型无常数项参数研究目的主要用于寻找危险因素的分析。病例对照的配对设计采用配对设计控制已知的影响因素配对因素如年龄性别生活条件,减少对比较组的影响。如配对组的观察对象为个病例和个对照,称为配对研究,或的配对研究。例采用配对的病例对照设计,研究个可能与喉癌有关的危险因素,共个配对组,数据见表例采用配对配对病例对照研究喉癌危险因素因素变量名赋值说明咽炎无偶尔经常吸烟史支日声嘶史无偶尔经常摄食新鲜蔬菜少经常每天摄食水果很少少量经常癌症家族史无有是否患喉癌病例对照表逐步回归法进入方程的变量和参数变量回归系数标准误χ值配对对病例对照研究喉癌危险因素配对应变量危险因素组号第三节回归的应用及注意问题回归的应用危险因素的筛选和分析用回归系数和说明危险因素与事件疾病的关系。例讲义例适用的资料前瞻性研究设计病例对照研究设计横断面研究设计的资料。校正混杂因素,评价实验处理的效应如实验研究,比较组间存在混杂因素或实验无法控制因素,该法可控制混杂因素,合理评价结果的效应。对个体预测与分类预测个体在因素存在条件下,发生事件发病的概率为进步研究提供依据。根据预测的概率,对研究个体进行分类腋下淋巴甲医院乙医院结转移病例生存生存率病例生存生存率无有合计例变量编码生存,死亡,甲医院,乙医院,转移无转移医院医院两医院乳腺癌术后年生存率比较回归模型计算结果校正病情因素后,两医院生存率差别有统计意义,甲医院的生存率高于乙医院。病情因素差别有统计意义,淋巴结有转移者生存率低,是无转移患者生存率的。医院淋巴结转移例两种药物对病疗效的研究性别治疗方法疗效有效无效合计有效率女新药对照男新药对照上表可见,女性无论新药和对照药疗效高于男性问性别是否与疗效有关,排除性别因素后,两组药物疗效是否有差别不考虑性别作用回归模型计算结果常数性别药物性别药物结论性别和药物的回归系数都均有统计意义。女性和用新药的疗效较优。用的概率模型对个体的疗效做预测设如女性病人用新药,有效的概率如男性病人,用新药,有效的概率二回归应用的注意问题模型中自变量的取值计量数据有时划为有序组段如年龄岁岁岁,的实际意义更大。例表年龄每增加岁的例如年龄岁数据为分类数据赋值形式两分类变量赋值为有,无有序变量文化程度,赋值为文盲,小学,中学,大专及以上多分类无序变量如血型,化为分类数个哑变量哑变量的赋值与方程血型有序赋值哑变量赋值哑变量方程血型变量的赋值哑变量的赋值与方程年龄岁有序变量哑变量方法赋值方程有序变量方程含义每增加个单位岁,发病的概率优势比增加表年龄变量的赋值方程哑变量方程方程系数的解释岁与岁相比的对数优势比岁与岁相比的对数优势比岁与岁相比的对数优势比样本含量非配对研究的病例和对照组的例数可相等或不等,但接近比较好。样本例数的估计原则自变量个数越多,例数越多。各组样本例数对照组和病例组至少为自变量个数的倍。回归模型效果的判断拟合优度意义评价模型结果与实际结果的致程度判断指标预测结果的正确率用回归的概率模型回代建模样本,预测个体结果正确的比例χ拟合优度检验软件检验预测值与实际值的差别认为拟合效果好讲义例冠心病与个危险因素关系将个体的变量值回代方程,预测个体是冠心病的概率和符合率表资料吸烟饮酒与食管癌的关系剩余差与χ拟合优度检验表如检验水准χ如,认为拟合方程理想,本例,认为食管癌资料仅用上述个指标解释,数据拟合不理想多分类的回归回归可处理应变量为有序的多分类资料例疗效结果为治愈显效好转无效例检查结果应变量为无序的多分类资料例研究阑尾炎类型与危险因素关系阑尾炎类型有卡他型坏疽型腹膜炎型多分类回归方法略回归分析小结回归是研究应变量为分类变量与影响因素关系的方法。回归分析主要的应用筛选变量的影响因素,通过值大小说明变量对的作用。通过构建的概率模型,对研究的个体发生事件的概率做预测。结束谢谢大家第十六章回归分析第二军医大学卫生统计学教研室孟虹本章的内容第节回归基本概念参数估计假设检验变量筛选模型评价第二节条件回归第三节回归的应用和注意问题为重点介绍问题的提出医学科研中常研究多个影响因素对结果变量为分类变量的关系或作用例冠心病与可能危险因素关系的研究冠心病结果危险因素结果记录有或无高血压史有或无高血脂史有或无吸烟有或无多元线性回归方程多元线性回归的要求变量的取值为连续性随机变量。与间关系为线性关系。