例解回归分析(原书•第5版)

例解回归分析(原书•第5版) pdf epub mobi txt 电子书 下载 2026

出版者:机械工业出版社
作者:Samprit Chatterjee
出品人:
页数:296
译者:郑忠国
出版时间:2013-8-1
价格:69.00元
装帧:
isbn号码:9787111431565
丛书系列:统计学精品译丛
图书标签:
  • 统计学
  • 回归分析
  • 数据分析
  • 统计
  • 回归
  • 例解回归分析
  • 数学
  • SPSS
  • 回归分析
  • 统计学
  • 数据分析
  • 计量经济学
  • 统计建模
  • 线性模型
  • 假设检验
  • 相关性分析
  • 应用统计
  • 统计推断
想要找书就要到 图书目录大全
立刻按 ctrl+D收藏本页
你会得到大惊喜!!

具体描述

“我们乐于向读者推荐本书,并建议大学教师将本书作为‘回归分析’课程的教材,尝试一种新的教学方法。”

——郑忠国(北京大学)

“总之,这本优秀的教材价值非凡,不断更新。书中通过大量精心设计的例子,向读者全面展示持久不衰的回归分析处理数据的技巧。毫无疑问,在统计教学中,这本书将一如既往地被经常采用。”

——国际统计评论

本书已在世界范围内畅销三十多年,被美国斯坦福大学、哥伦比亚大学、康奈尔大学、纽约大学以及加拿大麦克马斯特大学等众多名校采用为教材,曾被译成德语、日语等版本。内容涉及简单线性回归、多元线性回归、岭回归、逻辑斯谛回归、泊松回归、稳健回归、变量变换和变量选择等,既有传统的统计分析,也有一些不那么传统的统计分析,目标是挖掘数据内在的结构。本书强调的是数据分析的技巧,而不是统计理论的发展,采用丰富的实例,形象生动而又系统详尽地阐述了回归分析的基本理论和具体的应用技术。

作者几乎是手把手地指导读者做探索性数据分析,读者在学完后,会系统地掌握回归分析的各种技巧,并且能够融会贯通地处理自己所遇到的数据分析问题。因此,对于从事数据挖掘或数据分析的工作者来说,这本经典的教材也是指导他解决实际问题的案头佳作。

网站http://www.aucegypt.edu/faculty/hadi/RABE5提供了本教材中所有的数据以及配套的教师解答手册等资料。

深入浅出:现代数据科学中的统计推断与建模 本书聚焦于统计推断和线性模型构建的核心原理与实践应用,旨在为读者提供一套坚实的数据分析基础,无论您的背景是社会科学、经济学、生物统计学还是工程学。 本书摒弃了过于繁复的数学推导,转而强调概念的清晰阐释和实际操作中的理解,力求在严谨性和易读性之间取得完美的平衡。 --- 第一部分:统计推断的基石与探索性数据分析(EDA) 本部分是构建统计思维的起点。我们首先回顾了概率论和随机变量的基本概念,这些是理解任何统计模型的基础。重点在于抽样分布的概念——它如何将有限的样本信息桥接到对无限总体特性的推断上。 参数估计的艺术: 我们详细介绍了点估计和区间估计(置信区间)的方法。书中不仅展示了矩估计(Method of Moments, MoM)和最大似然估计(Maximum Likelihood Estimation, MLE)的内在逻辑,更重要的是,阐述了如何在实际数据集中选择合适的估计量。对于置信区间的构建,我们深入探讨了大样本近似与精确分布(如t分布、卡方分布)的应用场景,强调了假设检验的核心——如何利用P值和检验统计量做出合理的决策,并警惕多重比较带来的风险。 探索性数据分析(EDA)的必要性: 在进行任何正式建模之前,EDA是必不可少的步骤。本书强调通过可视化来揭示数据的内在结构、异常值和潜在的分布形态。我们探讨了单变量、双变量和多变量数据的可视化技术,例如箱线图、散点图矩阵、核密度估计(KDE)。此外,我们引入了稳健性度量的概念,教导读者如何使用中位数、四分位数间距而非仅依赖均值和标准差来描述数据,以应对现实世界中常见的离群点问题。 核心理念贯穿始终: 统计推断的本质是对不确定性的量化。我们通过大量的实例说明,报告一个估计值的同时,必须附带一个关于该估计值可靠程度的度量。 --- 第二部分:线性模型的核心——普通最小二乘法(OLS)的深度剖析 线性模型是应用统计学中最强大和最常用的工具之一。本部分将OLS回归模型作为核心,进行全面、深入的讲解。 模型设定与假设: 我们详尽阐述了经典线性模型(Classical Linear Model, CLM)的高斯-马尔可夫假设(高斯假设)。这不仅仅是教科书上的列表,而是理解OLS估计量(BLUE,最佳线性无偏估计)性质的理论基石。我们着重分析了每个假设的违背将如何影响估计的有效性和推断的有效性。 最小二乘法的几何解释: 为了帮助读者从直观上理解OLS,我们提供了几何投影的视角。这使得残差的最小化不再是一个代数过程,而是向量空间中的正交投影,极大地增强了对模型拟合过程的理解。 推断与模型诊断: 在拟合模型之后,推断是关键。我们详细讲解了如何解释回归系数的含义、如何构建系数的置信区间以及如何进行F检验和t检验。 更重要的是,本书投入大量篇幅讨论模型诊断。诊断的目的在于检验高斯假设是否成立。我们将重点放在: 1. 残差分析: 检验残差的独立性(自相关)、方差齐性(异方差性)和正态性。我们介绍了Durbin-Watson检验和Breusch-Pagan检验等工具。 2. 多重共线性: 识别并量化变量间高度相关性的影响,并介绍方差膨胀因子(VIF)作为诊断工具。 模型选择与应用: 我们探讨了如何选择最合适的自变量子集,介绍了逐步回归、前向选择、后向剔除等方法,并讨论了信息准则(如AIC和BIC)在模型比较中的作用,强调了在模型拟合度和模型复杂度之间进行权衡的重要性。 --- 第三部分:超越OLS——模型拓展与稳健方法 现实世界的数据往往不完美,OLS的强假设(特别是误差项的正态性和同方差性)经常被违反。本部分旨在为读者提供处理这些复杂情况的工具箱。 异方差性(Heteroskedasticity)的处理: 当误差的方差不恒定时,OLS估计量仍然无偏且一致,但标准误的估计将是错误的,导致推断失效。我们介绍了稳健标准误(如White/Huber-White标准误)的计算方法,以及加权最小二乘法(WLS),当异方差结构已知时,WLS如何恢复效率。 自相关(Autocorrelation)与时间序列回归: 针对面板数据或时间序列数据中常见的误差项相关性,我们介绍了修正标准误的策略,并探讨了诸如Cochrane-Orcutt等修正模型以提高估计的效率。 广义线性模型(GLM)导论: 线性模型假设响应变量是连续且误差正态分布的。本书扩展到处理非正态响应变量,如二元(Logit/Probit)和计数(Poisson)数据。我们详细讲解了链接函数和指数族分布的概念,这是理解GLM框架的关键。本书侧重于对Logit和Probit模型的系数进行边际效应的解释,而非直接解释系数本身,以确保结果的实际可解释性。 非参数方法与局部回归: 在模型设定风险过高时,非参数方法提供了替代方案。我们介绍了局部加权散点平滑(LOESS/LOWESS),展示了如何利用局部信息进行平滑和趋势估计,这对于初步探索非线性关系极为有效,为更复杂的非参数回归模型打下基础。 --- 第四部分:数据结构与高级建模考虑 本部分着眼于处理更复杂的数据结构和模型评估的精细化问题。 方差分析(ANOVA)与协方差分析(ANCOVA): 我们将ANOVA视为一种特殊的线性模型,其中因子变量被编码为虚拟变量(Dummy Variables)。重点在于理解交互作用项的含义及其在模型中的解释,这在实验设计和因果推断中至关重要。 模型比较与信息论: 如何在拥有多个拟合良好模型的选择中进行决策?我们深入比较了基于残差平方和的似然比检验、AIC、BIC以及调整的$R^2$。强调了惩罚复杂性的重要性,即避免过度拟合(Overfitting)的风险。 重采样方法简介: 作为现代统计学的有力补充,本书简要介绍了Bootstrap(自助法)的概念,说明了它如何提供一种无需依赖复杂解析分布的、强大的工具来估计统计量的抽样分布,尤其适用于标准方法难以处理的复杂统计量。 总结与实践导向: 全书在每个章节后都配备了详实的案例分析,这些案例取材于实际研究场景,涵盖了数据清洗、模型假设检验、结果解释和报告撰写全过程。本书致力于培养读者批判性地应用统计工具的能力,而非仅仅是机械地运行软件命令。读者将学会识别何时应用何种模型,以及如何清晰、负责任地报告其分析结果。

作者简介

Samprit Chatterjee 纽约大学Stern商学院荣休教授,国际数理统计学会、英国皇家统计学会、美国统计学会会士,1967年获哈佛大学博士学位。

Ali S. Hadi 康奈尔大学荣休教授,开罗美国大学特聘教授,国际统计学会会员,美国统计学会会士,多次荣获康奈尔大学的杰出教师奖项,还于2000年荣登美国教师名人录。

目录信息

中文版序
译者序
前言
第1章 概述1
1.1 什么是回归分析1
1.2 公用数据集1
1.3 回归分析应用实例选讲2
1.3.1 农业科学2
1.3.2 劳资关系3
1.3.3 政府5
1.3.4 历史8
1.3.5 环境科学8
1.3.6 工业生产9
1.3.7 挑战者号航天飞机11
1.3.8 医疗费用12
1.4 回归分析的步骤14
1.4.1 问题陈述14
1.4.2 选择相关变量15
1.4.3 收集数据15
1.4.4 模型设定16
1.4.5 拟合方法17
1.4.6 模型拟合18
1.4.7 模型评价和选择18
1.4.8 回归分析的目标19
1.5 本书的内容和结构20
习题21
第2章 简单线性回归22
2.1 引言22
2.2 协方差与相关系数22
2.3 实例:计算机维修数据26
2.4 简单线性回归模型27
2.5 参数估计28
2.6 假设检验30
2.7 置信区间34
2.8 预测34
2.9 拟合效果度量35
2.10 过原点的回归直线38
2.11 平凡的回归模型39
2.12 文献40
习题40
第3章 多元线性回归45
3.1 引言45
3.2 数据和模型的描述45
3.3 实例:主管人员业绩数据46
3.4 参数估计47
3.5 回归系数的解释48
3.6 中心化和规范化50
3.6.1 含截距模型的中心化和规范化50
3.6.2 无截距模型的规范化51
3.7 最小二乘估计的性质52
3.8 复相关系数53
3.9 单个回归系数的推断54
3.10 线性模型中的假设检验55
3.10.1 检验所有预测变量的回归系数为056
3.10.2 检验某些回归系数为058
3.10.3 检验某些回归系数相等60
3.10.4 带约束的回归参数的估计和检验61
3.11 预测62
3.12 小结63
习题63
附录 多元回归的矩阵表示69
第4章 回归诊断:违背模型假定的检测71
4.1 引言71
4.2 标准回归假定71
4.3 各种残差72
4.4 图形方法74
4.5 拟合模型前的图形76
4.5.1 一维图76
4.5.2 二维图77
4.5.3 旋转图78
4.5.4 动态图78
4.6 拟合模型后的图形79
4.7 检查线性和正态性假定的图形79
4.8 杠杆、强影响点和异常值80
4.8.1 响应变量的异常值81
4.8.2 预测变量中的异常值81
4.8.3 伪装和淹没问题82
4.9 观测影响的度量83
4.9.1 Cook距离84
4.9.2 Welsch-Kuh度量84
4.9.3 Hadi影响度量85
4.10 位势残差图86
4.11 如何处理异常点87
4.12 回归方程中变量的作用88
4.12.1 添加变量图88
4.12.2 残差加分量图88
4.13 添加一个预测变量的效应92
4.14 稳健回归92
习题93
第5章 定性预测变量97
5.1 引言97
5.2 薪水调查数据97
5.3 交互变量100
5.4 回归方程组:两个组的比较102
5.4.1 斜率和截距都不同的模型103
5.4.2 斜率相同但截距不同的模型107
5.4.3 截距相同但斜率不同的模型108
5.5 示性变量的其他应用109
5.6 季节性109
5.7 回归参数随时间的稳定性111
习题115
第6章 变量变换121
6.1 引言121
6.2 线性化变换122
6.3 X射线灭菌124
6.3.1 线性模型的不适用性125
6.3.2 对数变换实现线性化125
6.4 稳定方差的变换126
6.5 异方差误差的检测130
6.6 消除异方差性131
6.7 加权最小二乘132
6.8 数据的对数变换132
6.9 幂变换134
6.10 总结137
习题137
第7章 加权最小二乘法141
7.1 引言141
7.2 异方差模型142
7.2.1 主管人员数据142
7.2.2 大学教育花费数据143
7.3 两阶段估计144
7.4 教育费用数据145
7.5 拟合剂量反应关系曲线151
习题152
第8章 相关误差问题153
8.1 引言:自相关153
8.2 消费支出和货币存量153
8.3 Durbin-Watson统计量155
8.4 利用变换消除自相关性157
8.5 当回归模型具有自相关误差时的迭代估计法158
8.6 变量的缺失和模型的自相关性159
8.7 住房开工规模的分析160
8.8 Durbin-Watson统计量的局限性162
8.9 用示性变量消除季节效应164
8.10 两个时间序列之间的回归166
习题167
第9章 共线性数据分析171
9.1 引言171
9.2 共线性对推断的影响172
9.3 共线性对预测的影响176
9.4 共线性的检测178
9.4.1 共线性的简单征兆179
9.4.2 方差膨胀因子182
9.4.3 条件指数184
习题186
第10章 共线性数据的处理189
10.1 引言189
10.2 主成分189
10.3 利用主成分的计算192
10.4 施加约束条件194
10.5 搜索模型中回归系数的线性函数195
10.6 回归系数的有偏估计198
10.7 主成分回归199
10.8 消除数据中的共线性200
10.9 回归系数的约束条件202
10.10 主成分回归中的注意事项203
10.11 岭回归205
10.12 岭估计法206
10.13 岭回归:几点注解209
10.14 小结210
10.15 文献210
习题211
附录10.A 主成分214
附录10.B 岭回归216
附录10.C 代理岭回归218
第11章 变量选择219
11.1 引言219
11.2 问题的陈述219
11.3 删除变量的后果220
11.4 回归方程的用途221
11.4.1 描述和建模221
11.4.2 估计和预测221
11.4.3 控制221
11.5 评价回归方程的准则222
11.5.1 残差均方222
11.5.2 Mallows的Cp准则223
11.5.3 信息准则223
11.6 共线性和变量选择224
11.7 评价所有可能的回归模型225
11.8 变量选择方法225
11.8.1 前向选择方法226
11.8.2 后向剔除方法226
11.8.3 逐步回归法226
11.9 变量选择的一般注意事项227
11.10 对主管人员业绩的研究227
11.11 共线性数据的变量选择231
11.12 凶杀数据231
11.13 利用岭回归进行变量选择234
11.14 空气污染研究中的变量选择234
11.15 拟合回归模型的可能策略243
11.16 文献244
习题244
附录 误设模型的影响247
第12章 逻辑斯谛回归249
12.1 引言249
12.2 定性数据的建模249
12.3 Logit模型250
12.4 例子:破产概率的估计251
12.5 逻辑斯谛回归模型诊断254
12.6 决定变量的去留255
12.7 逻辑斯谛回归的拟合度257
12.8 多项Logit模型258
12.8.1 多项逻辑斯谛回归259
12.8.2 例子:确定化学糖尿病259
12.8.3 顺序值逻辑斯谛回归263
12.8.4 例子:重新考察化学糖尿病的确定问题264
12.9 分类问题:另一种方法264
习题266
第13章 进一步的论题268
13.1 引言268
13.2 广义线性模型268
13.3 泊松回归模型269
13.4 引进新药269
13.5 稳健回归270
13.6 拟合一个二次式模型271
13.7 美国海湾中PCB的分布272
习题275
附录A 统计表276
参考文献283
索引291
· · · · · · (收起)

读后感

评分

评分

评分

评分

评分

用户评价

评分

泛泛而谈

评分

为了考前梳理知识点,用了三四天时间大致读了一遍。这本书的存在很尴尬,读者读这本书基本无法触及到理论,而从应用的层次,这本书完全没有和任何一种软件对接。。

评分

泛泛而谈

评分

太尴尬了……学院决定这本教材……然后一群人上手r语言,结果期末考试依旧不得不回归人大和那本神奇的黄书!

评分

讲得比较基础,但是分成一个个例子来说,有点散。一本……比较鸡肋,适合查阅的书?

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2026 book.wenda123.org All Rights Reserved. 图书目录大全 版权所有