SAS技术内幕 pdf epub mobi txt 电子书下载 2026

简体网页||繁体网页

☆☆☆☆☆

出版者:清华大学出版社

作者:巫银良

出品人:

页数:0

译者:

出版时间:2018-12-1

价格:168

装帧:平装

isbn号码:9787302502784

丛书系列:

图书标签:

SAS技术内幕：从程序员到数据科学家
魔幻现实主义
霍乱时期的爱情
爱情
外国文学
加西亚·马尔克斯
SAS
数据分析
统计
编程
数据挖掘
宏语言
SQL
ETL
数据处理
技术内幕

下载链接在页面底部

facebook linkedin mastodon messenger pinterest reddit telegram twitter viber vkontakte whatsapp 复制链接

想要找书就要到图书目录大全

book.wenda123.org

立刻按 ctrl+D收藏本页

你会得到大惊喜!!

具体描述

本书共27章，分为上下两卷：上卷介绍SAS编程基础与使用方法，是广大程序员快速掌握SAS编程技术的简明开发教程；下卷阐述数据分析的关键基础知识并提供相应SAS代码实现，目的是激发读者兴趣，跨越传统编程与数据分析的鸿沟，从程序员华丽转身为数据科学家。书中演示代码力图简洁清晰地解释相关概念，追求大道至简。本书兼顾编程技术与数据分析，期许程序员、信息处理与统计分析人员以及对数据分析科学感兴趣的读者都能从本书中获益良多，循序渐进地掌握数据分析的要义和精髓，从数据中获取洞见与智慧。

作者简介

主要负责SAS中国研发中心大数据与可视化分析技术，可视化数据挖掘与机器学习，商业智能和移动应用等产品线的项目管理。

毕业于北京大学，获理学学士和硕士学位。拥有近20年计算机行业研发和管理经验，在企业应用和商业分析领域有深厚的技术功底。专注于研发管理和项目实践，涉及领域包括人工智能，大数据与可视化分析，金融量化分析与自动交易，商业智能与互联网，大型商业软件研发管理等。

目录信息

上卷
第1章 SAS语言入门 002
1.1　语言概述 005
1.2　编程环境 010
1.3 SAS Studio编程 016
第2章数据集与DATA步 032
2.1　SAS 逻辑库 032
2.2　SAS 数据集 036
2.3　DATA 步 041
2.3.1　内嵌数据行或外部数据文件 043
2.3.2　通过已有 SAS 数据集生成 048
2.3.3 通过 PROC IMPORT 或 PROC SQL 生成 051
2.4　DATA 步的运行机制 054
2.4.1　编译阶段 055
2.4.2　运行阶段 056
2.5　DATA 步语句快速索引 057
第3章变量与表达式 062
3.1　常量与变量 062
3.1.1　变量长度与缺失值 063
3.1.2　数值常量 065
3.1.3　日期/时间/日期时间常量 067
3.1.4　字符常量 067
3.2　表达式 068
3.2.1　运算符 068
3.2.2　运算符优先顺序 072
3.2.3　WHERE 语句特定运算符 072
3.2.4　赋值语句 073
3.2.5　累加赋值语句 074
3.2.6　RETAIN 语句 075
3.3 SAS数组 077
3.3.1　数组名称 079
3.3.2 数组元素变量列表 079
3.3.3　数组长度 080
3.3.4　隐式下标变量 080
3.3.5　多维数组 081
3.3.6　临时数组 082
3.3.7　数组排序 083
3.3.8　注意事项 084
第4章流程控制 087
4.1　DO-END语句块 087
4.2　分支控制 088
4.2.1　IF-THEN 分支控制 088
4.2.2　ELSE-IF 多分支控制 090
4.2.3　SELECT-WHEN 多分支控制 090
4.3　循环控制 091
4.3.1　指定次数的循环：DO-TO-BY 091
4.3.2　指定条件的循环：DO-WHILE 与 DO-UNTIL092
4.3.3　指定集合的循环：DO-OVER 093
4.4　特殊的流程控制语句 094
4.4.1　跳出循环语句：LEAVE 094
4.4.2 继续循环语句：CONTINUE 094
4.4.3　返回语句：RETURN 095
4.4.4　中止执行语句：STOP 与 ABORT 095
4.4.5　跳转语句：GOTO 与 LINK 096
第 5章函数封装 099
5.1　LINK-RETURN 技术 101
5.2　SAS宏函数封装 103
5.3　FCMP函数 105
5.4　系统函数速查 110
第6章 SAS宏 113
6.1　宏变量 114
6.1.1　命名 114
6.1.2　作用域 114
6.1.3　系统宏 115
6.1.4　宏代码调试 117
6.1.5　宏表达式 117
6.2　宏函数 119
6.3　逻辑控制 121
6.3.1　宏语句块 121
6.3.2　条件分支 121
6.3.3　循环控制 121
6.4　系统宏函数 122
第7章 DS2 124
7.1　程序结构 126
7.1.1　变量声明与类型 126
7.1.2　程序实体作用域 129
7.1.3　变量数组与标准数组 130
7.1.4　系统方法与用户自定义方法 131
7.2　数据程序 136
7.3　包程序 137
7.4　线程程序 143
第8章代码组织 149
8.1　静态文件包含 149
8.2　程序中动态扩展代码 151
8.3　动态执行外部命令 153
第9章文件读写 157
9.1　二进制文件读写 157
9.2　文本文件读写 159
9.3　顺序读取多个文件 162
9.4　并行读取多个文件 165
9.5　共享缓冲区读写 166
第10章按位运算 168
10.1　按位运算 168
10.2　实现方法 169
10.3　按位运算应用 173
第11章扩展SAS功能 177
11.1　通过 Module调用外部 DLL函数 177
11.2　用 C 语言开发用户函数库 182
11.2.1　准备64位 C 编译环境 182
11.2.2　开发用户自定义动态库 183
11.3　PROTO 编写 C 代码或注册外部 DLL 184
第12章数据结构——数组 187
12.1　数组 187
12.1.1　DATA步数组 187
12.1.2　FCMP 数组 189
12.1.3　DS2 数组 192
12.1.4　SAS宏数组 193
12.2 数组应用：高精度数值计算 194
第13章数据结构——队列与堆栈 196
13.1　队列 196
13.1.1　函数版实现与示例 196
13.1.2　宏版实现与示例 199
13.2　堆栈，函数版实现与示例 202
第14章数据结构——链表 206
14.1　基础知识 206
14.2　如何在 SAS 代码中内嵌 C 语言代码 207
14.3　单向链表和双向链表 209
14.4　链表应用：约瑟夫斯问题 216
第15章数据结构——二叉树 221
15.1　PROTO 实现与封装 221
15.2　FCMP二叉树实现 227
15.3　二叉树应用：算术表达式求值 231
第16章数据结构——矩阵运算 235
16.1　FCMP 矩阵运算 236
16.2　DS2 矩阵运算 243
16.3　矩阵应用：线性方程组求解 246
16.4　矩阵应用：非线性方程组求解 248
第17章数据结构——图 255
17.1　深度优先和广度优先遍历 256
17.2　最短路径问题 260
17.2.1　Dijkstra算法 261
17.2.2　Bellman-Ford 算法 263
17.2.3　Floyd-Warshall 算法 265
下卷
第18章统计学基础 270
18.1　数据特征度量 270
18.1.1　集中趋势度量 272
18.1.2　离散趋势度量 274
18.1.3　分布特征度量 277
18.1.4　置信区间、置信水平与 p-值 279
18.2　统计学上的变量类型 280
18.3　基本数据处理 283
18.3.1　排序与排名 284
18.3.2　数据转置 285
18.3.3　堆叠与拆分 286
18.3.4　过滤数据 287
18.3.5　随机抽样 289
18.3.6 基本统计量 290
18.4　基本图形图表 292
18.5　SAS 产品与过程步概览 303
18.5.1　SAS核心产品功能简介 305
18.5.2　Base SAS 过程步速查 309
18.5.3 SAS/STAT过程步速查 318
第19章大数定律与中心极限定理 327
19.1　大数定律 327
19.1.1　弱大数定律 327
19.1.2　三种大数定律 329
19.1.3　图形化证明 330
19.1.4　强大数定律 333
19.2　中心极限定理 334
19.2.1　大数定律与中心极限定理关系 335
19.2.2　图形化证明 336
19.2.3　实际用途 340
第20章统计分布 342
20.1　均匀分布 342
20.2　离散型统计分布 345
20.2.1　伯努利分布 345
20.2.2　二项分布 347
20.2.3　几何分布 353
20.2.4　负二项分布 357
20.2.5　超几何分布 360
20.2.6　泊松分布 362
20.3　连续型统计分布 365
20.3.1　正态分布 365
20.3.2　对数正态分布 373
20.3.3　指数分布 376
20.3.4　卡方分布 379
20.3.5　学生t-分布 381
20.3.6　F分布 387
20.3.7　柯西分布 390
20.3.8　贝塔分布 392
20.3.9　伽马分布 395
20.3.10　爱尔朗分布 397
20.3.11　韦布尔分布 399
20.3.12　三角分布 400
20.3.13　Table 分布 401
附录：各统计分布之间的关系 403
第21章方差分析 404
21.1　假设检验 404
21.2　方差分析 406
21.2.1　学生t-检验 406
21.2.2　单因子方差分析 408
21.2.3　双因子方差分析 418
第22章数据标准化 421
22.1　常用标准化方法 421
22.2　SAS数据标准化 424
22.3　自定义数据标准化 429
第23章主成分分析与因子分析 433
23.1　主成分分析 434
23.1.1　主成分分析原理 435
23.1.2　主成分分析的具体步骤 436
23.2　因子分析 443
23.2.1　因子分析原理 443
23.2.2　巴特利球度检验和 KMO 检验 443
23.2.3　因子分析的具体步骤 445
第24章相关分析与回归分析 450
24.1　变量关系 450
24.2　相关分析 451
24.2.1　线性相关性度量 451
24.2.2　非参数关联度量 452
24.2.3　定量数据的相关分析 455
24.2.4　类别数据的相关分析 457
24.3　回归分析 460
第25章聚类分析 467
25.1　聚类度量 469
25.1.1　距离系数 469
25.1.2　相似性/相关系数 471
25.1.3　SAS实践 473
25.2　聚类形成方法 475
25.2.1　一次形成分类系统 475
25.2.2　K-均值聚类 477
25.2.3　逐步形成分类系统 485
25.2.4　R 型聚类分析 491
25.3　自己实现聚类算法 494
25.3.1　K-均值方法 494
25.3.2　逐步形成分类系统 501
附录：聚类度量的自定义实现 509
第26章神经网络 512
26.1　神经元模型 513
26.2　神经网络 517
26.2.1　训练神经网络 519
26.2.2　反向传播算法 519
26.3　SAS 代码实现与范例 524
第27 章 π高精度求解与探索分析 536
27.1　π值计算 537
27.1.1　蒙特卡罗方法 543
27.1.2　蒲丰投针方法 544
27.1.3　微积分方法 545
27.1.4　幂级数方法 546
27.1.5　幂级数高精度方法 548
27.1.6　梅钦类公式高精度方法 550
27.1.7　迭代方法——贝拉公式 554
27.2　π值分析 557
27.2.1　数字分布规律 558
27.2.2　可视化探索 561
附录 564

参考文献 598
· · · · · · (收起)

读后感

评分☆☆☆☆☆

用户评价

评分☆☆☆☆☆

《构建稳健的数据库系统》这本书，对我这种习惯了云服务提供的“一键托管”环境的开发者来说，提供了一次极其宝贵的“回溯本源”的机会。它没有过多地介绍MySQL或PostgreSQL的CRUD操作，而是聚焦于**事务的ACID特性在分布式系统中的保证、锁机制的粒度控制，以及日志写入（WAL）对数据恢复的决定性作用**。作者用清晰的结构将复杂的并发控制问题拆解开来，让我明白了为什么在数据一致性要求极高的金融场景中，简单的“读写分离”是远远不够的。书中关于**两阶段提交协议（2PC）的优缺点分析**，以及如何通过Paxos或Raft协议来构建高可用集群的原理阐述，是我在其他任何教材中都未曾见过的系统性讲解。这本书的价值在于，它让你从一个“使用者”蜕变成一个有能力“设计”和“调优”数据存储层的工程师，是系统架构师的必备参考。

评分☆☆☆☆☆

这本《深入探索数据科学：从理论到实践》简直是为我量身定做的一本宝典！我之前对数据科学的认识还停留在一些皮毛的理论层面，读完这本书后，感觉像是进入了一个全新的世界。作者非常巧妙地将复杂的统计学概念和机器学习算法，用非常生动易懂的语言娓娓道来。特别是关于**正则化技术**那一章，讲解得极其透彻，不仅仅是公式的堆砌，更重要的是解释了为什么需要它，以及在不同场景下如何选择最合适的参数。书中的案例研究也十分贴近现实，我尝试着跟着书中的步骤，亲手复现了几个金融风控模型的构建过程，那种茅塞顿开的感觉，是看再多网上的零散教程也无法比拟的。它没有那种高高在上的学术腔调，而是以一个经验丰富的导师的口吻，引导你一步步攻克难关。如果你是那种既想了解背后的数学原理，又迫切希望能在工作中快速应用新技术的实践者，这本书绝对不容错过。它真正做到了理论深度与工程实战的完美结合，让我对如何从海量数据中提炼出商业价值有了更清晰的路线图。

评分☆☆☆☆☆

对于那些渴望深入理解**深度学习模型底层机制**的硬核玩家，《神经网络架构解析》无疑是一剂强心剂。这本书的难度系数较高，对读者具备一定的微积分和线性代数基础有要求，但这正是它的价值所在。它没有满足于提供现成的TensorFlow或PyTorch调用接口，而是将精力集中在**反向传播算法的细节推导、卷积层的权重共享机制，以及Transformer模型中自注意力机制的数学原理**上。我特别喜欢它对不同优化器（如SGD、AdamW）在损失曲面上的实际行为差异所做的仿真对比，这种直观的展示远胜于枯燥的公式推导。这本书的作者显然是亲自站在一线与模型搏斗过的专家，他关注的都是那些在实际训练中常常导致模型收敛失败的“小细节”。这本书需要时间去消化、去推演，但每攻克一个难点，都会带来巨大的成就感和对模型更深一层的掌控力。

评分☆☆☆☆☆

如果用一个词来形容《可视化叙事的力量》，我会选择“启发”。我一直认为数据可视化就是把图表画出来，但这本书彻底颠覆了我的认知。它将焦点从“绘制”转移到了“沟通”上。作者通过分析大量经典的可视化作品，详细剖析了**色彩心理学在图表设计中的应用**，以及如何利用叙事结构（比如时间序列的起承转合）来引导读者的注意力，从而达到有效传达信息甚至影响决策的目的。书中关于“避免误导性图表”的章节尤其尖锐和深刻，列举了许多常见的陷阱，比如不恰当的坐标轴截断、维度混淆等，让我汗颜之余，也立刻检查了自己过去做的所有报告。这本书更像是艺术与逻辑的交汇点，它要求我们不仅是数据的忠实呈现者，更要是数据的出色翻译官。读完后，我开始对每一个柱状图、每一个散点图背后的“意图”进行更深层次的思考，极大地提升了我的报告说服力。

评分☆☆☆☆☆

说实话，刚翻开《Python数据分析实战指南》的时候，我还有点担心内容会过于偏向某个特定的库而显得不够全面，但事实证明我的顾虑完全是多余的。这本书的广度和深度都超乎我的想象。它并没有像一些入门书籍那样只停留在Pandas的基本操作层面，而是深入到了**高级索引、性能优化，甚至是并行计算**的应用。最让我印象深刻的是，书中花了大量篇幅讲解了如何使用`Dask`来处理内存无法容纳的大型数据集，这对于我们处理TB级别的数据流来说，简直是雪中送炭。作者在代码示例的选择上也非常用心，每一个代码块都是经过精心设计的，不仅仅是展示功能，更重要的是展示了“最佳实践”。阅读过程中，我经常会暂停下来，思考书中的代码结构和命名规范，这极大地提升了我个人的代码质量。对于有一定Python基础，想将数据处理能力提升到工业级水平的工程师来说，这本书就是一本不可多得的“代码优化圣经”。它教会我的不只是“如何做”，更是“如何做得更好”。

评分☆☆☆☆☆