SAS编程与数据挖掘商业案例

SAS编程与数据挖掘商业案例 pdf epub mobi txt 电子书 下载 2026

出版者:机械工业出版社
作者:姚志勇
出品人:
页数:345
译者:
出版时间:2010-5
价格:42.00元
装帧:
isbn号码:9787111305354
丛书系列:
图书标签:
  • SAS
  • 数据挖掘
  • 数据分析
  • 商业应用
  • 统计
  • 统计学
  • DataMining
  • 数据库
  • SAS编程
  • 数据挖掘
  • 商业分析
  • 数据分析
  • 统计建模
  • 案例分析
  • 商业案例
  • 数据科学
  • 机器学习
  • 预测分析
想要找书就要到 图书目录大全
立刻按 ctrl+D收藏本页
你会得到大惊喜!!

具体描述

《SAS编程与数据挖掘商业案例》是作者多年来在企业实践工作中的经验总结,详细讲解了使用SAS进行商业数据挖掘的方法。其中包含了目前公开出版的诸多SAS教材没有的大量实战内容。《SAS编程与数据挖掘商业案例》内容全面、新颖独创、综合性强,适合企业人员使用,也可作为数学、统计学、金融、电子商务、医药等专业的本科生、硕士生学习SAS编程和数据挖掘的参考资料。

深度学习与高维数据分析:从理论到实践 本书聚焦于现代数据科学领域中最具挑战性和前沿性的两大主题:深度学习模型的构建与优化,以及高维统计数据的有效处理与解释。它旨在为具备一定编程基础和统计学常识的读者提供一个全面、深入、且极具实战价值的知识体系,帮助他们驾驭海量、复杂的数据集,并在实际商业和科研场景中取得突破性进展。 --- 第一部分:深度学习的基石与前沿架构(Foundation and Frontier Architectures of Deep Learning) 本部分将数据驱动的决策核心——深度学习,从其数学原理到实际应用框架进行细致解构。我们强调对核心概念的透彻理解,而非仅仅停留在调用API的层面。 第一章:神经网络的数学本质与优化算法 本章从最基础的神经元模型开始,追溯至多层感知机(MLP)的结构。我们将详细探讨激活函数(如ReLU、Sigmoid、Tanh)的选择对梯度流动的影响,并深入分析反向传播(Backpropagation)算法的精确推导过程,揭示其计算效率的来源。 优化器深度剖析: 摒弃对标准随机梯度下降(SGD)的简单介绍,本书着重比较和分析Momentum、AdaGrad、RMSProp以及近年来主导业界的Adam和Nadam优化器的收敛特性、步长自适应机制及其在不同损失函数下的表现差异。 正则化技术的高级应用: 不仅涵盖Dropout和L1/L2正则化,更探讨了批量归一化(Batch Normalization)和层归一化(Layer Normalization)在解决内部协变量偏移(Internal Covariate Shift)方面的作用,以及它们对模型训练速度和泛化能力的影响。 第二章:卷积神经网络(CNN)的精细化解读 CNN是处理图像、序列化网格数据的核心工具。本章不仅涵盖经典的LeNet、AlexNet、VGG、ResNet和Inception等架构,更侧重于理解这些设计的内在动机。 空间层次化特征提取: 分析卷积核(Kernel)如何在不同层级捕获从边缘、纹理到复杂语义的特征。 残差连接与梯度回传: 详细阐述ResNet中的“跳跃连接”(Skip Connection)如何有效缓解深层网络中的梯度消失问题,并讨论DenseNet中特征复用的优势。 高效模型设计: 介绍如MobileNet中的深度可分离卷积(Depthwise Separable Convolution)等轻量化技术,探讨如何在保持高性能的同时,显著降低模型的计算复杂度和内存占用。 第三章:循环神经网络(RNN)与序列建模的范式转变 序列数据处理是自然语言处理(NLP)、时间序列分析的关键。本章将系统介绍RNN的演化历程。 长短期记忆网络(LSTM)与门控循环单元(GRU): 深入解析输入门、遗忘门、输出门的工作机制,理解它们如何解决标准RNN中的长期依赖问题。 注意力机制的兴起: 引入自注意力(Self-Attention)的概念,解释其如何允许模型在处理序列时动态地权衡不同位置信息的重要性,为Transformer架构奠定基础。 Transformer架构的完整解析: 详尽分解Encoder-Decoder结构、多头注意力(Multi-Head Attention)的并行计算优势,以及位置编码(Positional Encoding)的必要性,展示其如何彻底革新序列建模领域。 --- 第二部分:高维数据处理与统计推断(High-Dimensional Data Processing and Statistical Inference) 当数据维度(特征数量)远超样本数量时,传统统计方法失效。本部分专注于处理这类“大p、小n”问题的现代技术。 第四章:高维统计的理论瓶颈与降维艺术 本章探讨了在高维空间中模型不适定的原因,并引入降维技术作为解决之道。 主成分分析(PCA)的局限性与核PCA: 讨论标准PCA在非线性数据结构面前的表现,并介绍核方法如何将数据映射到更高维空间进行线性分离。 流形学习: 深入讲解Isomap、LLE(Locally Linear Embedding)等技术,侧重于它们如何保留数据内在的拓扑结构和局部几何信息,以实现更具解释性的低维嵌入。 第五章:稀疏性驱动的维度选择与模型估计 在高维数据中,我们通常假设只有少数特征对结果具有实质性影响。本章集中于稀疏性约束下的模型构建。 LASSO及其衍生方法: 详细推导L1正则化项如何强制模型系数趋向于零,实现特征选择。比较Group LASSO、Elastic Net在处理特征组相关性时的优势。 贝叶斯稀疏建模: 探讨使用贝叶斯框架(如Dirichlet先验)来自然地实现模型稀疏性的方法,并对比其与频率派方法的哲学差异和实际效果。 第六章:深度模型的可解释性(XAI)与因果推断 随着模型复杂度的提升,理解“为什么”变得比预测“是什么”更为关键。本部分将模型预测与可解释性、因果关系建立连接。 局部解释工具箱: 详细介绍LIME(Local Interpretable Model-agnostic Explanations)和SHAP(SHapley Additive exPlanations)的计算原理。重点分析SHAP值如何基于博弈论的Shapley值,提供公平的特征贡献度分配。 模型无关的敏感性分析: 探讨Permutation Feature Importance(置换特征重要性)在评估特征对模型性能的全局影响中的可靠性与局限性。 面向因果的推断: 简要介绍如何利用深度学习模型(如Causal Forests或双重稳健估计器)来估计处理效应(Treatment Effect),超越相关性,尝试量化干预措施的真实影响。 --- 第三部分:工程实现与性能优化(Engineering Implementation and Performance Tuning) 本书的最后一部分将理论与实践紧密结合,专注于如何高效、可靠地部署和维护复杂模型。 第七章:大规模数据加载与GPU加速策略 高性能计算是深度学习的生命线。本章关注数据I/O和并行计算的优化。 高效数据管道构建: 探讨使用`tf.data`或PyTorch的`DataLoader`进行异步数据预取(Prefetching)和并行数据加载,避免CPU成为训练瓶颈。 分布式训练策略: 介绍数据并行(Data Parallelism)和模型并行(Model Parallelism)的实现框架,以及Parameter Server架构和All-Reduce通信机制在多GPU或多节点训练中的应用。 第八章:模型部署、监控与持续学习 一个模型只有被部署并稳定运行才能创造价值。本章覆盖模型生命周期的最后阶段。 模型序列化与服务化: 使用ONNX等标准格式进行模型交换,并探讨使用TensorFlow Serving或TorchServe进行高吞吐量推理部署的架构选择。 漂移检测与模型再训练: 详细分析概念漂移(Concept Drift)和数据漂移(Data Drift)的检测指标,并阐述MaaS(Model-as-a-Service)架构中如何设计自动化的模型监控和触发再训练的流程,确保模型长期有效性。 本书的结构设计确保读者不仅能理解最先进的算法,更能掌握如何将这些复杂工具转化为可扩展、可解释且高性能的工业级解决方案。

作者简介

目录信息

出版说明
前言
第1章 SAS系统简介
1.1 系统简介
1.1.1 SAS系统与商务智能系统
1.1.2 SAS系统与其他数据库的数据交换
1.1.3 SAS语言与SAS系统
1.1.4 SAS9浏览窗口简介
1.2 一个简单的编程实例
1.2.1 编写一个SAS程序
1.2.2 提交一个SAS程序
1.2.3 保存和打开一个SAS程序
1.3 DATA步的数据指针和PDV流程
1.3.1 数据指针和PDV流程
1.3.2 DATA步执行次数
第2章 SAS编程基础
2.1 SAS逻辑库
2.1.1 创建SAS逻辑库
2.1.2 删除SAS逻辑库
2.1.3 永久逻辑库和临时逻辑库
2.2 SAS数据集
2.2.1 SAS数据集命名规则
2.2.2 永久SAS数据集和临时SAS数据集
2.2.3 SAS数据集结构
2.2.4 SAS数据集形式
2.3 SAS索引
2.3.1 创建索引
2.3.2 删除索引
2.4 SAS目录
2.5 数据字典
2.6 SAS变量
2.6.1 变量属性
2.6.2 变量列表
2.6.3 自动变量
第3章 数据获取与数据集操作
3.1 数据获取
3.1.1 LIBNAME方式
3.1.2 PASSTHROUGH方式
3.1.3 IMPORT方式
3.1.4 INPUT方式
3.2 SET语句
3.2.1 语法说明
3.2.2 实例详解
3.2.3 商业实践
3.3 BY语句
3.3.1 语法说明
3.3.2 实例详解
3.4 MERGE语句
3.4.1 语法说明
3.4.2 实例详解
3.5 UPDATE语句
3.5.1 语法说明
3.5.2 实例详解
3.6 MODIFY语句
3.6.1 语法说明
3.6.2 实例详解
3.6.3 商业实践
3.7 PUT语句
3.7.1 语法说明
3.7.2 实例详解
3.7.3 商业实践
3.8 FILE语句
3.8.1 语法说明
3.8.2 实例详解
3.8.3 商业实践
3.9 1INFLE语句
3.9.1 语法说明
3.9.2 实例详解
3.9.3 商业实践
第4章 SAS变量操作
4.1 赋值语句和累加语句
4.1.1 赋值语句
4.1.2 累加语句
4.2 KEEP语句和DROP语句
4.2.1 KEEP语句
4.2.2 DROP语句
4.3 IRETAIN语句
4.3.1 语法说明
4.3.2 实例详解
4.3.3 商业实践
4.4 ARRAY语句
4.4.1 语法说明
4.4.2 实例详解
4.4.3 商业实践
4.5 其他语句
4.5.1 RENAME语句
4.5.2 LENGTH语句
4.5.3 LABEI。语句
第5章 SAS观测值操作
5.1 OUTPUT语句
5.1.1 语法说明
5.1.2 实例详解
5.2 子集IF语句
5.2.1 语法说明
5.2.2 实例详解
5.2.3 子集IF与OUTPUT语句比较
5.3 WHERE语句
5.3.1 语法说明
5.3.2 实例详解
5.3.3 子集IF与WIIERE语句比较
5.4 REPLACE语句和REMOVE语句
5.4.1 REPLACE语句
5.4.2 REMOVE语句
5.4.3 REPLACE、REM0vE与OUTPUT应用
5.5 DELETE语句与STOP语句
5.5.1 DELETE语句
5.5.2 STOP语句
第6章 SAS数据集管理
6.1 APPEND过程
6.1.1 语法说明
6.1.2 实例详解
6.2 SORT过程
6.2.1 语法说明
6.2.2 实例详解
6.2.3 商业实践
6.3 TRANSPOSE过程
6.3.1 语法说明
6.3.2 实例详解
6.4 CONTENTS过程
6.4.1 语法说明
6.4.2 实例详解
6.5 DATASETS过程
6.5.1 语法说明
6.5.2 实例详解
第7章 DAIA步循环与控制
7.1 IF.THEN/ELSE语句与SELECT语句
7.1.1 lF.THEN/ELSE语句
7.1.2 SELECT语句
7.2 DO语句
7.2.1 D0组语句
7.2.2 D0循环语句
7.2.3 DOWHILE语句
7.2.4 DOUNTIL语句
7.2.5 DOOVER语句
7.2.6 商业实践
7.3 各种控制语句
7.3.1 GOT0语句
7.3.2 CONTINUE语句与LEAVE语句
7.3.3 RETIJRN语句
第8章 常用全程语句
8.1 COMMENT语句
8.2 X语句
8.3 FILENAME语句
8.4 %INCLUDE语句
8.5 TITLE语句
8.6 FOOTNOTE语句
第9章 输出控制
9.1 LOG窗口输出控制
9.2 OUTPUT窗口输出控制
9.3 常用ODS输出控制
9.3.1 ODSLISTING
9.3.2 ODSRESUTS
9.3.3 ODSTRACE
9.3.4 ODS0UTPUT
9.3.5 ODSHTML
9.3.6 ODSCSVALL
9.3.7 ODSSELECT
9.3.8 ODSEXCLUDE
第10章 SAS宏变量
10.1 宏运行的内在机制
10.2 宏变量
10.2.1 定义宏变量
10.2.2 显示宏变量
10.2.3 引用宏变量
10.3 宏程序
10.3.1 定义宏
10.3.2 调用宏
10.3.3 宏内宏
10.3.4 宏存储
10.4 宏参数
10.4.1 创建参数
10.4.2 参数赋值
10.5 宏函数
10.5.1 通配函数
10.5.2 计算函数
10.5.3 字符函数
10.5.4 引用函数
10.6 宏语句
10.6.1 %IF.%TIIEN/%ELSE语句
10.6.2 %DO组语句
10.6.3 %DO循环语句
10.6.4 %DO%WHILE循环语句
10.6.5 %D0%UNTIL循环语句
10.7 宏应用
10.7.1 创建宏变量的八种方法
10.7.2 宏程序一般应用
10.7.3 宏程序高级应用
第11章 SQL过程
11.1 单表操作
11.2 多表操作
11.2.1 多表关联
11.2.2 子查询
11.2.3 合并查询
11.2.4 MERGE与SQL比较
11.3 创建、更新与删除表操作
11.3.1 创建表
11.3.2 行操作
11.3.3 列操作
11.3.4.删除表
11.4 使用SQL注意的几个问题
第12章 数据处理实践
12.1 随机抽样
12.1.1 简单无重复随机抽样
12.1.2 分层等比例随机抽样
12.1.3 分层不等比例随机抽样
12.1.4 随机抽样MACRO
12.2 HASH对象
12.2.1 HASH对象的引例
12.2.2 HASH对象的语法
12.2.3 HITER对象的引例
12.2.4 HITER对象的语法
12.2.5 商业实践
12.3 FORMAT综述
12.3.1 PROC步创建
12.3.2 DATA步创建
12.3.3 永久存储及调用
12.4 正则表达式
12.4.1 语法说明
12.4.2 常用函数
12.4.3 实例详解
12.5 宏在SAS与Excel转换中的应用
12.5.1 SAS数据集转换成Excel
12.5.2 Excel转换成SAS数据集
第13章 数据挖掘概念、任务和流程
13.1 数据挖掘概念
13.2 数据挖掘任务
13.3 数据挖掘流程
13.3.1 定义商业目标
13.3.2 编制需求文档
13.3.3 选择数据源
13.3.4 建模流程图
13.4 LOGISTIC建模及结果详解
13.4.1 数学模型
13.4.2 参数估计
13.4.3 模型评价指标
13.4.4 回归系数
13.4.5 变量筛选方法
13.4.6 应用举例及输出结果详解
13.4.7 多值LOGISTIC模型
第14章 响应模型:定位新客户
14.1 前期准备
14.1.1 商业需求
14.1.2 定义目标
14.1.3 选择变量
14.2 数据获取与数据处理
14.2.1 创建建模数据集
14.2.2 变量首次筛选
14.2.3 数据探索
14.2.4 数据清洗
14.2.5 变量二次筛选
14.2.6 变量三次筛选
14.2.7 字符变量压缩
14.3 模型开发
14.3.1 全模型法选择所有候选模型
14.3.2 逐步回归法筛选候选模型
14.3.3 创建两个重要数据集
14.3.4 创建LIFT图
14.3.5 创建评分卡文件
14.4 模型验证
14.4.1 评分卡文件导入
14.4.2 LIFT图比较
14.4.3 模型确认
14.5 模型实施与监控
14.5.1 模型实施
14.5.2 模型监控
14.6 小结
第15章 行为建模:客户行为属性分析
15.1 前期准备
15.1.1 商业需求
15.1.2 定义目标
15.1.3 选择建模方法
15.2 数据获取与处理
15.3 模型开发
15.4 模型验证
15.5 模型打分
15.6 模型预测
15.7 模型实施
15.8 小结
第16章 文本挖掘:Web文本分析
16.1 文本挖掘概念与流程
16.1.1 文本挖掘概念
16.1.2 文本挖掘流程
16.2 商业案例
16.2.1 商业需求
16.2.2 建模框架设计
16.2.3 结合朴素贝叶斯文本分类的EM迭代
16.2.4 数据获取与数据预处理
……
参考文献
· · · · · · (收起)

读后感

评分

这本书2013年6月6号买的,11月24号才看完,拖拖拉拉看了这么久,也真是不容易。 这本书的章节段落安排还不错,里面的一些内容也由浅入深,从基础的Data Step,Proc Step到最后的Data Mining,涵盖范围很广泛,对我自己来讲,基础知识差不多了,这本书让我从一个菜鸟走向了一个...

评分

这本书2013年6月6号买的,11月24号才看完,拖拖拉拉看了这么久,也真是不容易。 这本书的章节段落安排还不错,里面的一些内容也由浅入深,从基础的Data Step,Proc Step到最后的Data Mining,涵盖范围很广泛,对我自己来讲,基础知识差不多了,这本书让我从一个菜鸟走向了一个...

评分

这本书2013年6月6号买的,11月24号才看完,拖拖拉拉看了这么久,也真是不容易。 这本书的章节段落安排还不错,里面的一些内容也由浅入深,从基础的Data Step,Proc Step到最后的Data Mining,涵盖范围很广泛,对我自己来讲,基础知识差不多了,这本书让我从一个菜鸟走向了一个...

评分

这本书2013年6月6号买的,11月24号才看完,拖拖拉拉看了这么久,也真是不容易。 这本书的章节段落安排还不错,里面的一些内容也由浅入深,从基础的Data Step,Proc Step到最后的Data Mining,涵盖范围很广泛,对我自己来讲,基础知识差不多了,这本书让我从一个菜鸟走向了一个...

评分

这本书2013年6月6号买的,11月24号才看完,拖拖拉拉看了这么久,也真是不容易。 这本书的章节段落安排还不错,里面的一些内容也由浅入深,从基础的Data Step,Proc Step到最后的Data Mining,涵盖范围很广泛,对我自己来讲,基础知识差不多了,这本书让我从一个菜鸟走向了一个...

用户评价

评分

比较基础的工具书

评分

温故而知新。

评分

本书无论从SAS BASE的理论和应用层面,内容都很实在和实用,值得实践中反复体会。

评分

据说代码是直接从我行拷出去的?

评分

对SAS编程的讲解比较详细,结合实例和代码解读数据挖掘方法

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2026 book.wenda123.org All Rights Reserved. 图书目录大全 版权所有