基于Clementine的数据挖掘 pdf epub mobi txt 电子书下载 2026

简体网页||繁体网页

☆☆☆☆☆

出版者:中国人民大学

作者:薛薇//陈欢歌

出品人:

页数:467

译者:

出版时间:2012-3

价格:56.00元

装帧:

isbn号码:9787300151625

丛书系列:

图书标签:

数据挖掘
Clementine
数据分析
统计
SPSS
针灸
计算机科学
方法论
数据挖掘
Clementine
机器学习
数据分析
知识发现
商业智能
统计建模
预测分析
数据可视化
WEKA

下载链接在页面底部

facebook linkedin mastodon messenger pinterest reddit telegram twitter viber vkontakte whatsapp 复制链接

想要找书就要到图书目录大全

book.wenda123.org

立刻按 ctrl+D收藏本页

你会得到大惊喜!!

具体描述

《基于Clementine的数据挖掘》内容简介：数据挖掘这种新的商业信息处理技术，其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模式化的处理，从中提取辅助商业决策的关键性数据。Clementine软件以其卓越的运算处理能力和图形展现能力、优秀的算法、行之有效的统计分析方法成为解决数据挖掘问题的理想工具。

作者基于长期从事计算机数据分析教学与科研工作的经验编写了《基于Clementine的数据挖掘》，在编写过程中体现出以下特色：以数据挖掘过程为线索介绍Clementine软件。薛薇和陈欢歌编著的《基于Clementine的数据挖掘》以数据挖掘的实践过程为主线，从Clementine数据管理入手，说明问题从浅至深，讲解方法从易到难。这样，能使读者在较短时间内掌握Clementine的基本功能和一般方法，并可迅速运用到实际工作中。

数据挖掘方法、软件操作、案例分析的有机结合。配合实际案例，侧重数据挖掘方法核心思想和基本原理的阐述，使得读者可以直观理解方法，并正确掌握方法的应用范围。

数据挖掘方法讲解全面，语言通俗。《基于Clementine的数据挖掘》对Clementine的数据挖掘算法进行了全面分析和应用，内容力求丰富翔实。同时使用通俗的语言和示例讲述算法，尽量避免使用公式和推导堆砌算法。

作者简介

薛薇，工学硕士、经济学博士，中国人民大学统计学院副教授，教育部人文社会科学重点研究基地：中国人民大学应用统计学科研究中心副主任。关注数据挖掘及统计分析方法，统计和数据挖掘软件应用，统计数据库系统研发等方面，涉足网络新媒体传播和互动模式建模、政府和官方微博分析、学科学术热点跟踪等文本挖掘和统计应用领域，以及以数据挖掘为依托的客户关系管理等。主要代表作：《SPSS统计分析方法及应用》、《Clementine数据挖掘方法及应用》、《基于信息技术的统计信息系统》。

陈欢歌，副教授，工学硕士，现任教于北京培黎职业学院。主要从事计算机应用教学与管理工作。曾在计算机公司从事软件开发和计算机系统集成工作。

目录信息

第1章数据挖掘和Clementine使用概述 1.1 数据挖掘的产生背景 1.2 什么是数据挖掘 1.3 Clementine软件概述第2章 Clementine的数据读入和数据集成 2.1 变量类型 2.2 读人数据 2.3 生成实验方案 2.4 数据集成第3章 Clementine的数据理解 3.1 变量说明 3.2 数据质量的评估和调整 3.3 数据的排序 3.4 数据的分类汇总 3.5 用户报表第4章 Clementine的数据准备 4.1 变量变换 4.2 变量派生 4.3 数据精简 4.4 数据筛选 4.5 数据准备的其他工作第5章 Clementine的基本分析 5.1 数值型变量的基本分析 5.2 两分类型变量相关性的研究 5.3 两总体的均值比较 5.4 rfm分析第6章 Clementine的数据精简 6.1 变量值的离散化处理 6.2 特征选择 6.3 因子分析第7章分类预测：Clementine的决策树 7.1 决策树算法概述 7.2 Clementine的c5.0算法及应用 7.3 Clementine的分类回归树及应用 7.4 Clementine的chaid算法及应用 7.5 Clementine的quest算法及应用 7.6 模型的对比分析第8章分类预测：Clementine的人工神经网络 8.1 人工神经网络算法概述 8.2 Clementine的b-p反向传播网络 8.3 Clementine的b-p反向传播网络的应用 8.4 Clementine的径向基函数网络及应用第9章分类预测：Clementine的支持向量机 9.1 支持向量分类的基本思路 9.2 支持向量分类的基本原理 9.3 支持向量回归 9.4 支持向量机的应用第10章分类预测：Clementine的logistic回归分析 10.1 logistic回归分析概述 10.2 二项logistic回归分析 10.3 二项logistic回归分析的应用 10.4 多项logistic回归分析及应用第11章分类预测：Clementine的判别分析 11.1 距离判别法 11.2 fisher判别法 11.3 贝叶斯判别法 11.4 判别分析的应用第12章分类预测：Clementine的贝叶斯网络 12.1 贝叶斯方法基础 12.2 贝叶斯网络概述 12.3 tan贝叶斯网络 12.4 马尔科夫毯网络 12.5 贝叶斯网络的应用第13章探索内部结构：Clementine的聚类分析 13.1 聚类分析的一般问题 13.2 Clementine的k-means聚类及应用 13.3 Clementine的两步聚类及应用 13.4 Clementine的kohonen网络聚类及应用 13.5 基于聚类分析的离群点探索第14章探索内部结构：Clementine的关联分析 14.1 简单关联规则及其有效性 14.2 Clementine的apriori算法及应用 14.3 Clementine的gri算法及应用 14.4 Clementine的序列关联及应用参考文献
· · · · · · (收起)

读后感

评分☆☆☆☆☆

用户评价

评分☆☆☆☆☆

我不得不承认，这本书的装订质量是顶级的，它拿在手里确实很有分量感，可以作为一件不错的家居装饰品。然而，作为一本技术专著，它的“实用价值”几乎为零。全书洋溢着一种强烈的、自恋式的“理论优越感”。作者似乎更热衷于批判所有现有的、成熟的数据挖掘范式，将它们贬低为“肤浅的算术游戏”，然后用自己那套“宏大叙事”取而代之。这种批判姿态本身无可厚非，但前提是，你的替代方案必须是可操作的、可验证的，并且能够解决实际问题。这本书遗憾地没有做到这一点。它仿佛是一场冗长、华丽的开场白，承诺了一个史诗般的发现，但最终在关键的“结论”部分戛然而止，留给读者的只有一堆无法落地、难以复现的“思想火花”。对于那些需要快速掌握技能、解决实际业务问题的专业人士来说，这本书简直是时间的黑洞，它消耗了你的精力，却无法提供任何可以写入简历的技能点。我更倾向于把它视为一种艺术品，而不是一本工具书。

评分☆☆☆☆☆

天呐，我刚翻完这本厚厚的书，简直是本世纪最让人摸不着头脑的“技术指南”！从封面设计到内容排布，都散发着一种上个世纪九十年代末期的遗风，那种带着粗糙像素感和霓虹灯闪烁的审美，让人忍不住怀疑自己是不是穿越了。这本书的作者显然对“数据”这个词有着一种近乎宗教般的热忱，但这种热忱似乎只停留在概念的云端，鲜少触及任何可以被代码实现的具体路径。比如，有一章花了整整三十页来阐述“信息的熵减”在宇宙大尺度上的意义，配图是一张模糊不清的哈勃望远镜照片，配上的文字佶屈聱牙，我读了三遍，感觉自己更接近于哲学系新生而不是数据分析师。我原本期待看到一些关于如何清洗、建模、或者至少是关于某个具体算法的深入剖析，结果呢？更多的是对“挖掘”这个动作本身进行诗意的赞美。书中提到的“工具箱”，我找遍了所有提及的软件名称，发现它们要么是已经停产的古董，要么是根本不存在于任何主流技术栈中的自创名词。这本书更像是一本为后人准备的“反面教材”，详细展示了如何用最晦涩的语言和最不实用的理论，构建一个看起来高深莫测的知识体系。读完之后，我的电脑硬盘里没有多出一个新的脚本文件，但我的咖啡消耗量倒是显著增加了。

评分☆☆☆☆☆

说实话，我本来对这个领域抱有极大的热情，买了这本书后，更是满怀憧憬地想提升自己的“数据洞察力”。但这本书的文字风格，简直是故意设置的阅读障碍。它的句子结构复杂到令人发指，一个简单的陈述句需要用至少三个从句和两个插入语才能完整表达，阅读起来的耗费的心力，比我自己去跑一个复杂的机器学习模型还要大。而且，书中充斥着大量自造的、或者至少是极为小众的术语，作者似乎认为读者已经具备了与他同等的专业背景，所以完全没有提供任何的术语表或背景解释。举个例子，作者反复提到一种名为“超维度共振拟合”的方法，在全书近六百页的篇幅里，我只找到了它出现过一次函数的伪代码，而且这段代码本身就充满了语法错误，根本无法运行。我尝试在网上搜索这个概念，结果搜索引擎的反馈是“您是不是想搜索‘维度灾难’？”这让我意识到，这本书的内容可能与当前的行业实践存在着严重的脱节，或者说，它构建的是一个完全独立于现实世界之外的理论“象牙塔”。

评分☆☆☆☆☆

这本书给我的感觉就像是走进了一个巨大的、华丽的、但完全没有灯光的图书馆。装帧精美，纸张的触感极佳，翻开扉页，那些引言和致谢词写得情真意切，看得出作者倾注了大量心血，这方面的诚意是毋庸置疑的。然而，一旦进入正文，那种期望就被无情地击碎了。书的结构极其松散，章节之间的逻辑跳跃性令人咋舌，仿佛是作者在不同时间、不同心境下随手写下的笔记的集合。前一章还在讨论如何用概率论来预测下个月的降水量，后一章立刻转到了中世纪炼金术对“数据提纯”的隐喻性影响。我试图寻找一个贯穿始终的主线，一个可以让我将所有知识点串联起来的“骨架”，但似乎这本书的骨架是软骨组织，它会随着你的阅读方向随意变形。更令人头疼的是，书中引用的“权威文献”名单，我尝试去搜索了其中几篇被重点提及的论文，结果发现它们的DOI（数字对象标识符）指向的都是一本关于园艺学的期刊，这不禁让我怀疑，作者是不是在某个午后把书架上的书拿错了。对于那些想通过这本书建立起系统性知识框架的读者来说，这无疑是一场灾难，它提供的不是地图，而是一堆散落的、指向不同方向的指南针。

评分☆☆☆☆☆

这本书的插图和图表是另一个令人费解的方面。如果说文字是晦涩的，那么图表简直就是抽象派的艺术品。它们要么是色彩极其饱和、对比度高到让人眼睛刺痛的饼图，要么是三维空间中扭曲变形的曲面图，关键是，这些图表上标注的轴标签往往是空缺的，或者写着诸如“时间流”、“认知密度”这类无法量化的描述性词汇。我尤其记得有一张图，它试图用“莫比乌斯环”的拓扑结构来解释数据流的循环性，但最终呈现的效果更像是一个被压扁的甜甜圈。在数据分析领域，清晰、直观的可视化是至关重要的沟通工具，然而这本书却反其道而行之，似乎在刻意地模糊和隐藏信息背后的真实含义。我怀疑作者是不是对“可视化”的理解还停留在上世纪七十年代的计算机图形学初级阶段。购买这本书的读者，如果期待能从中学习到如何制作一张清晰的报告图表，那他们会失望地发现，这本书提供的，可能只是他们未来需要努力“去解读”的视觉谜题。

评分☆☆☆☆☆

国内出版的比较好的介绍clementine的教材，也可以当做一本算法简介，对各种机器学习算法的介绍也很不错，数学公式的推导增加了对算法的认知~~

评分☆☆☆☆☆

很浅显的一门数据挖掘的应用书籍，不涉及任何编程。

评分☆☆☆☆☆

国内出版的比较好的介绍clementine的教材，也可以当做一本算法简介，对各种机器学习算法的介绍也很不错，数学公式的推导增加了对算法的认知~~

评分☆☆☆☆☆

不错的书，但是仍有部分函数解释不清楚

评分☆☆☆☆☆

国内出版的比较好的介绍clementine的教材，也可以当做一本算法简介，对各种机器学习算法的介绍也很不错，数学公式的推导增加了对算法的认知~~