数据科学--R语言实现(影印版)(英文版)

数据科学--R语言实现(影印版)(英文版) pdf epub mobi txt 电子书 下载 2026

出版者:东南大学出版社
作者:Hadley Wickham
出品人:
页数:492
译者:
出版时间:2017-10-1
价格:108.00
装帧:
isbn号码:9787564173531
丛书系列:
图书标签:
  • R
  • 研究
  • 数据科学
  • R语言
  • 统计学
  • 机器学习
  • 数据分析
  • 英文教材
  • 影印版
  • 技术
  • 计算机
  • 编程
想要找书就要到 图书目录大全
立刻按 ctrl+D收藏本页
你会得到大惊喜!!

具体描述

学习如何利用R语言洞察、知晓、理解原始数据。

《数据科学:R语言实现(影印版 英文版)》介绍了R、RStudio以及tidyverse,后者是一组相互配合工作的R包,能够使数据科学快速、流畅、富有乐趣。

《数据科学:R语言实现(影印版 英文版)》旨在帮助你尽快地上手数据科学相关的工作,并不要求读者具备编程经验。

《数据科学:R语言实现(影印版 英文版)》Hadley Wickham和Garrett Grolernund将一步步指导你对数据进行导入、提炼、探索以及建模并发布成果。除了处理数据所需的基本工具,你还将会对数据科学的周期拥有一个完整的、宏观的理解。

作者简介

Hadley Wickham是RStudio的首席科学家以及R基金会成员。他构建了一套使数据科学变得更加快捷、富有乐趣的工具。可以通过其个人网站了解更多的信息:http://hadley.nz。

Garrett Grolemund是一名统计学家、教师以及RStudio的硕士生导师。他还是《Hands-On Programming with R 》(O'Reilly)一书的作者。Garrett的很多授课视频可以在oreilly.com/safari上找到。

目录信息

Preface
Part I. Explore
1. Data Visualization with ggplot2
Introduction
First Steps
Aesthetic Mappings
Common Problems
Facets
Geometric Objects
Statistical Transformations
Position Adjustments
Coordinate Systems
The Layered Grammar of Graphics
2. Workflow: Basics
Coding Basics
What's in a Name?
Calling Functions
3. Data Transformation with dplyr
Introduction
Filter Rows with filter()
Arrange Rows with arrange()
Select Columns with select()
Add New Variables with mutate()
Grouped Summaries with summarize()
Grouped Mutates (and Filters)
4. W0rkfl0w: Scripts
Running Code
RStudio Diagnostics
5. Exploratory Data Analysis
Introduction
Questions
Variation
Missing Values
Covariation
Patterns and Models
ggplot2 Calls
Learning More
6. Workflow: Projects
What Is Real?
Where Does Your Analysis Live?
Paths and Directories
RStudio Projects
Summary
Part II. Wrangle
7. Tibbles with tibble
Introduction
Creating Tibbles
Tibbles Versus data.frame
Interacting with Older Code
8. Data Import with readr
Introduction
Getting Started
Parsing a Vector
Parsing a File
Writing to a File
Other Types of Data
9. Tidy Data with tidyr
Introduction
Tidy Data
Spreading and Gathering
Separating and Pull
Missing Values
Case Study
Nontidy Data
10. Relational Data with dplyr
Introduction
nycflightsl3
Keys
Mutating loins
Filtering loins
loin Problems
Set Operations
11. Strings with stringr
Introduction
String Basics
Matching Patterns with Regular Expressions
Tools
Other Types of Pattern
Other Uses of Regular Expressions
stringi
12. Factors with forcats
Introduction
Creating Factors
General Social Survey
Modifying Factor Order
Modifying Factor Levels
13. Dates and Times with lubridate
Introduction
Creating Date/Times
Date-Time Components
Time Spans
Time Zones
Part III. Program
14. Pipeswith magrittr
Introduction
Piping Alternatives
When Not to Use the Pipe
Other Tools from magrittr
15. Functions
Introduction
When Should You Write a Function?
Functions Are for Humans and Computers
Conditional Execution
Function Arguments
Return Values
Environment
16. Vectors
Introduction
Vector Basics
Important Types of Atomic Vector
Using Atomic Vectors
Recursive Vectors (Lists)
Attributes
Augmented Vectors
17. Iteration with purrr
Introduction
For Loops
For Loop Variations
For Loops Versus Functionals
The Map Functions
Dealing with Failure
Mapping over Multiple Arguments
Walk
Other Patterns of For Loops
Part IV. Model
18. Model Basics with modelr
Introduction
A Simple Model
Visualizing Models
Formulas and Model Families
Missing Values
Other Model Families
19. Model Building
Introduction
Why Are Low-Quality Diamonds More Expensive?
What Affects the Number of Daily Flights?
Learning More About Models
20. Many Models with purrr and broom
Introduction
gapminder
List-Columns
Creating List-Columns
Simplifying List-Columns
Making Tidy Data with broom
Part V. Communicate
21. R Markdown
Introduction
R Markdown Basics
Text Formatting with Markdown
Code Chunks
Troubleshooting
YAML Header
Learning More
22. Graphics for Communication with ggplot2
Introduction
Label
Annotations
Scales
Zooming
Themes
Saving Your Plots
Learning More
23. R Markdown Formats
Introduction
Output Options
Documents
Notebooks
Presentations
Dashboards
Interactivity
Websites
Other Formats
Learning More
24. R Markdown Workflow
Index
· · · · · · (收起)

读后感

评分

你们打五星的人,是水军吗。书的英文版的确很棒。中文版删了那么多东西你们不知道吗???长表和短表那一章全被删除,因子那一章也被删减。简直恶心到家了。图灵社区怎么翻译质量这么烂 书本身英文版值4星,除了介绍tidyverse之外对base R和其他高效率的包如data.table介绍基本...

评分

学R是在2012年在Jenny Bryan的stats 540的课上, Jenny也是本书几个章节的作者之一。 那时,课上画图用的是 lattice,这个包只包括了一些常见的画图函数,有些图没有,经常还得去找其他的包,理解不同函数的输入参数。同一个事情,不同包的控制参数名称完全不一样,经常找不到或...  

评分

学R是在2012年在Jenny Bryan的stats 540的课上, Jenny也是本书几个章节的作者之一。 那时,课上画图用的是 lattice,这个包只包括了一些常见的画图函数,有些图没有,经常还得去找其他的包,理解不同函数的输入参数。同一个事情,不同包的控制参数名称完全不一样,经常找不到或...  

评分

你们打五星的人,是水军吗。书的英文版的确很棒。中文版删了那么多东西你们不知道吗???长表和短表那一章全被删除,因子那一章也被删减。简直恶心到家了。图灵社区怎么翻译质量这么烂 书本身英文版值4星,除了介绍tidyverse之外对base R和其他高效率的包如data.table介绍基本...

评分

用户评价

评分

不得不提的是,作为一本影印的英文原版教材,它在专业术语的精准性上具有不可替代的优势。很多时候,中文教材在翻译专业术语时,可能会因为理解偏差或追求简洁而丢失了原有的细微差别,但在阅读原著时,这种困扰完全消失了。每一个名词、每一个缩写都精确对应着国际学术界的主流用法,这对于我们未来需要阅读顶会论文或者与国际同行交流时,是至关重要的“软实力”的培养。比如,作者对“Bias-Variance Trade-off”的论述,完全采用了最地道、最精准的表达方式,让人对这个核心概念的理解达到了前所未有的清晰度。这不仅仅是语言上的优势,更是思维方式上的接轨。对于那些希望未来能深耕于学术研究或跨国技术岗位的学习者来说,直接接触这种原汁原味的高质量英文教材,是迈向专业化的关键一步,绝对是值得投入时间的。

评分

关于其内容的深度和广度,这本书无疑是站在了行业前沿的。它并没有满足于停留在基础的数据清洗和描述性统计层面,而是大胆地深入到了更具挑战性的领域,例如高维数据处理和模型解释性(XAI)的初步探讨。我惊喜地发现,对于一些前沿的机器学习模型,它不仅介绍了模型的原理,更重要的是,还给出了在实际工程环境中如何进行模型调优和性能评估的实操建议,这在国内很多教材中是比较少见的。例如,它对正则化方法的讨论,就不仅仅停留在L1和L2的数学差异上,而是结合了运算效率和模型稀疏性的实际考量,给出了非常中肯的建议。阅读的过程中,我感觉自己像是在进行一次高强度的学术训练,知识密度非常高,但因为结构安排合理,所以消化起来并不算困难。每一章的末尾通常会附带一些“Further Reading”的提示,这为想要继续深挖某个细分领域的读者提供了宝贵的线索,体现了极强的学术责任感。

评分

这本书的装帧和印刷质量真是没得挑剔,纸张厚实,触感温润,即便是影印版,字体的清晰度和排版的美观度也达到了一个很高的水准。初次捧读,就被它那种沉稳、专业的范儿所吸引。我特别留意了那些复杂的数学公式和代码块的呈现效果,很多技术书籍在这方面处理得比较粗糙,导致阅读体验大打折扣,但这部作品在这方面处理得非常到位,每一行代码、每一个图表都仿佛是原汁原味地从原版搬运过来,让人在学习枯燥的理论时,视觉上也能得到一种享受。这种对细节的执着,从侧面反映了出版方对内容本身的尊重,也极大地提升了我们这些学习者在实际操作过程中的便捷性,毕竟,代码的准确性可不是闹着玩的。我甚至花时间去对比了一下,发现即便是那些涉及复杂统计图表的彩色渲染,影印效果也极其精准,色彩过渡自然,没有出现偏色或模糊的情况,这对于理解某些可视化概念来说至关重要。可以说,光是这份对实体的打磨,就让它在众多同类教材中脱颖而出,称得上是桌面上的艺术品,值得收藏。

评分

这本书的叙事风格颇为英式,带着一种严谨的逻辑链条和略微克制的幽默感,完全不是那种上来就堆砌概念的直白写法。它更像是一位经验丰富的导师,在引导你一步步构建知识体系,而不是简单地罗列知识点。作者在引入新概念时,往往会先从一个实际的应用场景或者一个历史背景切入,让你明白“为什么我们需要这个工具”,而不是仅仅告诉你“这个工具是什么”。这种由果溯因的讲解方式,极大地帮助我这种偏向于实战而非纯理论的读者建立了坚实的认知框架。我印象最深的是它对某个核心算法的阐述,它没有直接给出最终公式,而是通过一系列递进的小例子,让你亲手“推导出”那个复杂的数学表达,等到看到书本上的正式公式时,已然了然于胸,豁然开朗。这种“手把手”的引导,让枯燥的数学推导过程变成了一种有趣的探索,使得整体阅读节奏张弛有度,绝不拖沓,也绝不让人感到知识的断裂。

评分

这本书最大的价值,或许在于它提供了一个非常坚实可靠的“工具箱”,而不是仅仅停留在理论的空中楼阁。作者在讲解完理论后,几乎都会紧接着提供相应的代码实现思路和结构化的步骤。虽然是影印版,但清晰的代码块使得我们完全可以直接将其中的逻辑迁移到我们自己的编程环境中进行实践。更妙的是,作者在代码设计上体现了极佳的模块化和可读性,每一个函数或类的命名都清晰明了,这无形中也为我们树立了良好的编程规范。阅读完特定章节后,我通常会立刻打开我的编程环境,尝试去复现书中的案例,发现几乎没有出现因为代码不清晰而导致的障碍,这极大地提高了我的学习效率和动手能力。它不是那种“看完就忘”的书,它更像是一本可以常年摆在手边,随时可以查阅、随时可以复用到实际项目中的技术参考手册,其长期的实用价值远超出了初次阅读时的印象。

评分

评分

评分

评分

评分

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2026 book.wenda123.org All Rights Reserved. 图书目录大全 版权所有