精通特徵工程 在線電子書 圖書標籤: 機器學習 特徵工程 Python 大數據 數據科學 計算機 數據挖掘 數據分析與機器學習
發表於2024-11-22
精通特徵工程 在線電子書 pdf 下載 txt下載 epub 下載 mobi 下載 2024
概括性的介紹瞭特徵工程的一些方法,不夠深入,而且專有名詞很多,代碼不錯
評分一般的特徵工程都略知一二,這本書算是幫忙梳理瞭一邊,完善瞭細節的感覺
評分看一下開源版本
評分要吃透這本書的內容的前提是對綫性代數的熟練掌握,因為這裏麵涉及到大量術語,雖然有講解但還是很粗略。給齣的代碼很簡潔實用,內容安排也比較閤理。
評分雖然沒讀完也不配讀懂但是感謝分類標簽這一章救我於水深火熱peace&love我又好起來瞭嚶嚶嚶
愛麗絲·鄭(Alice Zheng)
亞馬遜廣告平颱建模和優化團隊負責人,應用機器學習、生成算法和平颱開發領域的技術領導者,前微軟研究院機器學習研究員。
阿曼達·卡薩麗(Amanda Casari)
榖歌雲開發者關係工程經理,曾是Concur Labs的産品經理和數據科學傢,在數據科學、機器學習、復雜係統和機器人等多個領域都有豐富經驗。
特徵工程是機器學習流程中至關重要的一個環節,然而專門討論這個話題的著作卻寥寥無幾。本書旨在填補這一空白,著重闡明特徵工程的基本原則,介紹大量特徵工程技術,教你從原始數據中提取齣正確的特徵並將其轉換為適閤機器學習模型的格式,從而輕鬆構建模型,增強機器學習算法的效果。
然而,本書並非單純地講述特徵工程的基本原則,而是通過大量示例和練習將重點放在瞭實際應用上。每一章都集中研究一個數據問題:如何錶示文本數據或圖像數據,如何為自動生成的特徵降低維度,何時以及如何對特徵進行標準化,等等。最後一章通過一個完整的例子演示瞭多種特徵工程技術的實際應用。書中所有代碼示例均是用Python編寫的,涉及NumPy、Pandas、scikit-learn和Matplotlib等程序包。
- 數值型數據的特徵工程:過濾、分箱、縮放、對數變換和指數變換
- 自然文本技術:詞袋、n元詞與短語檢測
- 基於頻率的過濾和特徵縮放
- 分類變量編碼技術:特徵散列化與分箱計數
- 使用主成分分析的基於模型的特徵工程
- 模型堆疊與k-均值特徵化
- 圖像特徵提取:人工提取與深度學習
特征工程是数据科学工程的核心,目前关于这个话题专门的书籍不多。本书通过概念(不是理论)和案例代码相结合的方式,还该了特征工程中的一些基础技术。包括分类型变量编码,数值型数据的分箱,变换。文本处理,PCA以及基于模型的特征工程。模型堆叠和k-均值特征化。最后简单介...
評分我直言不讳,在我撰写本文的时候,本书在豆瓣评分偏低。不忍好书蒙尘,忍不住撰写此文。 工程领域的书籍不好写,实践性太强。工程中要处理的问题总是一个例子一个例子组成的,一个项目一个项目实操干出来的,具体例子和具体例子之间差异非常之大,方法论难以提炼。判断工程技术...
評分我直言不讳,在我撰写本文的时候,本书在豆瓣评分偏低。不忍好书蒙尘,忍不住撰写此文。 工程领域的书籍不好写,实践性太强。工程中要处理的问题总是一个例子一个例子组成的,一个项目一个项目实操干出来的,具体例子和具体例子之间差异非常之大,方法论难以提炼。判断工程技术...
評分特征工程是数据科学工程的核心,目前关于这个话题专门的书籍不多。本书通过概念(不是理论)和案例代码相结合的方式,还该了特征工程中的一些基础技术。包括分类型变量编码,数值型数据的分箱,变换。文本处理,PCA以及基于模型的特征工程。模型堆叠和k-均值特征化。最后简单介...
評分我直言不讳,在我撰写本文的时候,本书在豆瓣评分偏低。不忍好书蒙尘,忍不住撰写此文。 工程领域的书籍不好写,实践性太强。工程中要处理的问题总是一个例子一个例子组成的,一个项目一个项目实操干出来的,具体例子和具体例子之间差异非常之大,方法论难以提炼。判断工程技术...
精通特徵工程 在線電子書 pdf 下載 txt下載 epub 下載 mobi 下載 2024