Python機(jī)器學(xué)習(xí)技術(shù)與應(yīng)用
-
【作 者】主 編 王路漫 齊惠穎
【I S B N 】978-7-5226-1100-6
【責(zé)任編輯】趙佳琦
【適用讀者群】本科
【出版時間】2023-02-08
【開 本】16開
【裝幀信息】平裝(光膜)
【版 次】第1版第1次印刷
【頁 數(shù)】240
【千字?jǐn)?shù)】384
【印 張】15
【定 價】¥49
【叢 書】普通高等教育人工智能專業(yè)系列教材
【備注信息】
簡介
本書特色
前言
章節(jié)列表
精彩閱讀
下載資源
相關(guān)圖書
內(nèi) 容 提 要
本書以機(jī)器學(xué)習(xí)初學(xué)者為教學(xué)對象,通過講解機(jī)器學(xué)習(xí)的常用方法及實際應(yīng)用,培養(yǎng)讀者機(jī)器學(xué)習(xí)應(yīng)用技能及計算思維能力。本書共12章,主要內(nèi)容包括機(jī)器學(xué)習(xí)概述、Python語言基礎(chǔ)、網(wǎng)絡(luò)爬蟲、數(shù)據(jù)預(yù)處理與特征工程、多元回歸分析、分類方法、支持向量機(jī)、樸素貝葉斯方法、聚類分析方法、人工神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)、數(shù)據(jù)可視化、基于Pyecharts的大數(shù)據(jù)可視化圖表。
本書內(nèi)容豐富、圖文并茂,以數(shù)據(jù)分析流程為主線,算法與應(yīng)用相結(jié)合,系統(tǒng)講解常用的機(jī)器學(xué)習(xí)理論和分析方法,通過案例幫助讀者快速掌握機(jī)器學(xué)習(xí)相關(guān)技術(shù),以實現(xiàn)理論與實踐的緊密結(jié)合。
本書可以作為高等學(xué)校各類專業(yè)的機(jī)器學(xué)習(xí)通識課程教材,或計算機(jī)類專業(yè)學(xué)生的必修課教材,也可供對機(jī)器學(xué)習(xí)感興趣的相關(guān)人員閱讀。
本書配有習(xí)題答案,讀者可從中國水利水電出版社網(wǎng)站(www.waterpub.com.cn)或萬水書苑網(wǎng)站(mightybasket.cn)免費下載。
內(nèi)容全面 循序漸進(jìn)地引導(dǎo)讀者掌握機(jī)器學(xué)習(xí)的常用方法。
案例實用 以實際問題為案例,提升計算思維能力。
資源豐富 講解視頻、程序源碼、習(xí)題答案等資源,方便讀者學(xué)習(xí)使用。
前 言
機(jī)器學(xué)習(xí)是人工智能的一個重要分支,被廣泛應(yīng)用于大數(shù)據(jù)相關(guān)的諸多領(lǐng)域,深入推動了各個行業(yè)的創(chuàng)新與變革。對于當(dāng)今的高校學(xué)生,全面理解且有效運用機(jī)器學(xué)習(xí)方法是十分必要的。面對新時代的發(fā)展需求,為培養(yǎng)學(xué)生應(yīng)對時代變革所需的能力,從2015年開始北京大學(xué)醫(yī)學(xué)部面向本科生和研究生開設(shè)多門機(jī)器學(xué)習(xí)相關(guān)選修課,同時將機(jī)器學(xué)習(xí)的相關(guān)內(nèi)容融入到本科生的“大學(xué)計算機(jī)”這門必修課中。多位老師花費大量時間和精力進(jìn)行課程的建設(shè)和改革,形成完整的教學(xué)內(nèi)容及豐富的案例式教學(xué)課程資源,這些課程深受學(xué)生的喜愛。因此我們反復(fù)對課程實施過程中的教學(xué)資源及教學(xué)經(jīng)驗進(jìn)行梳理總結(jié),并編寫整理成書,為更多高校的教育教學(xué)提供參考。
本書面向各領(lǐng)域的實際問題需求,以培養(yǎng)學(xué)生的計算思維能力為目標(biāo),以全新的視角組織內(nèi)容,按照數(shù)據(jù)分析的流程,通過機(jī)器學(xué)習(xí)方法和應(yīng)用實踐相結(jié)合的方式深入講解常用算法。
本書既注重思維培養(yǎng),又兼顧應(yīng)用需求,在通俗易懂的前提下,追求知識體系的系統(tǒng)性,盡可能全面展示機(jī)器學(xué)習(xí)的方法及應(yīng)用。
本書具有以下特點:
1. 內(nèi)容全面。以機(jī)器學(xué)習(xí)的角度,按照數(shù)據(jù)分析的流程組織內(nèi)容,循序漸進(jìn)地引導(dǎo)讀者掌握機(jī)器學(xué)習(xí)的常用方法,逐步培養(yǎng)讀者的數(shù)據(jù)素養(yǎng)。
2. 案例實用。本書選用實際問題作為案例,以Python語言為載體,讓讀者通過簡單的代碼輕松實現(xiàn)機(jī)器學(xué)習(xí)的整個過程,解決實際問題,快速獲得計算思維能力的提升。
3. 資源豐富。本書提供重點例題的講解視頻⒊絳蛟綽搿⑾疤獾榷嘀紙?zhí)学自嚧,扫描蕶┬蠂娄位置诞肟梢栽諳吖劭礎(chǔ)⒀啊�
4. 作者團(tuán)隊優(yōu)秀。編寫本書的教師都具有多年的一線教學(xué)經(jīng)驗,本書重難點突出,能夠激發(fā)學(xué)生的學(xué)習(xí)熱情。
本書由王路漫、齊惠穎任主編,張愛桃、王靜、殷蜀梅、周瑜任副主編。參編人員撰寫任務(wù)情況如下:第1、6、11章由王路漫編寫,第2章由王晨編寫,第3章由齊惠穎編寫,第4章由楊莉編寫,第5、8章由張愛桃編寫,第7、10章由王靜編寫,第9章由周瑜編寫,第12章由殷蜀梅編寫。王路漫、周瑜和焦影倩共同完成本書的統(tǒng)稿和定稿工作。
此外,中國水利水電出版社的有關(guān)負(fù)責(zé)同志對本書的出版給予了大力支持,特別是周益丹副編審,在本書的策劃和寫作中,提出了寶貴的意見,在此深表感謝。
由于編者水平有限,書中難免出現(xiàn)遺漏和不當(dāng)之處,敬請讀者提出寶貴建議,批評指正!
王路漫
2022年6月
第1章 機(jī)器學(xué)習(xí)概述 1
1.1 機(jī)器學(xué)習(xí)的概念 1
1.2 機(jī)器學(xué)習(xí)的分類 2
1.2.1 實際問題的分類 2
1.2.2 根據(jù)訓(xùn)練方法進(jìn)行分類 2
1.3 機(jī)器學(xué)習(xí)的開發(fā)流程 3
1.4 機(jī)器學(xué)習(xí)的應(yīng)用 4
本章小結(jié) 6
習(xí) 題 6
第2章 Python語言基礎(chǔ) 7
2.1 Python語言概述 7
2.1.1 Python簡介 7
2.1.2 Python優(yōu)勢 7
2.2 Python環(huán)境配置與使用 8
2.2.1 Anaconda的安裝方法 8
2.2.2 Spyder的環(huán)境介紹 12
2.2.3 第三方庫的安裝方法 13
2.3 數(shù)據(jù)分析相關(guān)庫的介紹 15
2.3.1 NumPy庫 15
2.3.2 Pandas庫 19
2.3.3 Sklearn庫 22
本章小結(jié) 24
習(xí) 題 24
第3章 網(wǎng)絡(luò)爬蟲 26
3.1 網(wǎng)絡(luò)爬蟲基本知識 26
3.1.1 網(wǎng)絡(luò)爬蟲簡介 26
3.1.2 HTTP協(xié)議 28
3.1.3 HTML語言 32
3.1.4 CSS樣式表 33
3.1.5 JavaScript腳本 34
3.2 網(wǎng)頁內(nèi)容獲取方法 35
3.2.1 requests主要方法 35
3.2.2 response對象 39
3.3 網(wǎng)頁內(nèi)容解析方法 40
3.3.1 BeautifulSoup 40
3.3.2 正則表達(dá)式 46
3.4 數(shù)據(jù)存儲 50
3.4.1 TXT格式存儲 51
3.4.2 JSON格式存儲 51
3.4.3 CSV格式存儲 52
3.4.4 圖片文件存儲 52
本章小結(jié) 52
習(xí) 題 53
第4章 數(shù)據(jù)預(yù)處理與特征工程 54
4.1 數(shù)據(jù)預(yù)處理的主要方法 54
4.1.1 刪除數(shù)據(jù) 54
4.1.2 缺失值處理 56
4.1.3 重復(fù)值處理 60
4.1.4 異常值處理 62
4.1.5 數(shù)據(jù)類型的轉(zhuǎn)換 62
4.2 特征選擇的主要方法 64
4.2.1 過濾法 64
4.2.2 包裹法 67
4.2.3 嵌入法 68
4.3 數(shù)據(jù)預(yù)處理與特征工程綜合實例
——Titanic生存分析 68
本章小結(jié) 73
習(xí) 題 73
第5章 多元回歸分析 75
5.1 多元線性回歸 75
5.1.1 線性回歸的基本原理 75
5.1.2 多元線性回歸的實現(xiàn) 79
5.1.3 回歸模型的評估指標(biāo) 81
5.2 多重共線性問題 83
5.2.1 多重共線性的定義 83
5.2.2 嶺回歸 85
5.2.3 Lasso回歸 89
5.3 非線性回歸——多項式回歸 91
5.3.1 多項式回歸的基本概念 92
5.3.2 多項式回歸的實現(xiàn) 93
5.4 Logistic回歸 94
5.4.1 Logistic回歸模型 94
5.4.2 Logistic回歸參數(shù)估計 96
5.4.3 Logistic回歸評估指標(biāo) 98
5.4.4 應(yīng)用實例 100
本章小結(jié) 103
習(xí) 題 103
第6章 分類方法 106
6.1 分類方法概述 106
6.2 決策樹 107
6.2.1 決策樹方法的基本概念 107
6.2.2 決策樹方法的工作方式 108
6.2.3 屬性選擇的度量 109
6.2.4 決策樹算法——ID3算法 110
6.2.5 Sklearn中決策樹算法的實現(xiàn) 110
6.2.6 決策樹算法應(yīng)用實例 113
6.3 隨機(jī)森林 117
6.3.1 隨機(jī)森林概述 117
6.3.2 Sklearn中隨機(jī)森林算法的實現(xiàn) 118
6.3.3 隨機(jī)森林算法應(yīng)用實例 118
6.4 分類算法評估 122
6.4.1 評估準(zhǔn)則 122
6.4.2 評估過程 122
6.4.3 評估方法 123
6.4.4 評估實例 124
本章小結(jié) 125
習(xí) 題 125
第7章 支持向量機(jī) 126
7.1 支持向量機(jī)算法概述 126
7.2 SVM的分類實現(xiàn)方法及案例 129
7.2.1 SVC支持向量分類算法 129
7.2.2 NuSVC支持向量分類算法 131
7.2.3 LinearSVC線性支持向量分類算法 133
7.3 SVM的回歸實現(xiàn)方法及案例 135
7.3.1 SVR回歸實現(xiàn)方法 135
7.3.2 NuSVR回歸實現(xiàn)方法 137
7.3.3 LinearSVR回歸實現(xiàn)方法 138
7.4 SVM異常檢測的實現(xiàn)方法 139
7.5 SVM實戰(zhàn)——人臉識別 140
7.5.1 導(dǎo)入并顯示數(shù)據(jù)集 141
7.5.2 SVM分類器模型選擇和優(yōu)化 142
本章小結(jié) 144
習(xí) 題 144
第8章 樸素貝葉斯方法 146
8.1 樸素貝葉斯方法概述 146
8.1.1 貝葉斯定理 146
8.1.2 樸素貝葉斯方法原理 147
8.2 不同分布下的貝葉斯方法 148
8.2.1 高斯樸素貝葉斯方法 148
8.2.2 多項式樸素貝葉斯方法 150
8.3 樸素貝葉斯實例——文本分類 152
8.4 概率類模型評估的評估指標(biāo) 154
8.4.1 布利爾分?jǐn)?shù) 155
8.4.2 對數(shù)損失函數(shù) 156
8.4.3 可靠性曲線 156
本章小結(jié) 158
習(xí) 題 159
第9章 聚類分析方法 161
9.1 聚類分析方法與無監(jiān)督學(xué)習(xí) 161
9.1.1 聚類分析方法 161
9.1.2 聚類分析和分類分析的區(qū)別 162
9.2 k-均值聚類算法 162
9.2.1 k-均值聚類算法概述 162
9.2.2 距離度量 163
9.2.3 Sklearn中k-均值聚類算法的實現(xiàn) 164
9.2.4 k-均值聚類算法的優(yōu)缺點 166
9.3 密度聚類算法 167
9.3.1 密度聚類算法概述 167
9.3.2 DBSCAN算法的實現(xiàn) 169
9.4 聚類算法的評估 170
9.4.1 確定聚類簇數(shù)k 170
9.4.2 評估聚類質(zhì)量 172
9.5 聚類算法實例 174
本章小結(jié) 177
習(xí) 題 178
第10章 人工神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí) 179
10.1 人工神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)概述 179
10.2 人工神經(jīng)網(wǎng)絡(luò)的原理 181
10.2.1 人工神經(jīng)元模型 181
10.2.2 人工神經(jīng)網(wǎng)絡(luò)模型 185
10.2.3 人工神經(jīng)網(wǎng)絡(luò)算法 186
10.3 BP神經(jīng)網(wǎng)絡(luò) 186
10.3.1 BP神經(jīng)網(wǎng)絡(luò)的模型 187
10.3.2 BP神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)算法 187
10.3.3 BP神經(jīng)網(wǎng)絡(luò)的設(shè)計 188
10.4 人工神經(jīng)網(wǎng)絡(luò)的實現(xiàn)方法 189
10.4.1 MLPClassifier介紹 189
10.4.2 MLPClassifier案例 190
10.5 人工神經(jīng)網(wǎng)絡(luò)算法實戰(zhàn)——人臉識別 195
10.5.1 導(dǎo)入數(shù)據(jù)集并進(jìn)行數(shù)據(jù)集劃分 196
10.5.2 優(yōu)化MLP分類器模型 196
10.5.3 MLP分類器模型預(yù)測 200
本章小結(jié) 201
練 習(xí) 201
第11章 數(shù)據(jù)可視化 202
11.1 數(shù)據(jù)可視化的概念及分類 202
11.2 使用Matplotlib庫進(jìn)行圖表的繪制 204
11.2.1 圖表的主要元素及繪制步驟 204
11.2.2 簡單圖表繪制 206
11.2.3 多圖組合繪制 214
本章小結(jié) 216
習(xí) 題 217
第12章 基于Pyecharts的大數(shù)據(jù)可視化圖表 218
12.1 Pyecharts概述 218
12.1.1 Pyecharts的簡介 218
12.1.2 Pyecharts的主要繪制步驟 218
12.2 基于文本數(shù)據(jù)生成詞云圖 221
12.2.1 利用Pyecharts繪制英文詞云圖 221
12.2.2 利用jieba繪制中文詞云圖 222
12.3 基于結(jié)構(gòu)化數(shù)據(jù)生成立體交互式圖表 223
12.4 基于JSON格式文件繪制桑基圖 225
12.5 繪制圓形關(guān)系圖 227
本章小結(jié) 229
習(xí) 題 229
參考文獻(xiàn) 230
- 零基礎(chǔ)玩轉(zhuǎn)國產(chǎn)大模型DeepSeek [徐永冰 張帥 編著]
- 網(wǎng)絡(luò)工程師5天修煉(適配第6版考綱) [主編 朱小平 施游]
- 信息系統(tǒng)項目管理師考試32小時通關(guān)(適用第4版考綱) [薛大龍]
- 信息系統(tǒng)管理工程師考試32小時通關(guān)(適配第2版考綱) [薛大龍 劉偉]
- 土木工程材料檢測實訓(xùn) [洪曉江 達(dá)則曉麗 錢波]
- 科技信息檢索與論文寫作實用教程 [李振華]
- 傳統(tǒng)山水畫論解讀與實踐 [陳鈉 著]
- Python數(shù)據(jù)庫編程 [主編 殷樹友 邢 翀]
- 計算機(jī)基礎(chǔ)實訓(xùn)指導(dǎo) [主編 袁春萍 朱妮]
- 嵌入式人工智能技術(shù)應(yīng)用(數(shù)字教材) [主編 胡娜 楊國勇 晏廷榮]
- Vienna整流器技術(shù) [桂存兵 著]
- 變頻器與伺服應(yīng)用 [陳剛 葉云飛]
- 物聯(lián)網(wǎng)工程設(shè)計與實踐 [湯琳 李敏]
- 爐邊夜話——深入淺出話AI [汪建 著]
- 電商運營與管理 [鐘肖英 陳瀟]
- Java面向?qū)ο蟪绦蛟O(shè)計 [主編 姜春磊 陳虹潔]
- 信息技術(shù)基礎(chǔ)(Windows 10+WPS Office)(微課版) [主編 石利平 田輝平 謝盛嘉]
- 人工智能應(yīng)用 [主編 陳 萍 劉培培 陳孟軍]
- 大學(xué)生職業(yè)發(fā)展與就業(yè)指導(dǎo) [主編 劉志堅]
- 高級辦公應(yīng)用項目教程 [主編 屈晶 趙成麗]
- 微信小程序開發(fā)項目實戰(zhàn)(微課版) [主編 黃龍泉 郭峰 朱倩]
- 企業(yè)檔案工作實戰(zhàn)寶典百問百答 [華俊 盧秀英 邵甜甜 著]
- 計算機(jī)網(wǎng)絡(luò)原理及應(yīng)用 [主編 唐繼勇 葉坤 孫夢娜]
- 大學(xué)生創(chuàng)業(yè)基礎(chǔ) [主編 王麗莉 王 楊]
- 船舶輔機(jī) [主編 王連海 于洋 姜淑翠]
- 大學(xué)生就業(yè)指導(dǎo) [主編 王麗莉 董宴廷]
- 系統(tǒng)架構(gòu)設(shè)計師章節(jié)習(xí)題與考點特訓(xùn) [主編 薛大龍 鄒月平]
- 高校學(xué)生工作探索與實踐 [郭亮 著]
- 大學(xué)生情商管理 [方雄 著]
- 2023年長沙市會展業(yè)發(fā)展報告 [主編 周棟良]

