注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)工業(yè)技術(shù)一般工業(yè)技術(shù)Python機器學(xué)習(xí)工程實戰(zhàn)(第2版)

Python機器學(xué)習(xí)工程實戰(zhàn)(第2版)

Python機器學(xué)習(xí)工程實戰(zhàn)(第2版)

定 價:¥198.00

作 者: (美)Andrew Mcmahon(彼得·麥克馬洪)
出版社: 電子工業(yè)出版社
叢編項:
標(biāo) 簽: 暫缺

ISBN: 9787121500169 出版時間: 2025-04-01 包裝: 平塑勒
開本: 頁數(shù): 字?jǐn)?shù):  

內(nèi)容簡介

  本書是一本面向機器學(xué)習(xí)實務(wù)的專業(yè)指南,通過系統(tǒng)化的工程學(xué)視角幫助讀者將機器學(xué)習(xí)理論轉(zhuǎn)化為實際應(yīng)用。全書共九章。內(nèi)容從基礎(chǔ)知識到模型標(biāo)準(zhǔn)化、部署模式、擴展規(guī)模及深度學(xué)習(xí)應(yīng)用,層層深入,逐步構(gòu)建機器學(xué)習(xí)工程的完整知識體系。書中特別強調(diào)如何在Python中高效編碼與設(shè)計,如何在大規(guī)模數(shù)據(jù)集上開發(fā),以及當(dāng)下熱門的大型語言模型(LLM)構(gòu)建與運營方法。本書不僅傳播技術(shù),更傳遞了工程學(xué)的嚴(yán)謹(jǐn)與實踐精神,旨在培養(yǎng)能夠解決復(fù)雜技術(shù)問題并引領(lǐng)數(shù)據(jù)科學(xué)發(fā)展的專業(yè)人才。無論是初學(xué)者,還是行業(yè)從業(yè)者,本書對讀者來說都是一次深入機器學(xué)習(xí)工程的寶貴探索。

作者簡介

  Andrew McMahon(彼得·麥克馬洪),多年來在多個行業(yè)中構(gòu)建了具有高影響力的機器學(xué)習(xí)產(chǎn)品。他目前擔(dān)任英國NatWest集團的首席MLOps工程師,并擁有倫敦帝國理工學(xué)院理論凝聚態(tài)物理博士學(xué)位。他是一位活躍的博主、演講者、播客嘉賓,并在MLOps社區(qū)中擔(dān)任領(lǐng)導(dǎo)角色。他是AI Right播客的聯(lián)合主持人,并榮獲2022年英國數(shù)據(jù)獎“年度新星”和2019年數(shù)據(jù)科學(xué)基金會頒發(fā)的“年度數(shù)據(jù)科學(xué)家”稱號。Andrew P. McMahon多年來在多個行業(yè)中構(gòu)建了具有高影響力的機器學(xué)習(xí)產(chǎn)品。目前,他擔(dān)任英國NatWest集團的首席MLOps工程師,并擁有倫敦帝國理工學(xué)院理論凝聚態(tài)物理博士學(xué)位。他是一位活躍的博主、演講者、播客嘉賓,并在MLOps社區(qū)擔(dān)任領(lǐng)導(dǎo)角色。他是AI Right播客的聯(lián)合主持人,并榮獲2022年英國數(shù)據(jù)獎“年度新星”和2019年數(shù)據(jù)科學(xué)基金會頒發(fā)的“年度數(shù)據(jù)科學(xué)家”稱號。譯者:殷海英,從2013年底開始在美國大學(xué)作為客座教授,主持?jǐn)?shù)據(jù)分析與數(shù)據(jù)科學(xué)項目的研究生研修班,截止2021年已經(jīng)開辦近20期,培訓(xùn)來自世界多個國家的數(shù)百名碩士(含博士)研究生。并獨立編寫數(shù)據(jù)分析與數(shù)據(jù)科學(xué)教材,并設(shè)計多版實訓(xùn)教程。在甲骨文公司,作為亞太區(qū)的數(shù)據(jù)科學(xué)家參與Oracle數(shù)據(jù)科學(xué)產(chǎn)品的研發(fā)與推廣。近期的主要研究方向為機器視覺與高性能運算在現(xiàn)實當(dāng)中的應(yīng)用。作為甲骨文公司官方媒體的管理員及編輯,從2016年起編寫并發(fā)表近100篇技術(shù)文章,涵蓋數(shù)據(jù)庫技術(shù)、數(shù)據(jù)科學(xué)以及機器視覺等方面。

圖書目錄

第1章 機器學(xué)習(xí)工程簡介 1
技術(shù)要求 2
定義數(shù)據(jù)學(xué)科的分類 4
數(shù)據(jù)科學(xué)家 4
機器學(xué)習(xí)工程師 5
機器學(xué)習(xí)運維工程師 6
數(shù)據(jù)工程師 8
作為一個高效的團隊進行協(xié)作 8
在現(xiàn)實世界中的機器學(xué)習(xí)工程 9
什么是機器學(xué)習(xí)解決方案? 12
為什么使用Python? 14
機器學(xué)習(xí)系統(tǒng)的高層設(shè)計 14
示例1:批量異常檢測服務(wù) 15
示例2:預(yù)測API 21
示例3:分類流程 26
本章小結(jié) 30
第2章 機器學(xué)習(xí)開發(fā)流程 32
技術(shù)要求 33
配置我們的工具 34
設(shè)置AWS賬戶 38
從概念到解決方案的四個步驟 39
將這與CRISP-DM進行比較 41
發(fā)現(xiàn) 42
使用用戶故事 43
運行 45
開發(fā) 46
部署 63
了解你的部署選項 63
理解DevOps和MLOps 65
使用GitHub Actions構(gòu)建第一個CI/CD示例 68
持續(xù)模型性能測試 72
持續(xù)模型訓(xùn)練 74
本章小結(jié) 76
第3章 從模型到模型工廠 78
技術(shù)要求 79
定義模型工廠 80
掌握學(xué)習(xí)的方法 81
定義目標(biāo) 81
減小損失 82
準(zhǔn)備數(shù)據(jù) 83
為機器學(xué)習(xí)設(shè)計特征工程 84
設(shè)計分類特征工程 84
設(shè)計數(shù)值特征工程 86
設(shè)計訓(xùn)練系統(tǒng) 89
訓(xùn)練-系統(tǒng)設(shè)計選項 90
訓(xùn)練-運行模式 91
訓(xùn)練-持久化 92
模型重訓(xùn)練 93
檢測數(shù)據(jù)漂移 95
檢測概念漂移 98
設(shè)置限制 100
診斷漂移 101
修正數(shù)據(jù)漂移 103
其他監(jiān)控工具 105
自動訓(xùn)練 109
自動化的層次結(jié)構(gòu) 109
優(yōu)化超參數(shù) 111
AutoML 118
持久化你的模型 121
構(gòu)建模型工廠與管道 125
Scikit-learn管道 126
Spark ML管道 130
本章小結(jié) 133
第4章 打包封裝 135
技術(shù)要求 136
編寫優(yōu)秀的Python代碼 136
回顧基礎(chǔ)知識 137
訣竅與技巧 139
堅持標(biāo)準(zhǔn) 142
編寫高質(zhì)量的PySpark代碼 144
選擇風(fēng)格 145
面向?qū)ο缶幊?145
函數(shù)式編程 148
打包你的代碼 150
為什么要打包? 151
選擇打包的用例 152
設(shè)計你的包 153
構(gòu)建你自己的包 158
使用Makefile管理你的環(huán)境 160
使用Poetry進行打包 165
測試、日志記錄、安全性和錯誤處理 170
測試 170
保護你的解決方案 174
分析自己的代碼以發(fā)現(xiàn)安全問題 175
分析依賴項以發(fā)現(xiàn)安全問題 177
記錄日志 180
錯誤處理 183
不要重復(fù)發(fā)明輪子 191
本章小結(jié) 191
第5章 部署模式和工具 193
技術(shù)要求 194
設(shè)計系統(tǒng) 194
基于原則構(gòu)建 196
探索一些標(biāo)準(zhǔn)的機器學(xué)習(xí)模式 199
在數(shù)據(jù)湖中暢游 199
微服務(wù) 200
基于事件的設(shè)計 202
批處理 203
容器化 204
在AWS上托管你自己的微服務(wù) 208
推送到ECR 209
在ECS上托管 211
使用Airflow構(gòu)建通用管道 224
Airflow 224
構(gòu)建高級機器學(xué)習(xí)管道 237
使用ZenML 237
使用Kubeflow 249
選擇你的部署策略 259
本章小結(jié) 260
第6章 擴展規(guī)模 262
技術(shù)要求 263
使用Spark進行擴展 263
Spark技巧和竅門 265
云上的Spark 273
啟動無服務(wù)器基礎(chǔ)設(shè)施 283
使用Kubernetes實現(xiàn)大規(guī)模容器化 292
使用Ray進行擴展 294
開始使用Ray進行機器學(xué)習(xí) 298
設(shè)計大規(guī)模系統(tǒng) 305
本章小結(jié) 308
第7章 深度學(xué)習(xí)、生成人工智能和LLMOps 310
深入探討深度學(xué)習(xí) 311
使用PyTorch 314
將深度學(xué)習(xí)擴展并投入生產(chǎn)實踐 318
微調(diào)和遷移學(xué)習(xí) 322
使用LLM 331
理解LLM 332
通過API使用LLM 333
使用LLM進行編碼 336
利用LLM構(gòu)建未來 340
LLM驗證 341
PromptOps 343
本章小結(jié) 344
第8章 構(gòu)建ML微服務(wù) 345
技術(shù)要求 345
理解預(yù)測問題 346
設(shè)計我們的預(yù)測服務(wù) 348
選擇工具 350
規(guī)?;?xùn)練 352
使用FastAPI提供模型服務(wù) 356
響應(yīng)和請求模式 359
在微服務(wù)中管理模型 363
將所有內(nèi)容整合在一起 366
容器化并部署到Kubernetes 371
將應(yīng)用程序容器化 372
使用Kubernetes進行擴展 373
部署策略 376
本章小結(jié) 377
第9章 構(gòu)建一個提取、轉(zhuǎn)換、機器學(xué)習(xí)用例 379
技術(shù)要求 380
理解批處理問題 382
設(shè)計ETML解決方案 384
工具選擇 386
接口和存儲 386
模型的擴展 387
ETML管道的調(diào)度 388
執(zhí)行構(gòu)建 389
使用高級Airflow功能構(gòu)建ETML管道 390
本章小結(jié) 403

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) www.leeflamesbasketballcamps.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號