注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術(shù)計算機/網(wǎng)絡軟件與程序設(shè)計邊做邊學深度強化學習:PyTorch程序設(shè)計實踐

邊做邊學深度強化學習:PyTorch程序設(shè)計實踐

邊做邊學深度強化學習:PyTorch程序設(shè)計實踐

定 價:¥69.00

作 者: 小川雄太郎(Yutaro ogawa) 著,申富饒 于僡譯 譯
出版社: 機械工業(yè)出版社
叢編項: 輕松上手IT技術(shù)日文譯叢
標 簽: 暫缺

購買這本書可以去


ISBN: 9787111650140 出版時間: 2020-04-01 包裝: 平裝
開本: 16開 頁數(shù): 228 字數(shù):  

內(nèi)容簡介

  Pytorch是基于python且具備強大GPU加速的張量和動態(tài)神經(jīng)網(wǎng)絡,更是Python中優(yōu)先的深度學習框架,它使用強大的 GPU 能力,提供*大的靈活性和速度。本書指導讀者以Pytorch為工具在Python中學習深層強化學習(DQN)。主要內(nèi)容包括:強化學習概述及分類、強化學習的算法和實施方法、在Pytorch中實施深度規(guī)劃與實現(xiàn)。、“實施深層強化學習DQN”、理解并實施新的深層強化學習方法(Double-DQN、Dueling Network、Prioritized Experience Replay、A3C、A2C)。

作者簡介

暫缺《邊做邊學深度強化學習:PyTorch程序設(shè)計實踐》作者簡介

圖書目錄

譯者序
前言
第1章 強化學習概述1
1.1 機器學習的分類(監(jiān)督學習、非監(jiān)督學習、強化學習)1
1.2 強化學習、深度強化學習的歷史6
1.3 深度強化學習的應用實例11
參考文獻14
第2章 在走迷宮任務中實現(xiàn)強化學習16
2.1 Try Jupyter的使用方法16
2.2 迷宮和智能體的實現(xiàn)23
2.3 策略迭代法的實現(xiàn)31
2.4 價值迭代法的術(shù)語整理41
2.5 Sarsa的實現(xiàn)46
2.6 實現(xiàn)Q學習52
參考文獻57
第3章 在倒立擺任務中實現(xiàn)強化學習59
3.1 在本地PC上準備強化學習的實現(xiàn)和執(zhí)行環(huán)境59
3.2 倒立擺任務“CartPole”64
3.3 由多變量連續(xù)值表示的狀態(tài)的表格表示69
3.4 Q學習的實現(xiàn)72
參考文獻80
第4章 使用PyTorch實現(xiàn)深度學習81
4.1 神經(jīng)網(wǎng)絡和深度學習的歷史81
4.2 深度學習的計算方法89
4.3 使用PyTorch實現(xiàn)MNIST手寫數(shù)字分類任務94
參考文獻107
第5章 深度強化學習DQN的實現(xiàn)108
5.1 深度強化學習DQN(深度Q網(wǎng)絡)的說明108
5.2 實現(xiàn)DQN的四個要點111
5.3 實現(xiàn)DQN(上) 113
5.4 實現(xiàn)DQN(下) 123
參考文獻127
第6章 實現(xiàn)深度強化學習的改進版128
6.1 深度強化學習算法發(fā)展圖128
6.2 DDQN的實現(xiàn)132
6.3 Dueling Network的實現(xiàn)141
6.4 優(yōu)先經(jīng)驗回放的實現(xiàn)145
6.5 A2C的實現(xiàn)157
參考文獻168
第7章 在AWS GPU環(huán)境中實現(xiàn)消磚塊游戲169
7.1 消磚塊游戲“Breakout”的描述169
7.2 準備在AWS上使用GPU所需要的深度學習執(zhí)行環(huán)境174
7.3 學習Breakout的四個關(guān)鍵思想187
7.4 A2C的實現(xiàn)(上) 193
7.5 A2C的實現(xiàn)(下) 203
參考文獻212
后記214

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) www.leeflamesbasketballcamps.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號