注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網(wǎng)絡軟件與程序設計Python深度強化學習:基于Chainer和OpenAI Gym

Python深度強化學習:基于Chainer和OpenAI Gym

Python深度強化學習:基于Chainer和OpenAI Gym

定 價:¥79.00

作 者: [日] 牧野浩二(Koji Makino),[日] 西崎博光(Hiromitsu Nishizaki) 著,申富饒,于僡 譯
出版社: 機械工業(yè)出版社
叢編項:
標 簽: 暫缺

ISBN: 9787111692584 出版時間: 2021-12-01 包裝: 平裝
開本: 16開 頁數(shù): 228 字數(shù):  

內(nèi)容簡介

  本書基于強化學的庫Chainer(Chainere)和AI模擬環(huán)境的OpenAI gym-不僅僅是軟件模擬-也詳述了使用RaspbbilryPi和ARduino的實際環(huán)境的應用。

作者簡介

暫缺《Python深度強化學習:基于Chainer和OpenAI Gym》作者簡介

圖書目錄

譯者序
前言
第1章 引言 1
11 深度強化學習可以做什么 1
12 本書的結構 4
13 框架:Chainer和ChainerRL 6
14 Python的運行檢查 6
15 Chainer的安裝 9
16 ChainerRL的安裝 12
17 模擬器:OpenAI Gym 14
第2章 深度學習 17
21 什么是深度學習 17
22 神經(jīng)網(wǎng)絡 18
23 基于Chainer的神經(jīng)網(wǎng)絡 21
231 Chainer與神經(jīng)網(wǎng)絡的對應 24
232 Chainer程序 25
233 參數(shù)設置 26
234 創(chuàng)建數(shù)據(jù) 27
235 定義神經(jīng)網(wǎng)絡 27
236 各種聲明 28
237 顯示訓練狀態(tài) 28
238 保存訓練狀態(tài) 31
239 執(zhí)行訓練 32
24 與其他神經(jīng)網(wǎng)絡的對應 32
241 感知器 32
242 5層神經(jīng)網(wǎng)絡(深度學習) 33
243 計算輸入中的1的數(shù)量 34
25 基于深度神經(jīng)網(wǎng)絡的手寫數(shù)字識別 35
251 手寫數(shù)字的輸入格式 36
252 深度神經(jīng)網(wǎng)絡的結構 39
253 8×8的手寫數(shù)字數(shù)據(jù) 41
26 基于卷積神經(jīng)網(wǎng)絡的手寫數(shù)字識別 43
261 卷積 45
262 激活函數(shù) 49
263 池化 49
264 執(zhí)行 50
27 一些技巧 53
271 讀取文件數(shù)據(jù) 54
272 使用訓練模型 55
273 重啟訓練 56
274 檢查權重 56
275 從文件中讀取手寫數(shù)字 57
第3章 強化學習 59
31 什么是強化學習 59
311 有監(jiān)督學習 60
312 無監(jiān)督學習 60
313 半監(jiān)督學習 60
32 強化學習原理 61
33 通過簡單的示例來學習 61
34 應用到Q學習問題中 63
341 狀態(tài) 63
342 行動 63
343 獎勵 63
344 Q值 64
35 使用Python進行訓練 67
351 運行程序 67
352 說明程序 69
36 基于OpenAI Gym的倒立擺 73
361 運行程序 73
362 說明程序 74
37 如何保存和加載Q值 79
第4章 深度強化學習 81
41 什么是深度強化學習 81
42 對于老鼠學習問題的應用 83
421 運行程序 83
422 說明程序 85
423 如何保存和讀取智能體模型 91
43 基于OpenAI Gym的倒立擺 91
431 運行程序 91
432 說明程序 92
44 基于OpenAI Gym的太空侵略者 97
45 基于OpenAI Gym的顛球 99
451 運行程序 101
452 說明程序 102
46 對戰(zhàn)游戲 109
461 黑白棋 109
462 訓練方法 111
463 變更盤面 121
464 黑白棋實體 121
465 如何與人類對戰(zhàn) 123
466 卷積神經(jīng)網(wǎng)絡的應用 127
47 使用物理引擎進行模擬 128
471 物理引擎 129
472 運行程序 130
473 說明程序 131
48 物理引擎在顛球問題中的應用 132
49 物理引擎在倒立擺問題中的應用 140
410 物理引擎在機械臂問題中的應用 144
411 使用其他深度強化學習方法 151
4111 深度強化學習的類型 151
4112 將訓練方法更改為DDQN 153
4113 將訓練方法更改為PER-DQN 153
4114 將訓練方法更改為DDPG 153
4115 將訓練方法更改為A3C 155
第5章 實際環(huán)境中的應用 157
51 使用攝像機觀察環(huán)境(MNIST) 157
511 攝像機設置 158
512 通過卷積神經(jīng)網(wǎng)絡對攝像機圖像進行分類 160
513 使用圖像大小為28×28的手寫數(shù)字進行訓練 163
52 實際環(huán)境中的老鼠學習問題 164
53 使用Raspberry Pi處理老鼠學習問題 168
531 環(huán)境構建 169
532 以輸入輸出為重點的簡化 169
533 使用攝像機測量環(huán)境 176
54 使用Arduino + PC處理老鼠學習問題 181
541 環(huán)境構建 182
542 以輸入輸出為重點的簡化 185
543 使用攝像機測量環(huán)境 193
55 使用Raspberry Pi + Arduino處理老鼠學習問題 197
56 結語 201
附錄 202

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) www.leeflamesbasketballcamps.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號