123,123,123

內(nèi)容簡介

　　本書基于強化學的庫Chainer（Chainere）和AI模擬環(huán)境的OpenAI gym-不僅僅是軟件模擬-也詳述了使用RaspbbilryPi和ARduino的實際環(huán)境的應用。

作者簡介

暫缺《Python深度強化學習：基于Chainer和OpenAI Gym》作者簡介

圖書目錄

譯者序
前言
第1章　引言 1
11　深度強化學習可以做什么 1
12　本書的結構 4
13　框架：Chainer和ChainerRL 6
14　Python的運行檢查 6
15　Chainer的安裝 9
16　ChainerRL的安裝 12
17　模擬器：OpenAI Gym 14
第2章　深度學習 17
21　什么是深度學習 17
22　神經(jīng)網(wǎng)絡 18
23　基于Chainer的神經(jīng)網(wǎng)絡 21
231　Chainer與神經(jīng)網(wǎng)絡的對應 24
232　Chainer程序 25
233　參數(shù)設置 26
234　創(chuàng)建數(shù)據(jù) 27
235　定義神經(jīng)網(wǎng)絡 27
236　各種聲明 28
237　顯示訓練狀態(tài) 28
238　保存訓練狀態(tài) 31
239　執(zhí)行訓練 32
24　與其他神經(jīng)網(wǎng)絡的對應 32
241　感知器 32
242　5層神經(jīng)網(wǎng)絡（深度學習） 33
243　計算輸入中的1的數(shù)量 34
25　基于深度神經(jīng)網(wǎng)絡的手寫數(shù)字識別 35
251　手寫數(shù)字的輸入格式 36
252　深度神經(jīng)網(wǎng)絡的結構 39
253　8×8的手寫數(shù)字數(shù)據(jù) 41
26　基于卷積神經(jīng)網(wǎng)絡的手寫數(shù)字識別 43
261　卷積 45
262　激活函數(shù) 49
263　池化 49
264　執(zhí)行 50
27　一些技巧 53
271　讀取文件數(shù)據(jù) 54
272　使用訓練模型 55
273　重啟訓練 56
274　檢查權重 56
275　從文件中讀取手寫數(shù)字 57
第3章　強化學習 59
31　什么是強化學習 59
311　有監(jiān)督學習 60
312　無監(jiān)督學習 60
313　半監(jiān)督學習 60
32　強化學習原理 61
33　通過簡單的示例來學習 61
34　應用到Q學習問題中 63
341　狀態(tài) 63
342　行動 63
343　獎勵 63
344　Q值 64
35　使用Python進行訓練 67
351　運行程序 67
352　說明程序 69
36　基于OpenAI Gym的倒立擺 73
361　運行程序 73
362　說明程序 74
37　如何保存和加載Q值 79
第4章　深度強化學習 81
41　什么是深度強化學習 81
42　對于老鼠學習問題的應用 83
421　運行程序 83
422　說明程序 85
423　如何保存和讀取智能體模型 91
43　基于OpenAI Gym的倒立擺 91
431　運行程序 91
432　說明程序 92
44　基于OpenAI Gym的太空侵略者 97
45　基于OpenAI Gym的顛球 99
451　運行程序 101
452　說明程序 102
46　對戰(zhàn)游戲 109
461　黑白棋 109
462　訓練方法 111
463　變更盤面 121
464　黑白棋實體 121
465　如何與人類對戰(zhàn) 123
466　卷積神經(jīng)網(wǎng)絡的應用 127
47　使用物理引擎進行模擬 128
471　物理引擎 129
472　運行程序 130
473　說明程序 131
48　物理引擎在顛球問題中的應用 132
49　物理引擎在倒立擺問題中的應用 140
410　物理引擎在機械臂問題中的應用 144
411　使用其他深度強化學習方法 151
4111　深度強化學習的類型 151
4112　將訓練方法更改為DDQN 153
4113　將訓練方法更改為PER-DQN 153
4114　將訓練方法更改為DDPG 153
4115　將訓練方法更改為A3C 155
第5章　實際環(huán)境中的應用 157
51　使用攝像機觀察環(huán)境（MNIST） 157
511　攝像機設置 158
512　通過卷積神經(jīng)網(wǎng)絡對攝像機圖像進行分類 160
513　使用圖像大小為28×28的手寫數(shù)字進行訓練 163
52　實際環(huán)境中的老鼠學習問題 164
53　使用Raspberry Pi處理老鼠學習問題 168
531　環(huán)境構建 169
532　以輸入輸出為重點的簡化 169
533　使用攝像機測量環(huán)境 176
54　使用Arduino + PC處理老鼠學習問題 181
541　環(huán)境構建 182
542　以輸入輸出為重點的簡化 185
543　使用攝像機測量環(huán)境 193
55　使用Raspberry Pi + Arduino處理老鼠學習問題 197
56　結語 201
附錄 202

作　者：	[日] 牧野浩二（Koji Makino），[日] 西崎博光(Hiromitsu Nishizaki）著，申富饒，于僡譯
出版社：	機械工業(yè)出版社
叢編項：
標　簽：	暫缺

ISBN：	9787111692584	出版時間：	2021-12-01	包裝：	平裝
開本：	16開	頁數(shù)：	228	字數(shù)：

Python深度強化學習：基于Chainer和OpenAI Gym

購買這本書可以去

內(nèi)容簡介

作者簡介

圖書目錄

本目錄推薦

C++語言程序設計（基礎篇英文版…

HTML5+CSS3+JavaScript網(wǎng)頁制作…

C語言項目開發(fā)全程實錄（第3版）…

Java Web項目開發(fā)全程實錄（第2…

微服務下的領域驅動設計

高校數(shù)智轉型：WeMust理念、路徑…

C++語言程序設計（進階篇原書第…

圖解C++開發(fā)基礎（案例視頻版）…

每個人都需要一個AI Agent：從D…

Scratch少兒編程一本通