注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網(wǎng)絡人工智能深度學習視頻理解

深度學習視頻理解

深度學習視頻理解

定 價:¥128.00

作 者: 張皓 著
出版社: 電子工業(yè)出版社
叢編項:
標 簽: 暫缺

ISBN: 9787121419805 出版時間: 2021-10-01 包裝: 平裝
開本: 16開 頁數(shù): 字數(shù):  

內容簡介

  視頻理解是計算機視覺和深度學習的一個重要分支。本書對視頻理解的3個重要領域進行介紹,對于每個領域,本書不僅解釋了相關算法的原理,還梳理了算法演進的脈絡。全書共分6章,第1章簡要介紹視頻行業(yè)的發(fā)展歷程;第2章回顧經(jīng)典圖像分類模型和RNN;第3章和第4章介紹動作識別的重要算法;第5章介紹時序動作定位的重要算法;第6章介紹視頻Embedding的重要算法。最后總結了常用的一些視頻處理工具。 本書既適合高等院校人工智能相關專業(yè)的本科生和研究生閱讀,也可供視頻理解、推薦系統(tǒng)、搜索引擎和計算廣告等領域的研究人員和從業(yè)者參考。

作者簡介

  張皓,畢業(yè)于南京大學計算機系周志華教授領導的機器學習與數(shù)據(jù)挖掘研究所(LAMDA),導師為吳建鑫教授,研究方向為深度學習和計算機視覺,曾獲國家獎學金、江蘇省三好學生等榮譽。發(fā)表論文累計被引超過 190 次,合譯《模式識別》一書,曾獲 2016 年ECCV視頻表象性格分析競賽世界冠軍。 現(xiàn)任騰訊在線視頻研究員,專注于騰訊視頻等場景下的相關視頻理解任務。曾任騰訊優(yōu)圖實驗室研究員,為“微信看一看”等場景提供相關視頻理解能力。 知乎號“張皓”,擔任多個自媒體作者或專欄作者。

圖書目錄

第1章 緒論 1
1.1 引言 1
1.2 本書內容 5
1.3 本章小結 15
第2章 經(jīng)典網(wǎng)絡結構回顧 16
2.1 經(jīng)典圖像分類網(wǎng)絡 16
2.1.1 LetNet-5 16
2.1.2 AlexNet 18
2.1.3 VGGNet 22
2.1.4 GoogLeNet 24
2.1.5 Inception V2/V3 27
2.1.6 ResNet 28
2.1.7 preResNet 31
2.1.8 WRN 32
2.1.9 隨機深度網(wǎng)絡 33
2.1.10 DenseNet 35
2.1.11 ResNeXt 36
2.1.12 SENet 39
2.1.13 MobileNet 41
2.1.14 MobileNet V2/V3 44
2.1.15 ShuffleNet 46
2.1.16 ShuffleNet V2 49
2.2 RNN、LSTM和GRU 51
第3章 基于2D卷積的動作識別 62
3.1 平均匯合 62
3.2 NetVLAD和NeXtVLAD 64
3.3 利用RNN融合各幀特征 77
3.4 利用3D卷積融合各幀特征 81
3.5 雙流法 87
3.6 時序稀疏采樣 95
3.7 利用iDT軌跡 104
第4章 基于3D卷積的動作識別 110
4.1 3D卷積基礎網(wǎng)絡結構 110
4.2 I3D 118
4.4 TSM 135
4.5 3D卷積 + RNN 137
4.6 ARTNet 139
4.7 Non-Local 141
4.8 SlowFast 148
4.9 3D卷積神經(jīng)網(wǎng)絡超參數(shù)設計 152
第5章 時序動作定位 159
5.1 基于滑動窗的算法 160
5.2 基于候選時序區(qū)間的算法 171
5.3 自底向上的時序動作定位算法 183
5.4 對時序結構信息建模的算法 197
5.5 逐幀預測的算法 202
5.6 單階段算法 208
第6章 視頻Embedding 219
6.1 基于視頻內容的無監(jiān)督 Embedding 220
6.2 Word2Vec 229
6.2.1 CBOW和Skip-Gram 229
6.2.2 分層 Softmax 234
6.2.3 負采樣 239
6.3 Item2Vec 247
6.3.1 Item2Vec 基本形式 247
6.3.2 Item2Vec的改進 249
6.4 基于圖的隨機游走 252
6.5 結合一二階相似度 257
6.6 基于圖的鄰居結點 265
6.7 基于多種信息學習視頻Embedding 274
附錄A 視頻處理常用工具 281
參考文獻 296

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) www.leeflamesbasketballcamps.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號