隨著信息技術和各類互聯(lián)網平臺的快速發(fā)展,圖像、視頻、文本等多模態(tài)數(shù)據(jù)呈現(xiàn)爆發(fā)式的增長,多模態(tài)數(shù)據(jù)已經成為大數(shù)據(jù)的主要呈現(xiàn)形式,針對海量多模態(tài)數(shù)據(jù)進行分析和處理、從多個模態(tài)中獲取知識和價值的現(xiàn)實需求越來越高。本書詳細介紹一系列前沿的多模態(tài)數(shù)據(jù)融合與挖掘方法,從多模態(tài)聚類、多模態(tài)分類等層面對多模態(tài)融合與挖掘相關進展進行介紹,具體介紹基于深度多樣圖對比學習的多模態(tài)聚類方法、基于聚類引導的自適應結構增強網絡的多模態(tài)聚類方法、基于深度子空間學習的半監(jiān)督多模態(tài)數(shù)據(jù)語義標注方法以及基于深度受限低秩子空間學習的多模態(tài)半監(jiān)督分類方法。在不同數(shù)據(jù)集上的實驗結果驗證了所介紹方法的有效性。