這是一本講解NPU硬件架構設計與技術實現(xiàn)的著作。作者將自己在CPU、GPU和NPU領域15年的軟硬件工作經驗融會貫通,將四代NPU架構設計經驗融為一體,將端側和云側NPU架構合二為一,總結并提煉出本書內容。本書主要討論神經網絡硬件層面,尤其是芯片設計層面的內容,主要包含神經網絡的分析、神經網絡加速器的設計以及具體實現(xiàn)技術。通過閱讀本書,讀者可以深入了解主流的神經網絡結構,掌握如何從零開始設計一個能用、好用的產品級加速器。通過閱讀本書,你將:?透徹理解與深度學習相關的機器學習算法及其實現(xiàn)?學會主流圖像處理領域神經網絡的結構?掌握加速器運算子系統(tǒng)和存儲子系統(tǒng)的設計?摸清加速器設計中遇到的具體問題及其解決方法?了解NPU架構需要考慮的控制通路和數(shù)據通路