機器翻譯是由計算機自動將一種自然語言翻譯成另一種自然語言的過程。隨著語言資源規(guī)模的持續(xù)增長和計算機硬件技術的大幅提高,數(shù)據(jù)驅動的機器翻譯方法逐漸獲得了研究者的青睞,翻譯效果取得了顯著的提升。本書梳理了機器翻譯的基礎理論和研究進展,指出了數(shù)據(jù)驅動的機器翻譯方法所面臨的問題,詳細介紹了具有代表性的改進方法。這些方法既包括對句法語義、詞形和零代詞、翻譯記憶等先驗知識的建模及融合,也涉及深度神經網絡、無監(jiān)督樹學習、生成對抗訓練、聯(lián)合學習、因果推斷等前沿技術,可供希望深入了解機器翻譯研究進展的讀者參考。本書的 后對數(shù)據(jù)驅動的機器翻譯技術進行了總結,并對未來的研究方向進行了展望。