計算機語料庫是可以用計算機處理的電子文本庫,是提高自然語言處理系統(tǒng)性能的重要工具,又是新興的語料庫語言學的研究基礎,它對信息產業(yè)、詞典出版、外語教學與研究等領域的發(fā)展影響巨大,因而日益受到重視。本書介紹如何收集建立計算機語料庫和在諸多領域如何開發(fā)利用語料庫,可作為英語、計算機、中文信息處理、信息與網絡管理等專業(yè)的研究生和高年級本科生相關課程的教材,也可作為相關專業(yè)的研究生和畢業(yè)生選擇與確定科研與畢業(yè)論文題目的參考書,亦可供信息產業(yè)的技術和管理人員、高校相關專業(yè)的教師學習參考。本書前言前言在信息產業(yè)界、語言工程界、詞典出版界、外語教學與研究界,計算機語料庫的巨大作用正日益顯現(xiàn),越來越得到普遍重視。計算機語料庫是自然語言處理中統(tǒng)計方法的基礎?;谡Z料庫的統(tǒng)計方法,已經成為提高語言自動處理系統(tǒng)性能的突破口。計算機語料庫又是新興的語料庫語言學的研究基礎。近年來語料庫語言學發(fā)展十分迅速,碩果累累。本書講述什么是語料庫,什么是計算機語料庫,語料庫有哪些種類,目前世界上有哪些著名的語料庫,語料庫在歷史上起過什么作用,對語言學研究有何用途,對語言工業(yè)有何用途,對英語教學有何用途,如何設計和收集建立語料庫,如何開發(fā)利用語料庫,如何上網利用現(xiàn)成的語料庫。本書是為英語教育、英語語言學、計算機信息處理、信息與網絡管理等專業(yè)研究生編寫的教材,也可供擬報考以上專業(yè)研究生的高年級本科生、高校的中青年教師、從事或有志從事有關信息技術工作的人員參考。相關專業(yè)的碩士研究生與博士研究生,在選擇與確定畢業(yè)論文的題目和科研項目時,也可以參考本書。全書分為上下兩篇。上篇介紹計算機語料庫的建設與加工,下篇討論計算機語料庫的開發(fā)與應用。其中上篇第1章是對計算機語料庫的用途與意義的總述;第2~7章介紹語料庫的分類與發(fā)展;第8~13章討論語料庫的設計、建設、標注與加工方法。下篇第14章介紹開發(fā)語料庫的主要軟件,特別是索引軟件的功能;第15~24章探討語料庫在語言學、應用語言學、詞匯學、英語教學、辭書編撰等方面的應用;第25~27章介紹語料庫在自然語言處理方面的應用;第28章討論計算機語料庫的發(fā)展趨勢。附錄1~4供感興趣的讀者進一步參考,附錄5列出了一些有用的網址。書中的一些重點內容用黑體顯示,以方便讀者閱讀和查找相關內容。為了避免誤譯,書中的外國人名一般使用原文。本書的出版得到北京市高等教育精品教材建設立項項目和北京郵電大學語言學院配套經費的資助;書中引用了多位作者的研究成果,作者一并深表謝意。雖然積累素材近10年,但本書是作者在繁重教學之余擠時間寫成的,因時間倉促,書中難免有疏漏之處,衷心歡迎批評指正。