本書為國家職業(yè)教育大數據技術專業(yè)教學資源庫配套教材,也是高等職業(yè)教育計算機類課程新形態(tài)一體化教材。本書選擇Python 3作為編程環(huán)境,系統(tǒng)講述編寫爬蟲所需要的各種技術。包括HTTP的原理、urllib和request網絡請求庫的使用、正則表達式、XPath等數據提取規(guī)則的使用和爬蟲框架Scrapy的使用,并最后通過一個項目“招聘分析監(jiān)控系統(tǒng)——數據采集系統(tǒng)”將以上技術綜合運用起來。本書配套有微課視頻、教學設計、授課用PPT等數字化教學資源。與本書配套的數字課程“數據采集與預處理”已在“智慧職教”平臺(www.icve.com.cn)上線,學習者可以登錄平臺進行在線開放課程的學習,授課教師可以調用本課程構建符合自身教學特色的SPOC課程,詳見“智慧職教”服務指南。讀者可登錄平臺進行資源的學習及獲取,也可發(fā)郵件至編輯郵箱1548103297@qq.com獲取相關資源。本書緊跟信息社會發(fā)展動態(tài),內容新穎、結構清晰,具有很強的趣味性和實用性。本書可作為高等職業(yè)院校大數據技術專業(yè)及其他相關專業(yè)的教材,也可作為大數據技術愛好者的自學用書。