Page 1 輕輕鬆鬆寫網路爬蟲 鍾傑倫Page 2 範例專案 • https://github.com/chungchiehlun/WebSpider • site : express 與爬蟲程式寫成的網站服務 • spider : 爬蟲程式 https://github.com/chungchiehlun/WebSpiderPage 3 攻略⽬目標Page 4 爬蟲三步驟 • 分析網⾴頁 • 開始寫爬蟲程式 • 解析爬到的內容Page 5 https://www.vanilla-air.com/reservation/ibe/ibe/booking https://www.vanilla-air.com/reservation/ibe/ibe/bookingPage 6 chrome developer tools 觀察瀏覽器(client)與 server 如何溝通Page 7 Page 8 分析結論 • 需要拿到 cookie : GET request 取得 • 需要送出完整版表單: POST request 完整表單Page 9 認識 https.request var https = require(‘https’)Page 10 Start CodingPage 11 解析資料 • 把爬到的資料存下來: fs • 解析爬到的⽂文件: cheerioPage 12 快完成了Page 13 Finish !!Page 14 感謝您的聆聽 歡迎您⼀一起讓這專案變得更好