『壹』 什麼是爬蟲
爬蟲通俗來說就是抓取網頁數據,比如說大家都喜歡的圖片呀、小視頻呀,還有電子書、文字評論、商品詳情等等。
只要網頁上有的,都可以通過爬蟲爬取下來。
一般而言,python爬蟲需要以下幾步:
找到需要爬取內容的網頁URL
打開該網頁的檢查頁面(即查看HTML代碼,按F12快捷鍵即可進入)
在HTML代碼中找到你要提取的數據
寫python代碼進行網頁請求、解析
存儲數據
當然會python是前提,對於小白來說自學也不是件容易的事,需要花相當的時間去適應python的語法邏輯,而且要堅持親手敲代碼,不斷練習。
如果對自己沒有自信,也可以考慮看編程課程,跟著老師的節奏去學習,能比較快地掌握python語法體系,也能得到充分的案例練習。