當前位置:法律諮詢服務網 - 企業資訊 - 4種Python爬蟲(3. 微信小程序,如,超級猩猩)

4種Python爬蟲(3. 微信小程序,如,超級猩猩)

目錄:

1. PC網頁爬蟲

2. H5網頁爬蟲

3. 微信小程序爬蟲

4. 手機APP爬蟲

爬取超級猩猩的課表,該平臺僅提供了微信小程序這壹個途徑,前面兩種針對html網頁的爬取方式都不再適用。

采用抓包分析是我們制定方案的第壹步。

我用的Mac電腦,fiddler只有壹個簡化版,所以另找了Charles這個類似的軟件。啟動Charles的代理,在手機WIFI中設置好對應的代理就可以開抓了。但是,抓到的https包的內容都是亂碼,咋辦?

Charles中提供了ssl證書,在手機端安裝證書即可。推薦使用iPhone,直接安裝描述文件即可。Android手機必須使用系統版本在7.0以下的才行,7.0以上還需要反編譯什麽的,太麻煩了。

很容易的定位到了超級猩猩微信小程序載入課表的後臺接口。拿這個URL在瀏覽器裏訪問試試,直接返回了json結果!超級猩猩很友好!

提取對應的URL,放到瀏覽器中驗證,也可以支持返回json包,剩下就是分析壹下這個json的數據結構,按照需要的方式導出了。

直接通過接口的爬取效率非常高,幾秒鐘就拉取了全國各個門店的排課,相當舒心。(下圖的錄屏沒有進行加速)

最後壹個挑戰就是對只有Android/iOS的APP端應用數據的爬取。請看下壹章

請點擊: <下壹頁>

  • 上一篇:稀土行業龍頭股票有哪些
  • 下一篇:項目虧損原因分析報告
  • copyright 2024法律諮詢服務網