當前位置：首頁 > IT面試題 > Python面試題 > 正文

學習爬蟲需要掌握哪些庫

來源：千鋒教育

發布時間：2022-09-26 14:51:00

　　學習爬蟲需要掌握哪些庫呢?

　　通用：

　　1.urllib -網絡庫(stdlib)。

　　2.requests -網絡庫。

　　3.grab – 網絡庫(基于pycurl)。

　　4.pycurl – 網絡庫(綁定libcurl)。

　　5.urllib3 – Python HTTP庫，安全連接池、支持文件post、可用性高。

　　6.httplib2 – 網絡庫。

　　7.RoboBrowser – 一個簡單的、極具Python風格的Python庫，無需獨立的瀏覽器即可瀏覽網頁。

　　8.MechanicalSoup -一個與網站自動交互Python庫。

　　9.mechanize -有狀態、可編程的Web瀏覽庫。

　　10.socket – 底層網絡接口(stdlib)。

　　11.Unirest for Python – Unirest是一套可用于多種語言的輕量級的HTTP庫。

　　12.hyper – Python的HTTP/2客戶端。

　　13.PySocks – SocksiPy更新并積極維護的版本，包括錯誤修復和一些其他的特征。作為socket模塊的直接替換。

　　網絡爬蟲框架

　　功能齊全的爬蟲

　　grab – 網絡爬蟲框架(基于pycurl/multicur)。

　　scrapy – 網絡爬蟲框架(基于twisted)，不支持Python3。

　　pyspider – 一個強大的爬蟲系統。

　　cola – 一個分布式爬蟲框架。

　　其他

　　portia – 基于Scrapy的可視化爬蟲。

　　restkit – Python的HTTP資源工具包。它可以讓你輕松地訪問HTTP資源，并圍繞它建立的對象。

　　demiurge – 基于PyQuery的爬蟲微框架。

　　HTML/XML解析器

　　1.通用

　　lxml – C語言編寫高效HTML/ XML處理庫。支持XPath。

　　cssselect – 解析DOM樹和CSS選擇器。

　　pyquery – 解析DOM樹和jQuery選擇器。

　　BeautifulSoup – 低效HTML/ XML處理庫，純Python實現。

　　html5lib – 根據WHATWG規范生成HTML/ XML文檔的DOM。該規范被用在現在所有的瀏覽器上。

　　feedparser – 解析RSS/ATOM feeds。

　　MarkupSafe – 為XML/HTML/XHTML提供了安全轉義的字符串。

　　xmltodict – 一個可以讓你在處理XML時感覺像在處理JSON一樣的Python模塊。

　　xhtml2pdf – 將HTML/CSS轉換為PDF。

　　untangle – 輕松實現將XML文件轉換為Python對象。

　　2.清理

　　Bleach – 清理HTML(需要html5lib)。

　　sanitize – 為混亂的數據世界帶來清明。

聲明：本站稿件版權均屬千鋒教育所有，未經許可不得擅自轉載。

python庫之文本處理

學習資源站

免費全套視頻教程
企業實戰項目源碼
大廠筆試真題題庫
行業前瞻發展趨勢

千鋒動態

更多 >

千鋒教育喜獲學科網“2023年度新銳突破獎”，展現卓越課程實力千鋒教育重磅發布鴻蒙生態應用開發學習路線圖千鋒教育HarmonyOS極速入門訓練營圓滿結營！關于舉辦2024年技術賦能教學—全國高校“雙師型”IT骨干教師寒假高級研修班的通知 “我的青春在千鋒——2023“千鋒杯”短視頻大賽“獲獎名單公布千鋒正式成立鴻蒙生態教研院，強力助推學員就業！千鋒鄭州分校2023年冬季IT專場招聘會高效促就業！千鋒教育2023冬季招聘會安排官宣 | 千鋒教育重磅推出鴻蒙生態開發就業班千鋒教育杭州校區助推職業教育發展,許然校長寄語未來

色噜噜狠狠成人网_好男人社区神马在线观看www_亚洲国产成人精品女人久久久_日本特黄aaaaaaa大片

學習爬蟲需要掌握哪些庫

學習資源站

千鋒動態

最新問答資訊

- 千鋒學習資源站 -

Hello ~

申請線下免費試學

關于千鋒

學習資源

服務指南

求職招聘

千鋒學習站
免費領取專屬學習資料

千鋒手機站
掃一掃get“薪”技能

色噜噜狠狠成人网_好男人社区神马在线观看www_亚洲国产成人精品女人久久久_日本特黄aaaaaaa大片

學習爬蟲需要掌握哪些庫

學習資源站

千鋒動態

最新問答資訊

- 千鋒學習資源站 -

Hello ~

申請線下免費試學

關于千鋒

學習資源

服務指南

求職招聘

千鋒學習站 免費領取專屬學習資料

千鋒手機站 掃一掃get“薪”技能

千鋒學習站
免費領取專屬學習資料

千鋒手機站
掃一掃get“薪”技能