close

MP22124.png

出版社:博碩

出版日期:2021年3月31日

ISBN:9789864347438

書號:MP22124 

定價:450元     售價:338元

有看部落格的才有此優惠喔
也可到露天購買https://www.ruten.com.tw/item/show?22114585194417

      yahoo購買https://tw.bid.yahoo.com/item/101050184068
      
      蝦皮購買https://shopee.tw/product/120351604/8338096553/

      pchome 商店街購買https://seller.pcstore.com.tw/S140967598/C1439340397.htm
內容簡介

由淺入深了解Scrapy爬蟲框架,讓你從零開始建立高效率爬蟲!

◆自學網路爬蟲沒問題,手把手教學讓你無痛上手

◆完整的網路爬蟲和Scrapy知識,資料取得更輕鬆

◆學會各種套件和實作範例,讓你的爬蟲比別人更有效率

本書內容改編自第11屆iT邦幫忙鐵人賽的AI & Data組優選網路系列文章─《爬

蟲在手、資料我有 - 30 天 Scrapy 爬蟲實戰》。在AI的大時代中,「資料來源」

是基礎中的基礎,但網路上的資料豐富又繁雜,總不可能都靠人工來蒐集資料。

這時就是爬蟲出場的時候了!本書會帶讀者了解爬蟲的基礎知識,克服爬蟲

常見的問題,最後可以寫出維護成本低、執行效率高的爬蟲程式。

│四大重點│

★初學者必備的爬蟲指南,大大降低你的學習門檻

網路爬蟲妙計已為你爬取完成!從安裝環境、認識架構、資料儲存、

除錯到各類型 實作,本書將一步步帶你學會網路爬蟲。

★全面解析各種知識,爬蟲能力再提升

不只教你如何進行網路爬蟲,還要帶你深入Scrapy架構,並特別介紹NoSQL、

反反爬蟲。提升你的爬蟲技能,擁有越級打怪的神力。

★活用各種套件,打造高效率爬蟲

本書將手把手帶你活用各種套件,並從範例中學會撰寫精簡有效的程式碼,

讓你克服問題、達成任務,邁向高效率的資料取得之路。

★爬取資料生活化,就像抓寶一樣好玩有趣!

你會學到如何抓取PTT、 、新聞 、股市 資料,你想要的各種資料都能輕鬆取得。

│適用讀者│

◆對Python有基礎了解,想要學習爬蟲程式的初學者

◆為爬蟲維護和效能所苦,想要更進一步的開發人員

【下載範例程式檔案】

    本書範例檔下載網址:

    /rex-chien/ithome-scrapy

第1章 基礎知識

1.1 安裝開發環境

1.2 網路資料常見的格式

第2章 爬蟲基礎

2.1 剖析來源資料

2.2 從網路上取得資料

第3章 基礎實戰–蒐集iThelp 文章資料

3.1 列表頁

3.2 換頁

3.3 內文

3.4 文章資訊

3.5 回文

第4章 資料持久化

4.1 PostgreSQL

4.2 NoSQL

第5章 進階爬蟲

5.1 反反爬蟲

5.2 練習其他

第6章 Scrapy 基礎

6.1 Scrapy 架構

6.2 開發環境

6.3 實作Scrapy爬蟲

6.4 Scrapy的結構化資料-Item

6.5 在Scrapy中處理爬取結果-Item Pipe

6.6 在Scrapy中處理請求和回應-Downloader Middlewares

6.7 Scrapy的設定

6.8 在Scrapy中操作瀏覽器

6.9 Scrapy的日誌

6.10 蒐集Scrapy的統計資訊

6.11 發送

第7章 實戰Scrapy

7.1 Item Pipe 應用-儲存資料到 MongoDB

7.2 在程式中啟動Scrapy爬蟲

7.3 iThelp 的Scrapy 爬蟲

7.4 中央社新聞的Scrapy 爬蟲

7.5 PTT 的Scrapy 爬蟲

7.6 相同剖析邏輯的多個資料來源

arrow
arrow
    全站熱搜

    ETAITBOOK08 發表在 痞客邦 留言(0) 人氣()