作者:邱哲、符滔滔、王學松
譯者:胡嘉璽
出版社:上奇資訊
出版日期:2010年07月09日
語言:繁體中文 ISBN:9789862570708
書號:HB1014
定價:560元 75折價:420元
有看部落格的才有此優惠ㄛ
內容簡介
本書透過Lucene和Heritrix,講解目前搜尋引擎的構建方式,透過對應用程式介面和原始碼的分析,讓讀者了解搜尋引擎背後的架構過程,並且深入搜尋引擎的核心,認識搜尋引擎的高價值和實用性,進而開發出類似的搜尋引擎網站,提高自己的企業價值。
本書特色
結合理論與實務運用,除了介紹搜尋引擎系統外,也詳細說明開發過程。
提供完整實例,讀者可以依據自己的專案需求,稍微修改相關的內容,就可以應用在自己研發的實際項目當中。
針對開發時常遇到的問題進行深入探討,有效解決讀者困擾。
本書附光碟
本書搭配章節的範例檔
章節目錄
Ch01 搜尋引擎與資訊檢索
Ch02 Lucene入門實例
Ch03 索引的建立
Ch04 Lucene搜尋
Ch05 排序、過濾和分頁
Ch06 Lucene的分析器
Ch07 Word、Excel和PDF的處理
Ch08 Compass:封裝了Lucene的框架
Ch09 Lucene分散式
Ch10 無比強大的網路爬蟲Heritrix
Ch11 搜尋引擎綜合實例:準備篇
Ch12 搜尋引擎綜合實例:下載篇
Ch13 使用正則運算式與HTMLParser分析網頁
Ch14 網頁內容儲存與索引
Ch15 搜尋引擎綜合實例:互動篇
Ch16 搜尋引擎綜合實例:Web篇
附錄 Lucene 2.4更新內容
留言列表