全國(guó)服務(wù)熱線:400-080-4418
搜索引擎:
1. Lucene.
他是一個(gè)全文搜索引擎工具包,但只支持文本文件以及少量語(yǔ)種的索引;通過(guò)Lucene提供的接口,我們可以自己開(kāi)發(fā)具體語(yǔ)言的分詞器,針對(duì)具體文檔的文本解析器等;Lucene是索引數(shù)據(jù)結(jié)構(gòu)事實(shí)上的標(biāo)準(zhǔn);使用Java編寫(xiě),但是被轉(zhuǎn)化為多個(gè)庫(kù);
2. LIUS
是Lucene的加強(qiáng)版,Lucene Index Update and Search增加了對(duì)多種文檔的支持,增加了索引更新功能;
3. Egother
一個(gè)用于全文搜索引擎的Java庫(kù),能夠?yàn)榫唧w的應(yīng)用程序添加全文搜索功能;新的動(dòng)態(tài)算法提高索引的更新速度;支持平行的查詢(xún)方式,支持多種文檔
4.Xapian
使用C++編寫(xiě),提供綁定程序使得其他語(yǔ)言能夠方便地使用它;便于進(jìn)行二次開(kāi)發(fā)
5. Campass
在Lucene上實(shí)現(xiàn)的開(kāi)源搜索引擎架構(gòu),提供更加簡(jiǎn)潔的搜索引擎api增加了索引事務(wù)處理功能,與數(shù)據(jù)庫(kù)事務(wù)處理整合;更新時(shí)無(wú)需刪除原文檔,更加簡(jiǎn)介與高效;資源與搜索引擎之間采用映射機(jī)制;能與Hibernate,Spring等架構(gòu)進(jìn)行整合;開(kāi)源web搜索引擎系統(tǒng):
6. Nutch
基于Lucene構(gòu)建的web搜索引擎系統(tǒng),簡(jiǎn)潔;
7.YaCy
基于p2p的分布式開(kāi)源web搜索引擎系統(tǒng),使用java;其核心是分布在數(shù)百臺(tái)計(jì)算機(jī)上的被稱(chēng)為YaCy-peer的計(jì)算機(jī)程序,基于p2p網(wǎng)絡(luò)構(gòu)成了YaCy網(wǎng)絡(luò),整個(gè)網(wǎng)絡(luò)是一個(gè)分散的架構(gòu),所有的peer處于對(duì)等的地位,沒(méi)有統(tǒng)一的中心服務(wù)器,每個(gè)peer獨(dú)立地進(jìn)行互聯(lián)網(wǎng)的爬行抓取,分析及建立索引庫(kù),并通過(guò)p2p網(wǎng)絡(luò)進(jìn)行共享;而且每個(gè)peer又都是一個(gè)獨(dú)立的代理服務(wù)器,能夠?qū)Ρ緳C(jī)使用的網(wǎng)頁(yè)進(jìn)行索引,采用多種機(jī)制保護(hù)用戶(hù)的隱私,也通過(guò)本機(jī)運(yùn)行的web服務(wù)器進(jìn)行查詢(xún)和返回結(jié)果。桌面搜索引擎系統(tǒng)
8. regian
對(duì)中文支持跨平臺(tái)
9. Zilverline
以Lucene為基礎(chǔ),采用Spring為框架,中文名為銀錢(qián)查打引擎;使用Jave編寫(xiě)
Copyright 2008 © 上海網(wǎng)至普信息科技有限公司 All rights reserved. 滬ICP備11006570號(hào)-13
滬公網(wǎng)安備 31011402007386號(hào)