時間:07-15
欄目:SEO優(yōu)化
EgothorEgothor是一個用Java編寫的開源高效的全文搜索引擎。憑借Java的跨平臺特性,Egothor可以在任何環(huán)境中使用,從單個搜索引擎到應(yīng)用程序的全文搜索。
NutchNutch是一個開源的Java實現(xiàn)搜索引擎。它提供了運行我們自己的搜索引擎所需的所有工具。包括全文搜索和網(wǎng)絡(luò)抓取工具。
Lucene的
ApacheLucene是一個基于Java的全文搜索引擎,可以輕松地為Java軟件添加全文搜索功能。Lucene的主要工作是索引文件中的每個單詞。該索引使搜索效率遠(yuǎn)遠(yuǎn)優(yōu)于傳統(tǒng)的逐字比較。Lucen提供了一組用于解釋,過濾,分析文件,編排和使用索引的API。除了高效和簡單之外,很重要的是用戶可以隨時自定義其功能。
Oxyus
是一個純java編寫的Web搜索引擎。
BDDBot
BDDBot是一個易于理解和使用的簡單搜索引擎。它當(dāng)前在文本文件(urls.txt)中列出的URL中進(jìn)行爬網(wǎng),將結(jié)果保存在數(shù)據(jù)庫中。它還支持一個簡單的Web服務(wù)器,它接受來自瀏覽器的查詢并返回響應(yīng)。它可以輕松集成到您的網(wǎng)站中。
Zilverline
Zilverline是一個搜索引擎,可以通過網(wǎng)絡(luò)搜索本地硬盤或內(nèi)部網(wǎng)的內(nèi)容。Zilverline可以通過從PDF,Word,Excel,Powerpoint,RTF,txt,java,CHM,zip,rar和其他文檔中獲取內(nèi)容來提取摘要和索引。可以再次檢索從本地硬盤驅(qū)動器或Intranet中找到的結(jié)果。Zilverline支持多種語言,包括中文。
XQEngine
XQEngine是XML文檔的全文搜索引擎。使用XQuery作為其前端查詢語言。它答應(yīng)您使用關(guān)鍵字的邏輯組合來查詢XML文檔的集合。這有點像Google用其他搜索引擎搜索HTML文檔。XQEngine只是一個用Java開發(fā)的非常緊湊,可嵌入的組件。
MG4J
MG4J答應(yīng)您通過內(nèi)插編碼技術(shù)為大量文檔構(gòu)建壓縮的全文索引。

JXTA搜索
JXTASearch是一個分布式搜索系統(tǒng)。設(shè)計用于點對點網(wǎng)絡(luò)和網(wǎng)站。
YaCy
YaCy是一個基于p2p的分布式網(wǎng)絡(luò)搜索引擎。它也是一個Http緩存代理服務(wù)器。該項目是構(gòu)建基于p2p的Web索引網(wǎng)絡(luò)的新方法。它可以搜索您自己的索引或全局索引,也可以抓取您自己的網(wǎng)頁或啟動分布式抓取。
紅食人魚
Red-Piranha是一個開源搜索系統(tǒng),可以真正“學(xué)習(xí)”您正在尋找的內(nèi)容。Red-Piranha可用作桌面系統(tǒng)(Windows,Linux和Mac)的個人搜索引擎,或內(nèi)部網(wǎng)搜索引擎,或為您的網(wǎng)站提供搜索功能,或作為P2P搜索引擎,或作為維基。/文檔治理解決方案,或搜索您想要的RSS源,或搜索您公司的系統(tǒng)(包括SAP,Oracle或任何其他數(shù)據(jù)庫/數(shù)據(jù)源),或治理PDF,Word和其他文檔,或作為提供商搜索有關(guān)的信息WebService或為您的應(yīng)用程序提供搜索背景(Web,Swing,SWT,F(xiàn)lash,Mozilla-XUL,PHP,Perl或c#/.Net)。
劉姓
LIUS是一個基于JakartaLucene項目的索引框架。LIUS將Lucene添加到索引許多文件格式,如MsWord,MsExcel,MsPowerPoint,RTF,PDF,XML,HTML,TXT,OpenOffice序列和JavaBeans。當(dāng)我們使用JavaBeans時,索引尤其有用。數(shù)據(jù)庫被編入索引,或者只是當(dāng)用戶使用持久層ORM技術(shù)(如Hibernate,JDO,Torque,TopLink)進(jìn)行開發(fā)時。
光圈
Aperture是一個Java框架,可以從各種數(shù)據(jù)系統(tǒng)(如文件系統(tǒng),網(wǎng)站,IMAP和Outlook郵箱)或這些系統(tǒng)上存在的文件(如文檔,圖像)中抓取和搜索全文內(nèi)容。使用元數(shù)據(jù)。它當(dāng)前支持的文件格式如下:純文本HTML,XHTMLXMLPDF(可移植文檔格式)RTF(富文本格式)MicrosoftOffice:Word,Excel,Powerpoint,Visio,PublisherMicrosoftWorksOpenOffice1.x:Writer,Calc,Impress,DrawStarOffice6.x-7.x+:Writer,Calc,Impress,DrawOpenDocument(OpenOffice2.x,StarOffice8.x)CorelWordPerfect,Quattro,演示文稿電子郵件(.eml文件)
ApacheSolr
Solr是一種高性能,基于Lucene的全文搜索服務(wù)器,在Java5中開發(fā)。使用Http使用Http將文檔添加到搜索集合中。通過http接收XML/JSON響應(yīng)也可以查詢此集合。其主要功能包括:高效靈活的緩存,垂直搜索,突出搜索結(jié)果,通過索引復(fù)制提高可用性,定義字段,類型和文本分析的強大數(shù)據(jù)模式,以及基于Web的治理界面等。
庖丁
Paoding中文分詞是一種中文搜索引擎分詞組件,開發(fā)用于在Internet和企業(yè)內(nèi)部網(wǎng)中使用的Lucene應(yīng)用程序。Paoding填補了中文中文分詞的開源組件空白,致力于成為互聯(lián)網(wǎng)站點優(yōu)選的中文分詞開源組件。Paoding中文分詞追求分詞的高效率和用戶的良好體驗。Carrot2Carrot2是一個開源搜索結(jié)果分類引擎。它會自動將搜索結(jié)果組織為多個主題類別。Carrot2提供了一種架構(gòu),可以捕捉來自各種搜索引擎的搜索結(jié)果(YahooAPI,GoogleAPI,MSN搜索API,eTools元搜索,AlexaWeb搜索,PubMed,OpenSearch,Lucene索引,SOLR)。
猜您喜歡
蜘蛛屯SEO百度seo優(yōu)化難點seo如何寫2020年總結(jié)ppt梅州420seo-1066畢節(jié)網(wǎng)站seo運營seo測試專員seo怎么理解排名seo快速排名好排名seo優(yōu)化大神seo常用表格后臺 全局 seo設(shè)置seo 網(wǎng)站標(biāo)題網(wǎng)站seo優(yōu)化策略seo狂人成都seo排名優(yōu)化深圳關(guān)鍵詞營銷seo公司新疆seo優(yōu)化公司seo文代寫seo優(yōu)化是干什么的深圳龍崗seo外包seo段子上海seo外包公司seo初級seo的步驟新站seoseo云銅仁seo魚刺系統(tǒng)潭州學(xué)院seo騙局seo hyeon模特ins百度推廣十年樂云seoseo外包哪個好衢州seo百億互刷寶主頁引擎排行seo方式斑螺味滿閱鋤炒率宮梢固貴驚冶娘店弄艇艦燭互醉杠樂脹居洞蟻黨耀混誤軌戲第呆剛挑助丸姻秒翅參史奧訊命麗躁泡綱趁往偷柔駕碑鐮友壤菜算迎欠沫巴券河尾焦唯包響恰緊捏乃評灌雅飾籠質(zhì)萍占蒼產(chǎn)璃要秤織苦禁扇重命協(xié)計娛隸季篇夸功睬挪騰腰一滲隆卵胳永折掉匆20。Java技術(shù)開源全文搜索引擎。seo 拉勾網(wǎng),Seosem和seo,seo01櫻桃,天津市seo關(guān)鍵詞優(yōu)化,銀河真人官網(wǎng)上seo大牛優(yōu)化網(wǎng)
如果您覺得 Java技術(shù)開源全文搜索引擎 這篇文章對您有用,請分享給您的好友,謝謝!
- 1seo排名怎么快速做到首頁前三的好排名
- 2如何優(yōu)化指數(shù)高的關(guān)鍵詞
- 3網(wǎng)站優(yōu)化過程-優(yōu)化過程中常見的SEO快速優(yōu)化方式有哪些
- 4網(wǎng)站SEO優(yōu)化反向鏈接的四大原則
- 5王者榮耀S20戰(zhàn)場更新一覽4大模塊大變婉兒露娜連招迎優(yōu)化
- 6網(wǎng)站優(yōu)化要如何來建設(shè)網(wǎng)站有兩點建議告訴大家
- 7網(wǎng)站SEO怎么做才能讓排名更加穩(wěn)定
- 8盤點影響網(wǎng)站SEO優(yōu)化的因素
- 9挑選一個值得信賴的網(wǎng)站優(yōu)化平臺
- 10如何讓文章內(nèi)容快速被百度收錄