发布网友 发布时间:2024-10-12 02:43
共1个回答
热心网友 时间:2024-10-20 11:51
Sphider是一个轻量级的PHP开发的Web蜘蛛和搜索引擎,适用于添加网站搜索功能,数据库采用MySQL,因其小巧、安装简便,已被数千网站采用。
RiSearch PHP是一个高效搜索引擎,特别适合中小型网站,搜索速度快,能在1秒内搜索大量页面。它采用索引方式工作,先构建索引数据库,通过反向索引算法提供快速搜索,排除特定关键词。
PhpDig是一个PHP开发的Web爬虫和搜索引擎,能索引动态和静态页面,支持PDF、Word等文档,适用于专业性强的垂直搜索引擎构建。
OpenWebSpider是一个多线程的开源Web爬虫,拥有多种实用功能,适用于需要广泛搜索的场合。
Egothor是Java编写的高效全文本搜索引擎,跨平台性强,可作为搜索引擎或应用中的全文检索工具。
Nutch是一个开源的Java搜索引擎工具包,提供全文搜索和Web爬虫所需的一切,支持自定义功能。
Apache Lucene是一个Java全文搜索引擎,它通过索引文件快速提升搜索效率,允许用户定制功能。
Oxyus是一个纯Java的Web搜索引擎,提供Java软件的全文搜索功能。
BDDBot是一个简单易用的搜索引擎,爬行特定URL并保存结果,支持Web服务器集成。
Zilverline是一个搜索本地或intranet内容的搜索引擎,支持多种文档格式,包括中文。
XQEngine专注于XML文档的全文搜索,使用XQuery查询语言。
MG4J用于压缩大量文档的全文索引,提供高效的内插编码技术。
JXTA Search是一个分布式搜索系统,适用于点对点网络和网站。
YaCy是一个基于P2P的分布式Web搜索引擎,同时具备HTTP缓存功能。
Red-Piranha是一个具有学习能力的搜索引擎,适用于个人、企业或Web应用的搜索需求。
LIUS基于Lucene的索引框架,支持多种文件格式的索引,特别适合数据库和ORM开发。
Apache Solr是一个基于Java的高性能全文搜索服务器,提供Web管理界面和强大数据配置。
Paoding是用于Lucene的中文分词组件,填补了国内开源中文分词的空白。
Carrot2是一款能自动分类搜索结果的引擎,支持多种搜索源和查询方式。
Regain是一个专为本地文档和文件设计的桌面搜索引擎,支持Lucene查询,提供URL重写和文件HTTP桥接。