首页 > 下载中心  > 网络工具  > 搜索工具  > 文件下载

横瓜全文搜索引擎 3.1

评价:
简介:
操作系统: NT/Win2000/XP/2003/Vista
文件类型: 搜索引擎
授权方式: 免费软件
语        言: 简体中文
版        本:
整理日期: 2009-03-18
联系信息:
下载统计: 305次

软件介绍:
横瓜全文搜索引擎,是基于Windows平台的全文搜索引擎(不提供网络蜘蛛),最大容量150万网页。对于150万网页规模的数据,可在30分钟内完成所有架构工作。横瓜全文搜索引擎分词速度约为2500万字/分钟,约占99.984%的关键词检索时间小于0.001秒。横瓜全文搜索引擎的PC硬件配置,仅需要700M内存、空闲硬盘10G、文件系统NTFS。横瓜全文搜索引擎采用横瓜分布式Map数据库技术、分词索引技术、最大左匹配切词技术、倒排技术、MD5摘要信息抽取技术、新词智能识别技术、硬盘整理加速技术、疑似垂直搜索技术、中文海量词典技术、横瓜HTTP检索服务器web-search缓存技术、HTM转换TXT技术等。
安装说明:
1、第一次使用软件前,先执行Setup.exe。程序add.exe、body.exe、title.exe为系统内核,勿动!
2、架构搜索步骤:须依次单击websearch.exe程序中的按钮"数据清零"、"导入记录"、"标题分词"、"正文分词"、"WWW查询"。
3、数据清零。建立新的搜索之前,须单击"数据清零"按钮来清除旧数据和旧索引。
4、websearch.exe可管理记录、索引、分词等,若要执行HTTP检索查询服务,websearch.exe须挂机。
5、数据导入。在web目录下,有Access格式的输入接口文件web.mdb(字段id取值越小排名越靠前)。将待处理数据输入到web.mdb后,单击“导入记录”按钮,web.mdb中的记录被导入到web.dat。在检索时直接从web.dat取记录,web.mdb仅起接口作用,导入完成后可自愿删留。对于增量记录,可允许从web.mdb中多次导入新记录,但新增量的记录,检索排名靠后,增量导入后,须再依次单击按钮"标题分词"、"正文分词"后,才能被检索到。
6、websearch.exe挂机后,从IE中输入"http://IP地址或域名:7777/"可检索查询。在www目录下,存有搜索引擎的主页和LOGO,客户可以根据个性需要自行修改。
7、使用本软件,必须开放端口:7000、7001、70002、70003、70004、7777、7778
8、本软件使用的基础词典已经用MD5加密封装,用户可以在dic.txt中自由添加新词,新词被添加到dic.txt后,被检索的几率变大。若不添加新词,也可以被检索到,只是几率稍小些。
9、web目录中web.mdb的记录是赠送测试用的,可以将待处理数据输入“模板web.mdb”替换该文件。
10、不得将本软件用于赢利目的、销售他人、非法用途等,否则将会被追究法律责任。

特别提示:
1、本站所有软件及资料皆从互联网收集整理而来,仅供个人试用、教学和学习交流之用,请勿用于商业目的。
2、如需购买正版软件,请向软件著作者或公司联系。
3、若有侵犯您的软件版权,请告知,以便我们修正和撤消。
下载地址:
本网站不再提供该文件下载
文件大小:7.62 M
首页 | 国际工业自动化 | 造车网 | 汉南国译 | 用户注册 | 下载中心 | 主题信息 | 免责声明 | 关于我们
北京市朝阳区广渠门外大街8号优士阁B座1703  电话: 010-58612588 传真: 010-58612665
Copyright ©1997-2024 blueai.net.cn All rights reserved